本系列使用機器學習中 Random Forest, XGBoost, 深度學習中 LSTM 分類 Amazon 評論,並比較各模型訓練的效果。本篇討論 XGBoost 的實作,以及評估模型的方法 Confusion Matrix、 ROC Curve 等及調參過程,並附上程式碼。

本系列概述:

Task 1: Text Preprocessing: NLTK + WordNet

運用 Python 處理Amazon評論的情感分析NLP — 資料前處理(Pre-Processing)

Task 2: Convert the reviews in TF-IDF score and Run multinomial Naive Bayes clas …

你有沒有想過,這個世界所有複雜的問題,都可以拆解理解為小到樂高的組成堆疊出來的。你有沒有想過,複雜的戰鬥機製作,也可以像軟體公司一樣 run Scrum?

Scrum 背景

1. 樂高組成的世界

你有沒有想過,這個世界所有複雜的問題,都可以拆解理解為小到樂高的組成堆疊出來的。你有沒有想過,複雜的戰鬥機製作,也可以像軟體公司一樣 run Scrum?

『我們想要一架可以飛五十年的飛機,但幾十年科技就會改變,戰鬥機設計也很難與時俱進,隨時更新,而戰鬥機的構造是緊密契合的,牽一髮而動全身。但若能打造一架可以模組化、可輕鬆拆卸組合的戰鬥機,設計成各 …

傳產製造在台灣數量非常多,也面臨二代接班,不只是原本的零組件和機械設備,又或是退換貨、財務、營銷等資料,手動去操作流程及手動輸入紀錄,若能自動化流程或是建立數位分析資料集,將能減少許多操作失誤,更能專注及輔佐在企業更重要的決策上。

ERP 定義及應用:

ERP 是企業資源規劃「Enterprise Resource Planning」(ERP) 的縮寫。企業營運需要各種流程與模塊,舉凡財務會計、訂單管理、人力資源、製造、銷貨庫存與客服等,將這些模塊全部整合在一個系統流程裡,並且讓每一個模塊彼此交流,數據共享並復用,建立一個龐大資料庫,將可提升數據化的管理思維,並提升整體企業營運效率。現今,ERP 已經大幅應用在零售業、製造業。

傳產製造在台灣數量非常多,也面臨二代接班,不只是原本的零組件和機械設備,又或是退換貨、財務、營銷等資料,手動去操作流程及手動輸入紀錄,若能自動化流程或是建立數位分析資料集,將能減少許多操作失誤,更能專注及輔佐在企業更重要的決策上。

ERP 功能特性:

ERP 能在不同的業務場景中靈活支持,也有不同廠商,拿全球最大的ERP 廠商,SAP 為例,它的特性功能有:

  1. 數位助理:讓員工專注於重要的事。
  2. AI 與機器學習:提升流程自動化。
  3. 預測分析:支援即時決策決定。

👉 特性:快速導入、持續創新、經濟實惠

為什麼需要 ERP:

ERP 可以標準化企業流程,不只是電子業需要有資料收集,就算是糕餅店大幅拓張規模時,在產線上,生產與製造用統一的標準化流程更可以把控品質。對於進銷存貨來講,也可以建議採購主管再議合約的最佳時機。

而對企業內部管理來說,透過資料的整合及分析,可以協助 PM 挖掘商業洞察,並在兼顧客戶需求與企業獲利下,做出更好的產品決策。

而如今,ERP 在大數據、雲端、AI 的發展下,更能成為企業數位轉型的核心智慧化平台,達到產業 AI 化。企業不需要在本地部署,直接讓資料同步到雲端,更好做彈性拓展和運算,也可減少本地部署的機台成本。

註解:AI 產業化:AI+,把 AI 當成產品和服務,AI 新創如 Appier。產業 AI 化: 基於原本的 domain,在上面賦能產業轉型。

而目前市面上最常見的 ERP 有 SAP,另外還有Oracle、Infor、Sage、智邦等針對不同行業面向的 ERP 系統。

Use Case: SQL Server 資料庫 - 為什麼要企業 ERP 要另外安裝資料庫?

以前用的 ERP 是檔案型的資料庫,營運資料存在一個或多個檔案中,資料與檔案本身就是應用程式的一部分,但這種資料存取方式有個缺點,是讀寫效能問題不好,資料讀寫越多,效能越不佳,例如銷貨單印完了,但是資料還在儲存中。

有了資料庫引擎,ERP 系統會透過資料庫引擎讀取資料庫的資料,並透過資料結構、資料索引、資料快取來提高讀取資料的效率,多台電腦再透過 TCP/IP 架構去連線到資料庫引擎去讀取想要的資料。

而用 SQL Server 舉例,就是下圖所示的資料庫引擎的一種。在一個資料庫主機裡可以有多個資料庫引擎,而每個資料庫引擎可以管理多個資料庫檔案。

本系列使用機器學習中 Random Forest, XGBoost, 深度學習中 LSTM 分類 Amazon 評論,並比較各模型訓練的效果。本篇討論 Random Forest 的實作,以及評估模型的方法Confusion Matrix、 ROC Curve等,並附上程式碼。

本系列概述:

Task 1:

Text Preprocessing: NLTK + WordNet(資料介紹及前處理-前前篇)

Task 2:

Convert the reviews in TF-IDF score and Run multinomial Naive Bayes classifier(資料向量轉換及 Baseline Model -前篇)

Task 3:

Select model : Random Forest, XGBoost, LSTM(本篇

【 Silicon Valley study trip-Berkeley SkyDeck 國際新創加速器參訪 】
SkyDeck 是矽谷非常強的 VC,許多創業者都搶著想進來,內部和一般孵化空間一樣,一般的辦公桌及茶水間,沒有太華麗的裝飾或是琳瑯滿目的食物 Bar,那究竟是為什麼那麼多創業者想擠在這裡 Pitch,又是什麼樣的創業團隊能打動投資人呢?

前言背景

對於創業團隊來說,有好的 idea 很重要,但在創業初期要如何打動投資人,產品和商業模式能否推廣到市場,”Pitch” 是身為創業家,幾乎最重要的事了。把故事說好、說的動聽的 Storytelling、Public Speaking 能力是對於創業家很重要的能力外,本篇也分享 Pitch 可以的準備方向及投資人最注重的三項要素。

2020 年的矽谷之旅,我聽了兩個成功入駐在 Berkeley SkyDeck 的台灣創業家分享,這裡是既是孵化空間(環境)又有 VC(風險投資人) ,而人脈當然是最大的吸引點,就數據層面來說,在 Skydeck 一天可以遇到 10 個以上投資人,而在正式的 Demo day 現場可以到 600 個 VC 在台下聽你 Pitch。

兩位創業家當初也是在百般激烈中突圍進來的,一位是台灣圖靈鏈創辦人,一位是台灣陽明醫學院畢業的生物科技創業家,當初有 1600 多公司申請,最後只有 30 多公司申請到入駐,當然我們也請教了入駐的條件,這邊整理如下說明。

攝於矽谷著名孵化器 Berkeley SkyDeck_2020.01

投資人看新創 Pitch 主要衡量三點

1.Market-潛力:
能定義清楚能吃下的市場規模、用戶規模有多大。

2.團隊裡 Full-time 的人的技術實力:
因為矽谷較重科技業,文創方向團隊會比較不被接受。
Skydeck 很看重一個團隊的技術長,其次是 BD,因為對創業團隊來說,核心技術能力及後續推動都是非常重要的。

3. Product :
產品及服務又分兩個面向:
B to B 型:看合作意向書(多少合作關係)
B to C 型:看用戶(用戶量)
這也意味著這些「尚未入駐」的新創團隊,就已經有一定規模的產品或服務,那麼只是空口說白話的產品就更不用想進 Skydeck 了,而目前矽谷創業圈最夯的產業是以醫療生技及科技為主。

這邊整理三招 Pitch tips:
🔑Why industry?
🔑Why you?
🔑Why now?

以上就是來自矽谷成功入駐頂級孵化器的團隊分享,而找投資人對於新創團隊是至關重要的環節,在 Pitch 前,不妨也先問問自己以下這些問題,當你準備好後,Pitch PPT 明確量化以下三點,這也是投資人最會圍繞著詢問的三個方向!

更多矽谷之旅的故事分享,可以看我的Silicon Valley Study trip 矽谷學習之旅申請與分享,包含了申請過程、拜訪 Google、Facebook、LinkedIn、Stanford 的課程分享。

《矽谷思維》這本書是由在矽谷網路科技業的工程師 Han 所撰寫,裡頭涉及的概念都是矽谷在打造產品時的實際應用案例,非常適合產品經理以及每一個想進網路科技從業者的一讀,本篇是我閱讀後,覺得非常精華的一些實例,總結並分享給大家。

《矽谷思維》書本封面

一. 用心理學打造產品:

1.【創造峰終值】

Ikea 是有名的用戶體驗良好的賣場環境,在疲憊的逛完整個商場後,出口處賣著便宜的熱狗和冰淇淋,想必一定虧本,但卻可以用這樣少少的成本,換來顧客很開心的旅程體驗,進而提升對於公司整體企業的友好觀感。

用著便宜的冰淇淋成本,換來顧客第二次回購的體驗,是不是很划算呢?在做產品的時候,產品經理最專注於用有限的資源做資源最大化的事,創造好產品體驗裡的「峰」值和「終」值,創造愉快的用戶體驗,用戶在不知不覺下就把錢花在 APP 上,這樣的巧思能為產品創造更長期的用戶黏性。

2.【選擇悖論】

曾經有一家超市做的實驗,賣果醬的選擇給顧客展示 24 種果醬時,更多人會停下來吃,但是把 24 種選擇減少到六種時,淨成交量提升了 6.6 倍。

一個網站和 APP 給用戶展示的選項設計也是一樣,一旦選擇太多用戶會考慮的情況就越多,而放棄的選擇率就會越高。

試著回想你在網路上選擇產品或服務的購買方案,選項若是五花八門,你是否做不出選擇,但若今天選項減少到三種,是否輕易做選擇多了?這就是選擇悖論。

3.【對比效應】

加入一個無用的選項,幫助用戶更開心快樂的做決策。美國的經濟學人雜誌,在網站的訂閱服務做過一個實驗,給用戶三種方案選擇如下:網路版 59美元一年、紙本版 125 美元一年、紙本版+網路版 125 美元一年,結果是沒有人選擇第二種的只訂閱紙本版,而有高達 84% 的人訂閱紙本版+網路版的第三種方案,但當他們在實驗把第二個看似無用的選項去掉後,選擇第三種訂閱紙本版+網路版 125 美元的人就下降到了 32%!

經濟學人雜誌在完全不花成本的前提下,既提高價格又提升用戶購買的,這樣一個看似無用的選項,就完美達到了目標。所以了解用戶行為,在設計產品是非常重要的。

二.數據思維:

  1. 【相關性和因果性】

新英格蘭醫學雜誌曾刊登一篇研究,數據顯示,一個國家吃巧克力的人均消量越高,這個國家諾貝爾得獎的人數越多,那這個結論可以推論,多吃巧克力有助於獲得諾貝爾獎,當然是不可行的,只能說明吃巧克力和得諾貝爾獎兩者間有「相關性」,但並非能推導出「因果性」。在網路業產品也一樣,我們時常關注產品的數據和用戶流量,當 A 數據提升,B 成果也提升的時候,我們可能會誤以為是自己做的某些功能或迭代起到了作用,卻沒有把所有可控變量排他,就像電商網站,投放了廣告後,帶來了顯著的銷量,就以為是廣告所帶來的效益,但有可能只是剛好遇到了促銷季,那麼真的要知道是否有相關性,只能透過 A 數據不提升,看 B 數據是否仍舊提升來判定。

有時候我們僅僅知道相關性也不錯,像機器學習裡經典的例子『啤酒與尿布』,或許有許多綜合原因讓顧客把啤酒與尿布一起買了,但商場把兩項商品聯合促銷,也確實造成銷量大增,這也是後來的機器學習其中的一個概念。

2.【倖存者偏差】

這是統計上很經典的一個理論,可以理解為「沈默的是大多數」。當我們在觀測產品數據或是評論時,要如何衡量一個 user feedback,並不是每一個用戶都是我們的 TA,有可能今天你為了一個給負評怨聲載道的用戶,大費周章花了成本迎合他,卻因此失去了更多的用戶,那是因為很多人性在使用好的產品時不會特別寫好評,但一但有極差的用戶體驗,反而會想寫評論,因此我們要知道「倖存者偏差」後,如何衡量哪些用戶反饋是真的要改進的點,這才是非常重要的。

三.創業思維:

1.【OKR管理】

OKR 代表了矽谷的創業精神,要制定 OKR 的方法,可以參考我前面寫過的這篇《如何使用目標管理工具 OKR? 》有介紹,相比於 KPI 的「由上至下」制定,OKR 是由員工自主「由下至上」制定,而且即使 OKR 沒有完成,並不會受到太大的批評,這樣自由自主的精神,讓矽谷員工非常自律卻又非常自由。而 OKR 的目標是公開透明的,團隊中每個人可以知道彼此的 OKR,並對其總體目標是否一致,對於個人的目標設定,也是很好的管理工具,當你想做一件事情,把你的目標宣告出來,會讓自己更有執行力的完成,這個在我這篇《寫下目標的重要性以及信念的力量》,也有提到關於目標設定的想法。

四.增長思維:

1.【Growth Hacking】

網路軟體業的擁有得天獨厚的用戶數據,因此用戶在 APP或 是網站裡發生的所有行為,都是可以被數據紀錄下的。我們可以追蹤整個產品每一個用戶使用環節,去推算產品的功能疊帶點,也可以透過這些數據去計算流量池(用戶流失率),例如電商類產品要記錄每一類的用戶轉化,從打開 APP、點擊註冊、瀏覽商品(瀏覽多久,來回跳出,比價等)、加入購物車、下單、支付、到貨等,這些行為每一個環節,從 100% 的用戶,每到下一個階段流失多少用戶,而得出每一個環節的轉換率,進而知道產品在哪些環節可以進行優化。比方說註冊的環節就流失了大部分用戶,那這個註冊功能是否用戶體驗不好,是否可以把介面設計的更簡約,操作更便捷?或是是否可以省略這個環節,但在之後用其他獎勵方式激勵用戶註冊等?

其他如頁面的用戶瀏覽體驗,包括在 APP 介面的顏色、視覺大小、操作流程等,都是可以一一去觀測,而在我們找出問題後,絕不能用想當然爾的一股腦兒的提出解決方案就優化產品,除了觀察、訪談等質性研究了解用戶真實行為,網路公司更喜歡交由數據決策,透過 A/B test,實際做實驗,讓兩組用戶收到不同的介面效果,而最終使用點擊率、轉換率高的用戶群所看到的介面,成為產品優化的決策方向。

增長思維是每一個產品經理都需要具備的知識,而有些公司甚至會把「增長(成長)駭客」獨立出來,專注於用戶量的成長,之前我也寫過一篇關於《 小紅書用戶增長產品經理(成長駭客)演講筆記》,可以參考其工作內容分享。

五.成長思維:

1.【成長性思維】

史丹佛大學教授 Carol Dweck 是著名的發展心理學家,他研究到人的思維模式分為兩種:「成長性思維」、「固定性思維」。

「成長性思維」的人在定義成功時,總是覺得自己還遠遠沒有成功,但歸咎於過去的努力,自己達成了成就,因此並不把成功完成一件任務看作自己天賦異稟,而是抱持著感恩肯定過去的努力而相信自己會更好。

「固定性思維」的人則相反,總喜歡把成功看成是自己天資聰穎,在成功時容易驕傲自負,在失敗時會傾向於責怪老闆、同事、環境或任何非己身錯誤所導致的時運不濟等。

科學家研究了兩類人的腦圖,發現「成長性思維」的人的腦中錯誤地區是活化的,說明了成長性思維模式的人,會總結錯誤並歸納原因,因而在每次失敗後不斷改變,進而不斷成長。

最後送大家一句話:『菁英並非與生俱來。不想被超越,唯有不斷努力。相信努力會帶來進步,有目的的付諸實踐,進而超越自己。』

【Monthly workshop分享-寫下和信念的力量】
前陣子,我參加了Jumpstart 創辦人Rosa舉辦的Monthly workshop ,在活動中我們寫下自我2021的目標,並對他人宣告。

這個活動最棒的地方是寫下目標後,你可以在那麼多優秀的人面前宣告,這就彷彿做出一個承諾,除了砥礪自己,更多是結合眾人的能量,一起督促自己前進。

【來自哈佛的著名實驗】
你知道嗎?哈佛在1979年對於畢業生,進行了一個實驗,他們詢問這群畢業生,並且把這群畢業生分為三類人,第一種是畢業後有明確目標並且寫下來的(僅佔3%),第二種是有目標卻沒有寫下來的(佔比13%),第三種是沒有目標的人(達佔比84%)。

結果十年後研究員追蹤發現,離開哈佛時清楚寫下目標的那3%畢業生平均所賺的錢,是其他97%的畢業生的10倍!

這就是寫下的力量,寫下目標有助於你督促與提醒自己,你可以寫下紙條,放在錢包皮夾,也甚至可以宣告給他人,在寫上之後,就可以秉持著這樣的信念,開始說服自己相信,每一件事情的發生,都是在為未來的宏偉成功做預備。

而目標的設定更多是在於你能在做決定時,更有判斷力,對於你的財務規劃,下班和週末的時間規劃,都將會更清楚。而做一件事情,重點在於持續做,有堅持,有目標地把一件事做到好,也是我認為比快速達到更重要的事。

但記住,設定了目標,如果沒有達成,也不要太苛責自己,一個很大的原則是,在追尋目標的同時,你的每一個細胞是快樂著的,也記住,你一直在往這個目標前進,如果因為環境變盪等因素,沒有兢兢業業地完成,也不代表你不重視它。

我認為極端的例子是,你誤以為這個目標是一個終點,達到了就會快樂,但其實,這個目標只是一個里程碑,你在爬人生這座山的里程碑,享受爬山的快樂,享受攻頂的快樂,而不是專注於攻頂,那麼上了山頭,然後呢?也還有更多未知與更高的山頭等著呢。

為什麼這麼說呢?曾經的我,也在單一的教育體制環境中,覺得社會世俗所認為的標準,就是自己的目標,為了達到目標我非常努力,努力過程中的吃苦當吃補,為了追逐目標痛並快樂著。直到追逐的目標都達成後,才意識到原來目標不是終點,不是到了這就會保證你人生一切順遂、滿意愉快。

我才發現,原來所有的試題都有標準答案,所有課程都有所謂的分數,但人生過得快不快樂,並沒有標準路徑與答案的,也沒有一堂課程,教你如何愉快的過生活。就像電影靈魂急轉彎裡所說的,構成生活的更多快樂,往往是那些微不足道的小事。

其實,比起目標達成更重要的事在於過程,靈魂急轉彎的主人翁喬賈德納,一生的志業和火花,就是追求大舞台表演的機會,他確實追逐到了,卻也在表演的當天發現,原來那一天,並沒有那麼特別,而更可貴的,是生命過程中每一刻的積累。

那些世俗所定義的成功,諸如高薪、買房、買車的理想生活,常常讓我們誤以為這些是目標,卻疏忽了那些暗夜中為夢想努力的自己,買上第一件白襯衫準備面試,說出與家人相違背的夢想,火花並不是目標本身,而是存在於這些過程的每一刻。請記得,快樂到忘我與執著到固執,只有一線之隔,獻給那些在為生命努力的你,不管如何,請讓自己築夢過程中的每個細胞是快樂的。

【別告訴自己不可能-話語的力量】
工作、生活不如意十之八九,挫折厭世的時候,可以想想比爾蓋茲的信念:告訴自己「這件事情很難,但我喜歡做困難和挑戰的事!」,然後捲起袖子,覺得這種小事難不倒我的心態,相信自己可以做下去的,不要再告訴自己不可能,對我來說,只要我堅信自己可以達成的事,幾乎都真的都會達成。反過來說,回顧以往沒有達成的事情,還真的是因為自己不夠有堅定的信念(笑)。

本文涵蓋 PM 刷題網站、面試技巧網站、PM 社群、程式學習資源、推薦書單等。身為科技與人文的化身,產品經理不只需要邏輯、技術能力,更需廣泛涉獵商業、用戶心理學等知識。

前言

科技與人文的化身-產品經理

網路業產品經理其實是一門複合型的學科,要設計與決策網路產品,對接工程師、設計師,需要使用不同的腦去解決並提出解決方案。

『有的聰明人做不好產品經理的原因就在這裡,他覺得自己邏輯性很強,但是做好產品經理更需要對人性、行為、需求的深度挖掘。產品經理是一個用科學方法研究復雜且非科學的人性,並轉化為可執行的商業方案的實踐驗證學科。一個具備人文邏輯的人,最重 …

Elaine Yang

中國美團總部產品經理。畢業於北京大學計算機技術碩士。曾任職微軟亞洲研究院用戶研究員、亞馬遜電商/雲計算商業運營全職實習。中文、商管、計算機背景,做過行銷、公關、數據運營。關注UI、UX、產品經理、互聯網趨勢,歡迎交流成長!臉書粉專: https://pse.is/RKH42

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store