More Related Content
More from Chang Chiao Hui
More from Chang Chiao Hui (20)
大數據
- 3. 傳統統計思維 vs. 大數據思維
• 過去難以收集全部資料,統計學應運而生,
透過抽樣,希望用最少量的資料,以推估
整體
• 隨機抽樣是現代大規模測量的基礎,但隨
機抽樣之後,尺度難以調整,一旦我們想
要更深入、仔細研究某個有趣的資料子群,
抽樣調查就無用武之地,因為蒐集的資料
只是樣本,而不是一切,也就難以繼續擴
展延伸。
- 5. 因果關係 vs. 相關性
• 亞馬遜商品推薦系統的概念:比較客戶之間
的異同在技術上過於繁瑣,只要比較商品本
身的關聯性就好
• 抓住相關性就抓住機會,相關性不只是本身
就很重要,甚至也能用來協助找出因果關係。
• 相關性的運用:我們想要預測A現象,但它
本身十分難以測量或觀察,這時我們發現A
常與B同時發生,此時只要把B當成指標,就
能用來預測A是否將要發生