2011-08-02

不是用了蘋果,統計學甚麼的就不重要了~


這篇「iPhone留客率94%,Android手機47%」的標題下的極為震撼,其中段話簡直是宣告下一個世代就是 iPhone 的時代:
......已有iPhone的顧客...94%仍會買iPhone......
......而相反的,已有Android的顧客...只有47%仍會買Android......
但是,事實真的是這樣嗎? 老實說我很想要查明,但是這個作者沒有附上參考資料,所以我也 懶得 沒辦法繼續查下去。

但是,這世界還是有希望的,就在不久之後,我看到數位時代的這篇報導,果然他們還知道要好好付出處,點開一看,果其不然,又是玩弄數字的小手段:
......Munster surveyed 216 mobile phone users in Minneapolis about smartphones. Not exactly rocket science, but a good way to get the pulse of consumers and gauge interest in Android and iOS going forward. ......
有人會覺得,樣本小又怎樣,老師說只要抽樣不偏就好啦~

問題是對照尼爾森的這篇 20,202 份樣本的調查,這統計可說是偏差到爆! 我想這我們不需要去跑任何測試,直接看圖吧:
這是該篇的統計
這是尼爾森的統計
姑且不論報表美工精細度(其實我們看到 Piper Jaffray 的報表很明顯把一角截掉了,到底截掉甚麼我們就不討論了,只怕越討論越傷感情),我們發現假如他們的調查是差不多同時做的,取樣區域也是全美的話 (更新:實際上我的英文真的是菜到爆XD,這邊有寫這是明尼阿波里斯市的調查,當然偏到爆XD) ,很明顯 Piper Jaffray 取到的樣本明顯 Android 在比例上面少很多(換算下來佔智慧手機 20 %,比尼爾森的少了 19% ),當然,這一切的假設都是這篇統計是差不多同時做的。

抽樣偏誤又怎麼樣,我們要看的只有各族群內部的行為啊


這就要談談抽樣誤差的原因的,若我們不考慮「研究者是故意製造誤差」的可能(有意挑選樣本達到想要的效果),抽樣誤差的由來有那些呢?
  1. 重複抽樣:有人重填兩次表單之類的,那在比例上多出來的( iOS、黑莓)族群,就是有明顯重填的族群,這樣我們就要懷疑此族群的成績是否有被過分誇大了。
  2. 方便抽樣:就是做問卷的人依他自己的方便(像是請親朋好友作問卷之類的)發放問卷,那這樣很明顯這個調查不能調查代表全美(甚至美國的一個小鎮),頂多就只代表了他的兩百多個好朋友~
  3. 引導作答:就是問卷設計的不好,會讓人回答出題者想回答的答案 像是在問卷上特別提示某牌手機的下一代名稱卻完全不提其他手機,可能會讓人心中特別去選某牌這種做問卷的人都知道的技巧之類的阿。老實說,Piper Jaffray 的調查很有可能有這問題,那誰的特別有問題大家就心照不宣了~
    怎麼有一項特別細呢XD
  4. 機構效應:就像你聽到來調查的人是天下雜誌的人,就自動的帶入這是XX黨的調查,所以不願意配合/超願意配合。
  5. 單位誤差:老實說這調查應該不會犯,因為單位都是個。
所以說,這則網誌到底告訴我們甚麼呢? 這「只是個案,是你的心在浮動」吧XD
 
蘋果統計學:

參考閱讀: