2011-08-10

畫圖表還是有畫圖表的規矩,懂嗎?

睽違了兩天,老人又給了我們更多娛樂,這次又是一張驚人的圖表:

(不用再點了,這已經是我所能找到網路上最大的圖片了)

哇塞! 這張圖片看起來好可怕啊,有了 iPad 的蘋果無人能敵耶,姑且不論這個統計是不是不小心忘記把變形金剛等一票 2Q11 已經發售的 Android 平板算進來,也不論某人是不是做了 "曾經說過iPad 不是 PC」現在卻又「拿 iPad 為蘋果 NB 市占率助陣」" 這種自打嘴吧的行為看來這世界以後就是蘋果的了! 等等、等等,怎麼有一角怪怪的阿?

怎麼最後一欄怪怪的呢?
有學過初等統計學的、國民教育有碰過統計圖表的,都知道折線圖是用來顯示數據時間變化的圖表,所以畫折線圖最重要的禁忌就是
不可以把不同項目的內容放在橫軸
當然這是有例外的:
  • 未到資料:有時候我們在做分析,最後一期的資料來不及跟上,以至於我們只好用不同時間區間的資料替代。例如:本來我的圖表是每一資料點代表一個月的訊息,但最後一個月的資料還沒出來,只好用一個禮拜的資料代替。
  • 計算方式改變:有時候一些我們要看的統計數據跨了很長的時間(例如前後兩百年的年出生人口資料),因為統計的單位把標準改變,或者因為統計數據方法的不同,本來是不應該把這些數據融合在一起的,但是因為要研究一些很重要的議題,導致我們需要把不同的數據放在一起看。
但無論哪一個,都僅限於相同性質、內容相同的資料,而且都是在不得已的情況下才做的,這張市占率圖表真要做,就得畫兩張圖表,一張是有算 iPad 的筆電市占率,另一張是沒有算 iPad 的筆電市占率,或者直接畫成長條圖。

為什麼有這個規定呢? 原因很簡單,正如同之前提及的「折線圖是用來顯示數據時間變化的圖表」,我們是照線的傾斜程度,來衡量事情有沒有爆炸性的變化,假如故意在最後一格換上不同的數據,那就會讓人產生飛躍性的成長的錯覺,而用圖表創造錯覺,就不是統計圖表的用意了(當然,很多人的用意正好就在這裡XD)

成長的錯覺

當然我們不需要太苛責該格主,畢竟那張圖表不是他畫的,他只是沒有附上參考出處去年的消息而已,事實上原作者甚至在這篇舊文章有刊出相同分析師畫出來的「把 iPad 算進來」的圖表(僅限美國本土),只是刻意刪掉幾條線而已了~

有沒有注意到參戰的廠商比一開始那張少很多,而且又沒其他項呢?

該篇網誌真正有問題的,其實是這段文字:
......由圖也可看到,灰色宏碁受害最深.....
事實上單就 2011 年第二季有無 iPad 計算基準來看,除了因 iPad 增加而上升的蘋果以外,其他廠商的數據本來就是依兩者計算差本來就是依比例修正的,在此附上修正公式:
「原來各廠商的市占率」* (「原來總數」/「原來總數 + iPad 數」) =「新的各廠商的市占率」
其中「原來總數」/「原來總數 + iPad 數」本來就是固定值,也就是說兩者改變的比率固定不變,那看起來變動最大的,應該是原本扣除蘋果市占率最高的公司,也就是 HP,而不是 Acer。

當然他並沒有說他是用甚麼基準判斷 Acer 受害最深,也有可能他是說出銷售數字受到的影響最大,但是這是一張百分比的圖表,是不可能看出來銷售數字出了甚麼事的。那就有可能是指市佔率下降最多了,的確從 iPad 上市的 1Q11 以來 Acer 的市占掉得很快,但是我們這張圖表顯示受害的市佔率應該是被 HP 吃掉了吧,怎麼會說是蘋果的幹的好事呢?

HP 與 Acer 明顯的市占消長

所以說到底老人是用哪隻眼睛從這張圖看出來 Acer 受害最深呢? 這種太專業的問題我就不知道了,反正「信不信由你,我反正是信了」。


蘋果統計學:

參考閱讀: