大數據不似預期?

發佈時間: 2016/11/18

即使有白宮群英出謀獻策、荷里活巨星在社交網絡吶喊助威、各大主流傳媒亦近乎義無反顧地一片唱好——希拉里最終仍黯然落敗,特朗普成為美國第45任總統。於是有人不禁問:「如果大數據可預測未來,為何今回美國大選的結果,不單止不似預期,而且還要相差得那麼遠?」

坊間有不少人歸咎大數據出錯,其實這是大錯特錯。首先,大部分人着眼的民調,只不過是抽樣調查的「小數據」,所謂的大數據分析,除了數字樣本要有一定數量和代表性,同時還要有多個數據源作數據模型分析比較,歷史數據及即時數據變動,兩者同樣重要。主流傳媒或者是希拉里團隊的大數據分析、數據模型未必有錯,問題可能出於數字樣本的全面性與可靠性,以及該團隊如何演繹大數據。

現在才說當然有點事後孔明,但正所謂勝者為王,根據特朗普背後的數據軍師Cambridge Analytica的說法,在主流民調以外,他們的注意力更集中在主要支持者及捐款人的數據分析,從而推論出其他潛在支持者的所在之處;當中的投票人口,又會否在投票日出來投票,繼而在Facebook打針對性的廣告。外間以為特朗普陣營在Facebook不及對手活躍,其實不然。

然後又有人問:「為甚麼我在Facebook上看到的,都是一面倒希拉里氣勢如虹的消息?」這是今屆美國大選的另一個有趣現象,同時亦反映了目前Facebook的一大缺點。首先,由於被民調唱好希拉里,不少傳媒也隨着不少人的主觀願望,繼續順水推舟,發表更多相關的正面消息。同時間,Facebook背後的運算機制,亦只會把與你有共同興趣,或者是相近取向的朋友的內容推送給你,自己不知不覺間變成了一個偏食兒童,你還懵然不知。

最後,網絡假新聞和社交網絡造謠,同樣是今屆美國大選值得注意的現象。選舉過後,Facebook和Google都分別發表相應對策,譬如禁止這類不良內容打廣告,雖然此舉說易行難矣。

(本欄逢周五刊登)

撰文: Rudi 路迪涼 進擊中的社交媒體廣告人
欄名: 進擊中的Social