Thursday, September 15, 2016

大數據與雷動配票 免費早餐 - 梁天卓

免費早餐 - 梁天卓
大數據與雷動配票
2016年09月14日
互聯網的出現令大數據變得更為普遍,巴打絲打上高登的瀏覽數據是大數據,一個書呆子上Amazon買書的紀錄又是大數據,甚至乎你偷偷地Google你的夢中情人的搜尋數據也是大數據之一。
這些大數據有甚麼用?我不知道高登有沒有儲存各位巴絲打的大數據來賣廣告,但我知道Amazon有利用網民的瀏覽數據,和一些經濟學的計量公具來推算各類書籍的需求,從而改良它的定價策略。
Amazon對自己手握的大數據諱莫如深,外人要分析Amazon的大數據近乎是不可能的任務。相反,Google在開放它的大數據顯得更為慷慨,一個比較多人採用而又免費的大數據是Google關鍵字搜尋次數的數據。除了你的夢中情人的搜尋次數,你還可以比較美國總統候選人初選時,各候選人名字在投票當日在Google上被搜尋次數,有研究發現這種大數據不但能準確預測誰勝誰負,甚至乎各候選人的最終排名,這搜尋次數的數據更能大致準確預測各候選人的得票比率!
立法會選舉過後,不少人談論雷動配票的對與錯。無論是支持又好,反對又好,肯定的是雷動在執行上有很多不足,其中戴耀廷教授都提到「無諗過選民對政治局面嘅關心程度咁大」,低估了雷動的漣漪效應。互聯網的大數據能否協助雷動的配票?
要利用互聯網大數據配票的前提,是這些實時的大數據能準確預測票數。鄺神被配票有沒有在Google的搜尋次數顯露出來?我在Google Trends下載有關數據,發現鄺神與同樣被雷動「選上」的梁耀忠同樣在棄保名單出爐後,他們的名字在網上被大量搜尋,並遠遠拋開僅僅入閘的涂謹申有4、5倍之多。同樣,在港島被「祝福」的羅冠聰亦在棄保名單出爐後大幅拋離民主黨的許智峯和後來勢危的陳淑莊。
不過,利用搜尋數據預測票數還有很遠的路。首先,非建制在網上的支持度拋離建制九條街,但非泛民與建制的實際票數只是6、4之比。
另外,即使是在非建制的光譜裡,一些候選人(尤其是年輕的本土派候選人)的網上支持度,亦遠比實際票數要高,另外好幾名高票當選的民主黨候選人在網上被搜尋的次數亦不多。
網上搜尋的大數據可準確預測初選結果,可能由於各派支持者的「網精」程度大致一樣。很明顯,香港各派系支持者的網上「廢青」比例並不一樣。
作者為維克森林大學經濟系助理教授
中文大學亞太研究所經濟研究中心成員

No comments:

Post a Comment

與蕭局長 談貧富懸殊 免費早餐: 梁天卓

免費早餐: 梁天卓 與蕭局長 談貧富懸殊 2017-06-23 傳媒、KOL以至政府官員都喜歡引用堅尼系數。這是個看似簡單但其實不易明白的指數。讓我簡單解釋一下,該系數的數值是在0至1之間,0代表收入分布絕對平均,1則代表收入完全集中在極小數的人手上。指數看似簡單在...