Tuesday, October 4, 2016

網絡大數據的缺陷 免費早餐 - 梁天卓

免費早餐 - 梁天卓 
網絡大數據的缺陷
2016年09月30日

欄友徐家健星期一在這欄介紹中原最近推出的中原經紀人指數(Centa-Salesman Index,簡稱CSI)時提到,我們曾經自作聰明向施老闆解釋如何以「Google 趨勢」的幾個搜尋關鍵字預測樓市,並建議他利用中原地產獨家的大數據令預測更準確。單就預測樓價的短期走勢來說,我們的數據分析話老行尊的CSI,對短期樓市有一定的預測能力。

Google的大數據會否有助預測短期樓市?在說我的想法前,先讓我講講為何我們會想到用Google的大數據來輔助預測樓價走勢。這個意念當然不是由石頭爆出來的。事實是經濟學行內已有不少大數據的研究,有部分就是利用Google的大數據預測美國的樓市。正如不少人上網買衫前都可能會上網研究,你買樓前都可能會上網查一查有興趣的單位。研究結果顯示,網民在網上搜尋「樓市」相關的關鍵字的次數有助預測當月(並非未來一年)的成交量及樓價。
除預測美國樓市走勢之外,不少行家發現Google的大數據,也可以用來預測其他事項,其中一樣是選舉結果。兩星期前我提到有行家靠美國共和黨初選當天(並非1個月或1年之前)網上搜尋各候選人名字的次數,來準確預測各州共和黨初選的結果,以及各候選人的得票比率。
不過,研究亦發現,同樣的數據卻未能準確預測民主黨的初選結果。Google的數據為何好像《國產零零漆》裡面的「狡猾的槍」,一時準一時又不準?

一個可能的解釋是各黨候選人的支持者大有不同,而不同黨派的支持者的上網比率可能不一樣之故。在共和黨內,有候選人的支持者多為白種窮人,有候選人標榜自己為虔誠教徒,亦有候選人較受女性歡迎。根據研究顯示,這幾組人口的上網比率沒有太明顯分別。相反,在民主黨初選裡,桑德斯明顯較希拉莉受年輕人歡迎。眾所周知,年輕人上網比率較年長人士要高很多很多,所以桑德斯在某些州的網上支持度比實際支持度有明顯誤差。

香港的立法會選舉亦有類似情況:建制的支持者比較年長,其網上支持度亦大幅落後於實際支持度;即使是非建制裡各派的「廢青」支持者比例亦各有不同,於是出現某些組織網上「大勝」,但實際上慘敗的情況。

在香港,老中青的上網習慣可說是大相逕庭,而他們的買樓意欲(及能力)亦大不相同:香港到底有多少「廢青」在網上發洩「望樓輕嘆」的憤怒,又有多少樓都唔使睇,網又唔多上,早已上了岸的中上產呢?所以在香港利用Google的大數據作預測短期樓市,可能還未是時候。不過,作為地產經紀的一哥,中原應該有其他比「Google趨勢」更有用的大數據可加以利用。
作者為維克森林大學經濟系助理教授
中文大學亞太研究所經濟研究中心成員

No comments:

Post a Comment

當非理性除牌遇上技術性調整 徐家健 經濟3.0

2017年10月17日 徐家健 經濟3.0 當非理性除牌遇上技術性調整 一句「不要怕,只是技術性調整」,言下之意是大時代裏股民有時反應過敏,因此股價才需要技術性調整回復正軌。今屆諾貝爾經濟學獎得主塞勒(Richard Thaler),便是憑研究人類在市場上種種非...