「大數據」真的能預測選情嗎?有沒有這麽神啊?

撰文/黃郁棋  

自「連柯大戰」結束以來,「大數據」、「網路聲量」、「婉君」對於大選的重要性,頓時浮上了檯面;不管是幾歲的候選人,現在也沒有人敢輕忽網友左右大選結果的力量。不過,「大數據」真的有這麽神嗎,神到可以預測未來?本文試著從外行人的角度,分析看看大數據、網路聲量與婉君,對大選結果的影響力。

首先必須解釋的,究竟什麼是「大數據」?事實上,大數據這個詞有點籠統,它其實是指海量資料的「蒐集、分析與運用」。通常建立大數據資料的第一步,就是Data Mining(資料探勘),簡單來講就是蒐集需要的資料,作為未來分析與應用之用。而蒐集到海量的資料後,如何分析解讀,就是一個很大的問題了。


以「臉書社群資料」為例,由於中文語義分析的難度非常高(如何斷句、如何判斷正面負面、如何辨別反串與反話,都是很困難的學問),就現階段而言,大數據能做到的,大多是判斷候選人在網路上的「傳播力」、「被關注度」以及「對社群影響力的強弱」。

以本文上方的圖表為例,這些數字是「總統大選三巨頭」的社群關注力量表!而判斷它是否受到關注,則是從「相關文章數量」與「按讚次數」做計算 。整體按讚的密度越高,我們就可以大致認定,這個人被網友關注的力度越高。(不過,這並不能與「支持與否」劃上等號)


從圖表中的數據來看(資料來源是Q Search,這是一間專門蒐集臉書數據、並且做出分析與統計的公司),蔡英文在今天(8月19日)的「社群關注度」遠高於另外兩名候選人;而8月18日,則是宋楚瑜的關注度最高。

為什麼會出現這些改變呢?以下我們將兩個案例分開來看:

【宋楚瑜】究竟在8月18日這一天,發生了什麽事,讓宋楚瑜被關注度這麽高呢?從當天最熱門的相關貼文來看,主要是兩件事:「宋楚瑜粉絲數突破了30萬」、「宋楚瑜與謝長廷在高鐵巧遇、合照」。因為發生了這兩個事件,讓宋楚瑜的「社群被關注度」大大提升,雖然並沒有明顯的正面或負面傾向。


【蔡英文】而蔡英文又在8月19日發生了什麽事,讓她的被關注度飆升呢?仔細看,主要是這兩件事:「蔡英文也可以很ROCKER照片在粉絲團擴散」以及「賴清德的推力」。事實上,8月19日蔡英文的關注度大飆升,也與另外兩位候選人的關注度大降溫有著直接關係。


那洪秀柱呢?為什麼被關注度始終不上不下的?有個很關鍵的因素:粉絲團人數:

蔡英文的粉絲團人數:139萬
宋楚瑜的粉絲團人數:30萬
洪秀柱的粉絲團人數:19萬

若從粉絲團的角度來看,在三位候選人都沒有購買殭屍粉絲的前提下,蔡英文的粉絲團影響力,是另外兩位候選人加在一起也比不上的。雖然臉書的演算法並不會讓觸及率直接跟粉絲成正比,但是真實粉絲多,確實利大於弊。

簡單講,蔡英文的政策,更容易透過網路傳播出去;而洪秀柱,除非依賴媒體操作(讓媒體粉絲團也推她一把),光靠她自己的網路聲量,是遠遠不夠的。


所以說,蔡英文更容易在大選中脫穎而出嗎?其實放到整個社群網路上,又變得很難說。別忘了,台灣「媒體群」的粉絲數量加起來,可是突破千萬的!而如今媒體的新聞來源,有很多又是直接從社群網站上取材,因此容易造成一種「放大效應」。

雖然說,台灣人普遍認為媒體有分藍綠,但是如今網路媒體追求的東西,不是藍、也不是綠,而是「流量」。誰帶來的流量好、廣告費多,就集中火力大報特報。最後,有趣的事情就這麽發生了:

「網路輿論,決定一切!」


▲網友的「輿論影響力」,會直接影響媒體、間接影響大選結果。(圖/取自網路)

輿論會影響媒體的報導意願,而媒體會影響候選人的網路聲量與形象。候選人穩紮穩打的經營粉絲團,造成的影響,遠遠不如總粉絲數破千萬的「媒體群」;而媒體鍾愛的內容,是「造成輿論集中的事件」。換言之,真正影響選情的東西,是事件所引發的輿論,而不是你按部就班經營粉絲團、寫政見、辦政見發表會等傳統方法。

這時候,「婉君」的重要性就來了。有目的性的婉君,確實有可能造成「網路事件」,而直接影響媒體與輿論。但是,網友並不是這麽容易濛混過去的:一旦婉君露出任何蛛絲馬跡,被網友抓到,下場就是讓候選人陷入萬劫不復之地。


話又說回來,「大數據」除了做事後諸葛,真的具備影響選情的能力嗎?我的個人答案是:真的有,關鍵在於「監控」。一旦候選人能夠透過大數據,在第一時間發現到「事件正在擴散發生」,並且在第一時間做出最好的回應(滅火、或是火上加油),確實有可能消弭災難、或是擴大好名聲。
 
說到這邊,不知道網友們是不是對於現在的大選,感到某種程度上的陌生了呢?歡迎來到21世紀。

留言