風向戰爭與它的推手

候選人App背後有什麼招?你我的隱私,成為新時代政治賭局籌碼

IT公司的伺服器機房。(攝影/REUTERS/Athit Perawongmetha/達志影像)

「你以為你可以自己選擇你要看什麼東西,但事實上我們早就幫你選好了。」從消費動員到政治上的情緒動員,數據已成為現代社會中最有效的政治籌碼,能輕易左右我們的民主,供政治人物在賭局裡拿著我們的喜好對賭。

過年在即,新年的頭兩天,剛出社會的你,在晚間6點下班,搭上了離開市區的公車,準備回家歇息。你閒來無事,拿出手機滑了又滑。突然間,螢幕跳出一則廣告,是新推出的數位行銷線上課程,一堂500元。「是誰這麼懂我?」你感到疑惑,隨即又認為這是上天提醒自己進修的好時機,搞不好可以多個技能、順便換份薪水好一點的新工作。

晚間7點,捷運到站,你關上手機,跨上機車。一路騎到離家最近的加油站,加了不到一缸的油,一共130元,你刷卡支付。踏入家門前,你的眼睛沒閒著,點開手機上的App,蓋版廣告跳了出來,是針對「小資族」提供加油優惠,累積一定刷卡額度還能抽獎。你在一個人住的雅房門前停了下來,心滿意足地閱讀銀行提供的方案。「新的一年,不如辦張新的卡吧?」你這麼想。

為什麼廣告總是來得這麼即時、這麼貼合我們的需求?又是誰在背後看穿了我們的一舉一動?

誰扮演上帝?無所不在的即時監控網

這些問題的答案並非指向上帝,而是「數據公司」。透過幾乎不間斷的個人數據蒐集,這些公司們正以上帝的視角在看穿我們。

「你以為你可以自己選擇你要看什麼東西,但事實上我們早就幫你選好了。」一位不願意具名的數據公司高層,用這句話來形容數據時代下每個人的處境。

徹底摸清每個人的需求,決定你眼裡的世界,這樣的運作聽起來玄妙,但它既不是讀心術也不是魔法,而是一套商業模式,又稱作「大數據精準投放」。如今不少行銷公司透過數據蒐集和分析,先是把群眾拆解並分類成無數精密的群體,再透過各種「廣告實驗」,找出群體的特性,替各別群體貼上獨特的「標籤(tag)」。

活在數位社會的每個人,究竟是如何被辨識?又如何被貼上各式「標籤」?

於2014年正式創業,早期靠著即時監測Facebook數據來解析全球使用者行為、並自稱利用數據,成功協助台北市長柯文哲打贏選戰的QSearch數據公司,試著幫我們解答這個問題。

「基本上人不會跟不喜歡的事物靠在一起,在『物以類聚』的狀況下,我們可以找出每個人之間的『節點』,也就是共同喜好或關聯;標籤就是根據這些共同喜好來判定的。標籤就是個人的『屬性』與『特徵』,就是他的網路個性,」QSearch共同創辦人兼技術長周世恩解釋道。

5,000個數據點、32個類別,組成你的「網路個性」

如同Netflix原創紀錄片《個資風暴:劍橋分析事件》(The Great Hack)中曾提及,專長在政治選舉操作的劍橋分析公司在分析群眾時,是將「個人」轉化成為「人格特質」,透過了解個人喜好、興趣、情緒、個性,和對特定議題的喜好,他們將人分作不同特質來分析。

為此,《報導者》也越洋聯繫到前劍橋分析(Cambridge Analytica)業務總監布特妮・凱瑟(Brittany Kaiser)。她在受訪時解釋,這些人格特質就是「標籤」,依照電腦計算,每個人都含有5,000個數據點,透過這些數據點的累加,就可以把人依據「標籤」細分成複雜而精確的群體。像在分析結果中,一個人可以是「開放」和「親和」,也可能是「神經質」和「外向」,當時在劍橋分析的架構下,總共細分出32個主要類別。

Fill 1
數據隱私、劍橋分析、數據公司、臉書、Brittany Kaiser、孔德廉、劉致昕
作為政治操作的領頭羊,前劍橋分析業務總監布特妮・凱瑟(Brittany Kaiser)提醒,「我們應該對於自己交出去的東西,更有意識才行」。(攝影/REUTERS/Stefan Wermuth/達志影像)

她也指出,在這些類別中,還會為每個人的特質程度打分數。例如,一個人「開放」程度的分數多寡,顯示這個人更喜歡新體驗或更傾向於依賴傳統。「嚴謹」程度的分數,顯示了這個人是否更喜歡計畫行動而不是隨興行動。「外向」程度的分數,顯示了這個人喜歡和他人交往和喜歡成為社群中一分子的程度。「親和」程度的分數,顯示了這個人是否把別人的需求放在自己的需求之上。「神經質」程度的分數,顯示了這個人在下決定時受到恐懼驅動的可能性有多大。依據這些標籤,就能夠預測群眾的心理與行為。

貼標籤、打分數,成為最懂你的人

換言之,所謂的「標籤」,就是數位足跡和互動行為的濃縮,包含每個人在Facebook上對哪些內容按讚、留言、互動密集度,或是在手機上使用哪些應用程式(App),看了哪些廣告等等。

在大數據的時代裡,每個人的一舉一動都被「即時監控」,就如同QSearch輿情監測數據公司,還有數位廣告公司主打的服務內容一樣:靠著無時無刻的社群動態監控,整合多方數據進行分析,洞察不同年齡層、不同族群喜歡什麼、討厭什麼,甚至去了哪裡,都能夠一一掌握。

標籤的妙用無窮,讓數據分析配合精準行銷這樣的商業手法,成了市場大熱門。根據全球測量和數據資料分析公司尼爾森(Nielsen)在2019年發布的「數位巨擘的甦醒」研究報告中,就提及亞太地區公司投資在「精準行銷」上的比例,在未來一年內,可望從14%增加到19%。因為精準行銷能促使廣告主了解消費者購買過程、個人客製化的傳播方式和消費者概況分析。

不過,我們的數位足跡,到底是怎麼被掌握的?

在手機上,一組ID能秀出你的習慣與需求

知名數據行動分析公司接受《報導者》訪問時,詳細描繪了數據何以被蒐集的過程。

該公司擁有多年數據分析經驗的高層指出,關鍵在手機。因為每人的智慧型手機都有安裝各種App,而一般App裡面又有裝設「軟體開發套件」(Software Development Kit,後簡稱SDK)。SDK是一個插件,會記錄手機主人使用App時的行為,包括App的使用頻率、時間長短、使用的地點等資訊。為了蒐集這些資訊,該數據公司也自己開發SDK,並大量與各種App廠商合作,這代表蒐集完上述資訊後,SDK就會定期回傳數據至開發的公司,做進一步分析。

此外,由於手機是非常個人化的載具,通常不會和他人共用,且每一台手機都配有一個自己獨特的「廣告ID」
一般廣告ID包括AdID (Android) 和 IDFA (Apple)。這類行動廣告ID不僅可讓開發人員和行銷人員基於廣告目的追蹤使用者活動,還能用於改善放送和指定功能。
,它是一個32碼的混合英數字,不同系統組合不一樣,iOS系統是全大寫,Android是全小寫。這個獨特的ID可以被視作手機的身分證,它不知道你真實是誰,卻可以透過ID辨識出這台手機過往的行為有哪些。

透過SDK蒐集手機上的詳細數據,並經由廣告ID來區分使用者行為,綜合這些技術,當使用者打開手機、點開App或用Facebook來瀏覽網頁時,手機便會送出「廣告請求」給廣告公司,讓他們決定在你的「廣告版位」秀出的內容,這就是決定每個人看到哪一種客製化廣告的時刻。

在Facebook上,每次按讚都反映你的喜好與類型

然而數據的蒐集,並不只透過手機一種渠道,廣為全球使用者所愛的Facebook也是十分熱門的管道。其中,專精於蒐集Facebook粉絲頁資料、並將自己定位為「最有口碑臉書大數據公司」的QSearch也早在這個社群平台上耕耘多年,周世恩就十分深諳此道。

我從一個人(在Facebook上)的按讚狀況和比例,就可以分析得出來他是喜歡你還是不喜歡你。因為一個人如果真的喜歡你的內容,基本上會有一定的回饋、黏著度或是互動,」他指出。

Fill 1
數據隱私、劍橋分析、數據公司、臉書、QSearch、周世恩、孔德廉、劉致昕
QSearch共同創辦人兼技術長周世恩解釋,數據公司可透過Facebook用戶對特定內容的互動,分析群眾對於某些內容的黏著度,作為接下來精準投放廣告或文宣的基礎。(攝影/ 蘇威銘)

在劍橋分析出現之前,幾乎每一個在Facebook粉絲頁上的公開互動,即可被像QSearch這類的數據公司所蒐集。周世恩解釋,他們的做法,主要是去分析每個人「按讚」的行為,只要對特定內容或文字按讚就會成為蒐集對象。再來,還會去蒐集使用者按讚和與文字互動的頻率,可能使用者對某些媒體按讚10次,就會得到前面一點的排名,藉此計算出群眾對於某些內容的黏著度。

有了這些分析,下一步,數據公司還可以對分眾的群體「做實驗」,依照群體對實驗的反應來判讀群眾真正的喜好,這是為了提升人們對廣告的回應程度,進一步轉化成實際的消費或是投票行為。

周世恩也以2014年的選戰為例,當時為了宣傳柯文哲的動保政見,QSearch找到所有對動物相關Facebook社團和粉絲頁按讚的人,先為他們貼上「喜愛動物」的標籤;下一步,再把柯文哲對動保的相關的政見、文章、影片、政策輪流對這群人推送,去看這群人按讚率表現。

「結果非常好。有多好?一般Facebook廣告平均的點擊率大約是2%,柯文哲的例子是20%,也就是投給5個人會有一個按讚,會花時間去看廣告,這樣的準確度已經不叫精準行銷,那叫洗腦。」對於那次清楚抓到受眾,精準投放廣告或文宣的操作經驗,周世恩回顧起來異常興奮。

橫跨政商,數據+廣告如何影響你我決策?

根基於群眾行為和認知心理學的技術,如今不只廣泛用於商業世界,在政治領域上更被徹底發揮。

沿著當時勝選的經驗,2017年QSearch就與中研院資訊所合作,正式將這樣的技術應用在「政治意識型態量化」上

探究這份報告,周世恩指出,大抵可以用「意識形態分數」來概括解釋,就是用分數來評估每個人的政治光譜。為此,他們鎖定了2016年台灣450個政治人物粉絲專頁上的資訊,包含2,800萬篇文章和53億個讚等行為,從中作出分析,建立了一個「大型矩陣」(註)
單一用戶的意識形態分數如何計算:若A用戶按了蔡英文粉絲貼文讚、按了洪秀柱粉絲頁讚、也按了李應元粉絲讚,則該用戶的分數為:蔡英文粉絲頁意識型態分數+洪秀柱粉絲頁意識型態分數+李應元粉絲頁意識型態分數加總計算。

在這份報告的結論中,也清楚提及,透過這樣的方程式,「政治意識形態分數」絕對可以應用於目前的政治競選活動中,有效幫助候選人和政黨在廣闊的網路中找到其受眾,並幫助政治人物使用有限的預算,來評估Facebook使用者對其政策的支持度。這份學術研究,因洞見數據分析的先機,一度登上歷史悠久的英國牛津大學《計算機》期刊(The Computer Journal)。

5個步驟,劍橋分析精準「洗腦」選民

但這樣精準投放的技術,其實更早就被惡名昭彰的劍橋分析公司,操作成一門炙手的生意,而影響範圍包括2016年美國總統大選、英國脫歐決策、菲律賓總統選舉,甚至將生意推廣到馬來西亞、立陶宛、肯亞和奈及利亞的政治選舉裡。其背後的原理與上述大致相同,但根據凱瑟透露,他們的背後有著更縝密的操作步驟:

第一階段:用「OCEAN計分法」分類選民

就如同上述標籤的概念,透過人們在Facebook按讚和互動行為中,劍橋分析將網路使用者細分成複雜而精確的群體。

第二階段:導入演算法,預測選民偏好

分眾之後,劍橋分析會運用自產的「演算法」,去預測每個人的偏好,並建立「預測模型」,甚至在美國,他們曾用量表,計算出美國人做某件事情的機率分數。例如預測投票的機率、屬於某個政黨的機率,或者更喜歡某種牙膏的機率。還能預測你有多大機率想聽到關於環境保護或是擁槍權的政策議題。

第三階段:找到選民最常使用的網路平台,餵食資訊

有了準確的模型,劍橋分析會將它們從演算法中得到的資料裡,再來研究使用者在推特、Facebook、和YouTube等社群平台裡的使用習慣,藉此找到使用者最常出沒的地點。

第四階段:開發遊說軟體「里彭」,將選民個資視覺化

為了打贏選戰,劍橋分析還開發了一款名為「里彭」(Ripon)的遊說軟體程式。這個程式能夠幫助選戰工作人員或電話拜票人員在接近選民住家或是打電話給選民時,直接看到該選民的個人資料。其中的資料視覺化工具,還能協助工作人員在選民開門或拿起電話之前,就提早擬定策略。

第五階段:運用「精準鎖定」技術,隨時監控選戰廣告觸及率

當一切就緒,劍橋分析最後會「精準鎖定」受眾,來投放團隊精心製作的個人化廣告內容(如影片、音訊和平面廣告)。

而在「精準鎖定」的過程中,可能會將同個廣告的30種不同版本各傳給某個使用者30次,每次都嘗試放在不同的社群媒體或動態消息頁面,這樣使用者才有可能點開廣告內容。一旦劍橋分析知道了這些資訊,創意人員(製作新內容的人)就能學到下次要如何更有效地傳遞訊息內容。

劍橋分析數據遊說的過程

只是,劍橋分析蒐集資訊和應用在政治場域的模式,在遭到揭露後引起軒然大波,該公司不僅在2018年倒閉,也連帶使得默許數據蒐集的Facebook,因「資料濫用」而被英國政府罰款50萬英鎊;隨後,Facebook也多次更改其隱私權政策,就是為了限制數據公司取得用戶的個人資料。

選舉新招:專屬App,假互動相挺之名獲取數據

不過數據蒐集與精準投放,已在全球掀起熱潮,腦筋動得快的商人們,早就將數據蒐集的陣地轉移到各種行動裝置和規範尚淺的社群媒體中。包含劍橋分析自己就曾經建議客戶使用App來蒐集用戶個資。

凱瑟透露,劍橋分析通常會為政治候選人製作一款App,或是和政治人物合作的廠商一起開發一款專屬的App。「理由很簡單,因為App可以透過手機的各種功能取得多種個人數據,像是你的通訊錄、你去哪裡、你網絡裡面有誰等敏感的個人資料,就能像拼圖一樣拼出你的個人樣貌,」她解釋。

她也強調,很多人以為App是候選人想要跟群眾有更多的互動,但其實這是一個取得群眾更多數據的方式,用來說服大家去做一些從來不會覺得自己會做的事,例如在某些議題下臨陣倒戈。而這一切,可能完全沒有人知道。

無獨有偶,2019年10月,台灣的App商店裡出現了一款名為「一支穿雲箭」的App,裡頭羅列了總統候選人韓國瑜的市政政績、國政願景以及造勢行程地點等,更與各種媒體平台串接,鼓勵使用者到新聞下方去替「黑韓文章」澄清,或是到「挺韓文章」下方幫忙讚聲。

解析「一支穿雲箭」,使用者行為、個資隱私全都露

但這款台灣選舉史上第一次出現的App,並非官方自製,根據媒體報導,「一支穿雲箭」是一位工程師自掏腰包的成果,純粹是因為不捨韓國瑜每天被誣陷才會有此奇想。

為了解析這款App背後的運作,《報導者》與亞洲公民資安社群「Civil Society Cyber Shield(CSCS)」 資安顧問Pellaeon Lin合作,產出一份分析報告。該報告內容顯示,包含使用者的Facebook基本資料(如果使用者以Facebook登入)、什麼時候打開App、在上面停留多久、是首次安裝還是安裝已久、手機機型、語系,甚至是使用者IP等個人資訊都會被蒐集起來,而這些資訊已經可以拼湊出相對完整的使用者習慣和行為,具體侵犯使用者隱私。

此外,該報告也指出,穿雲箭在蒐集使用者資料前,並沒有主動徵詢使用者同意,在應用程式當中也沒有檢視其隱私權政策和使用條款的功能。更具體地說明,就是在Google應用程式商店中,穿雲箭的隱私權政策完全是自動生成的簡易範本,並非適用在App上;因此,它在隱私權政策當中所載明會蒐集的個資,也與應用程式實際蒐集的個資不符。

未經詳細劃設的隱私權政策,代表的是對每個使用者隱私的侵犯。另一位具有10年廣告經歷、5年數據分析經驗的工程師Ray從穿雲箭的後台數據來看,也提出了不同面向。他指出,穿雲箭採用了與「廣告ID」相同的格式,也可能運用了「Firebase」的功能。

對此他說明,若運用了「Firebase」服務,就能讓開發者將蒐集而來的資訊打進Google資料庫裡,之後,只要利用Google資料庫就能產出App使用者的輪廓分析報告,像年紀、區間分布、性別、興趣分布等。

有了這些資訊,等於讓使用者的隱私一絲不掛地呈現在App開發者眼前,但面對這些架構與劃設的實質用途為何,開發者始終沒有出面清楚說明。

逾1.8萬款App,侵犯使用者隱私

「若穿雲箭真的使用廣告ID,就有其特殊意義,這代表APP的開發者十分有數位行銷的概念,因為透過廣告ID蒐集起來的數據,可以變成一個受眾包,這個受眾包可以拿去Google或Facebook上面,針對死忠粉絲來投放廣告,甚至可以經由演算法分析,找到更多韓國瑜的支持者,」他解釋道。

Ray在研究穿雲箭App後,判定它是一個非常具有「前瞻性」的產品。他強調,過往候選人的數據蒐集做得並不多,但透過像這樣具備數位行銷導向的App,就可以培養出死忠的支持者,然後進一步去放大、擴及更多使用者。

只是,在其隱私權政策不完整的情況之下,App使用者的隱私該如何被保障?

根據經濟部工業局在2019年頒布的「行動應用App基本資安檢測基準V3.1」中,明確指出,關於安全敏感性資料
經濟部工業局「行動應用APP基本資安規範」中註明安全敏感性資料(Secure Sensitive Data)指依使用者行為或行動應用程式之運作,於行動裝置及其附屬儲存媒介建立、儲存或傳輸之資訊,其中對個人隱私之資料之存取便屬於蒐集、儲存於本地空間內即屬儲存,而該資訊之洩漏有對使用者造成損害之虞,除包括上述定義之個人資料之外,並包含但不限定通行碼、金鑰、視訊、照片、通話、錄音檔、即時通訊訊息、通話紀錄、簡訊、備忘錄、通訊錄、筆記、地理位置、行事曆及裝置識別符等有關個人隱私之資料。
的蒐集、儲存及利用,都應該取得使用者同意,並提供使用者拒絕的權利。但顯然,「一支穿雲箭」並沒有選擇遵守。
但類似侵犯使用者隱私的行為,穿雲箭也並非特例。根據專門從事App安全暨隱私研究的AppCensus指出,2018年9月已有超過1.8萬款的Android App違反了Google商店中的的廣告ID追蹤政策,因為這些App不只蒐集手機的廣告ID,還會私下傳送手機的永久識別資訊
永久識別資訊包含SSAID、WiFi MAC地址、IMEI等,皆是不可重設的項目,透過比對,可以有效判定個人化身份,而為了保護使用者的隱私,Google政策嚴格規定,凡是Google可用作或認定為個人識別資訊的資料,均不得傳送給Google。
等;而這些資訊通通會被利用在精準投放廣告、追蹤使用者與廣告互動等商業用途上。

新時代政治賭局:人民作主?或被數據左右?

Fill 1
候選人App、隱私、政治賭局、一支穿雲箭
台灣選舉史上首次出現的App「一支穿雲箭」,應用程式中沒有檢視其隱私權政策和使用條款的功能,在蒐集使用者資料前,也沒有主動徵詢使用者同意,以及提供使用者拒絕的權利。(攝影/吳逸驊)

無論是遙遠的劍橋分析、還是觸手可及的一隻穿雲箭App,每一個活在現代數位社會裡的人,隱私幾乎無所遁形。不管是你每天上的Facebook,或是隨身攜帶的手機,我們的一舉一動,時時刻刻都被蒐集著。

從消費動員到政治上的情緒動員,這條界線現在已經愈來愈模糊了。

一名不願具名的數據專家表示,自己已經將能追蹤自己數位足跡的一切工具全數關閉。他強調,「在消費行為中,每個人其實有自己的主權;但將數據應用在政治操作上是不一樣的,它影響的是社會上的所有人,況且政治應用將破壞掉數據本身的客觀中立性,因為政治訊息本身的影響就是難以掌控的。」

即便如此,數據分析的政治運用,早就成為一門好生意。作為政治操作的領頭羊,凱瑟則反思道,「我認為這是人們非常需要重新思考的事,因為你只要閱讀使用條款,就會發現每天使用的那些基本的App,其實蒐集了你各種的資料,試圖要了解你,我們應該對於我們交出去的東西,更有意識才行。」

在高喊大數據時代的氛圍裡,我們都以為自己決定能接收什麼東西,但事實上,是資本和數據替我們決定了要看什麼東西。數據已成為現代社會中最有效的政治籌碼,能輕易左右我們的民主,供政治人物在賭局裡拿著我們的喜好對賭。

這一切狀況,就如同周世恩形容的,一點點資料累積沒什麼,像雪花一樣;但若持續累積,那是會造成雪崩的。山腳下的城市面臨極大威脅。

我們所有人,正待在山腳下歇息,亳無防備。少數能抵禦的方式,除了詳細閱讀每一項隱私權政策到底拿走了我們什麼東西,再不然,就是減少數位足跡被追蹤的可能。畢竟在現代數位社會中,數據的價值早已超過原油,看見個人資產正在無限制地遭到數位禿鷹們掠奪,我們不能再視若無睹了。

索引
誰扮演上帝?無所不在的即時監控網
橫跨政商,數據+廣告如何影響你我決策?
選舉新招:專屬App,假互動相挺之名獲取數據
新時代政治賭局:人民作主?或被數據左右?

用行動支持報導者

優質深度報導必須投入優秀記者、足夠時間與大量資源⋯⋯我們需要細水長流的小額贊助,才能走更長遠的路。 竭誠歡迎認同《報導者》理念的朋友贊助支持我們!

報導後續影響,可參考《報導者》影響力報告

本文依 CC 創用姓名標示-非商業性-禁止改作3.0台灣授權條款釋出