國際時事
從美國總統大選看民調「測不準」現象

2016年底的美國總統大選,主流媒體與傳統民調組織,多顯示希拉蕊領先;反而是異於傳統調查方法的學者與民調單位,斷言川普當選。事實上,近來許多西方國家媒體與機構的民調,普遍表現不佳,而且誤差範圍逐漸擴大,究竟是什麼原因?

美國上屆大選,兩大黨推派的候選人原本客觀條件懸殊,希拉蕊(Hillary Clinton)曾任4年國務卿、8年參議員、8年第一夫人、法律援助機構辯護律師、國會法律顧問,12年州長夫人期間,她還是全美影響力前百大律師。30多年公職生涯縱有零星爭議,她的從政經驗、論述能力、專業形象與繳稅紀錄,明顯優於對手。
憑藉實境節目《誰是接班人》塑造成功地產大亨形象的川普(Donald Trump)曾是民主黨黨員,2009年才投靠共和黨,他自戀且難以捉摸的行事風格,讓黨內同志大感吃不消,155名同黨議員斷然劃清界線。他口無遮攔又信口開河,但砲轟政府、攻擊對手的激進言詞,卻讓許多不滿現況的美國人感覺出了口怨氣,願意相信他能恢復美國昔日榮景,他那「Make America Great Again」競選口號,吸引力猶如當年陳水扁的「有夢最美,希望相隨」。
從選前網友反應來看,川普人氣遙遙領先,他的推特有1,300萬追蹤者、臉書有1,210萬粉絲,很多支持者還在YouTube開頻道播送他的政見與幹譙內容;而希拉蕊的推友1,020萬、臉書粉絲800萬,YouTube上的非官方頻道,多數是為了羞辱她,她與川普3場辯論的影片,下方留言大多為川普喝采。
各媒體與機構的民調數字,卻反映相反情況,即便是聯邦調查局(FBI)宣布重啟希拉蕊電郵案的調查,並公布其夫婿特赦遭通緝的富豪友人(註1)
FBI先於10月28日報告眾議院,就希拉蕊使用個人電郵處理公務是否危害國家安全一案,有必要重啟調查,原因是在調查其他案件過程中,發現另一批相關信件。
FBI並於11月1日無預警公開一批調查檔案,內容顯示,柯林頓在總統任期最後一天,赦免因逃稅等罪名遭通緝20年的猶太富豪李奇(Marc Rich),李奇的妻子多次捐款支持希拉蕊的參議院競選、柯林頓基金會,內情似乎不單純,但FBI最終以查無不法結案。
,重創柯林頓夫婦信譽,但多數主流媒體與組織民調仍顯示,希拉蕊領先對手。
RealClear PoliticsFiveThirtyEightHuffpost Pollster等美國3大民調蒐集網站與彭博社資料來看,希拉蕊仍保持3到6個百分點的領先,《紐約時報》、《華爾街日報》、《華盛頓郵報》、《經濟學人》等多數台灣人較熟悉的權威媒體民調,都顯示希拉蕊領先。
網路人氣、媒體民調迥異的情況,讓川普大喊民調造假,指控對手不惜作弊贏得選舉。唯一例外是《洛杉磯時報》與南加州大學朵恩塞夫學院(USC Dornsife)合作的「破曉民調」(Daybreak Poll)數據顯示,川普10月下旬選情回溫,逐漸拉開領先幅度,35歲以上選民多數挺他。(註2)
不同於多數民調讓受訪者2選1,Daybreak每天隨機抽樣3,000人(誤差1.8%),詢問支持每位候選人的程度,以數字0(死都不願意)~100(全心支持)回覆,分數越高統計時加權值越高。
2012年美國總統大選,民調普遍預測歐巴馬會輸給對手羅姆尼(Mitt Romney),Daybreak 則推估歐巴馬贏3.32%,選舉結果歐巴馬得票率較羅姆尼多出3.85%。Daybreak的準確率,FiveThirtyEight 評為「A-」,與《紐約時報》、《華爾街日報》相當。
儘管主流媒體民調不賞臉,卻有2名學者引用歷史資料彙整的評估原則,斷言川普贏面大很多。美國紐約州立大學石溪分校(Stony Brook University)政治學教授諾帕(Helmut Norpoth)分析歷屆大選,歸納出2個預測模型:初選模型、搖擺效益模型,並成功預測過去5任勝選總統。(註3)
過去5次,美國大選有3次兩黨實力都在伯仲之間,2000年(布希vs.高爾)、2004年(布希vs.凱瑞)、2012年(歐巴馬vs.羅姆尼)選前情勢都陷入膠著。這次諾帕預測,川普勝選機率為97%。
初選模型( the Primary model)是指,1912年至今,初選過程表現較佳的候選人,通常在大選時能夠勝出。這次兩黨初選期間,川普遙遙領先對手群,希拉蕊與桑德斯(Bernard Sanders)差距卻逐漸縮小。鐘擺效應模型(Swing of the Pendulum model)則是指,1960年至今,政黨連續2任入主白宮的機率是54.7%,之後再繼續執政的機率下滑到49.4%。
美國政治史學家李特曼(Allan Lichtman)1981年發表大選預測理論〈入主白宮13關鍵〉,成功預測之後30多年的8任總統當選人,他也斷言川普勝出。他分析1860年到1980年間的總統大選,歸納出影響「執政黨」續任與否的13個關鍵是非題(見下表),得分越高、施政成績越好,「錯」6題以上就會選輸,民主黨這次便有6題失分。
Fill 1
入主白宮13關鍵問題/歐巴馬政府得分:李特曼9月底受訪時,表示若獨立參選人票數陡然降至5%以下,民主黨仍有可能勝選。資料來源:《華盛頓郵報》(http://wapo.st/2f9zFi4)
入主白宮13關鍵問題/歐巴馬政府得分:李特曼9月底受訪時,表示若獨立參選人票數陡然降至5%以下,民主黨仍有可能勝選。資料來源:《華盛頓郵報》(http://wapo.st/2f9zFi4)
在李特曼眼中,川普是前所未見的候選人,他信口胡謅、性醜聞纏身、拒絕公布稅務資料、還公開讚揚俄羅斯獨裁者⋯⋯照理說不會當選的這位非典型候選人,正適合用來檢驗預測系統的準確性,或是他落選了,便是一舉推翻了過去150年的當選模式。
相較於學者們有憑有據的正確預測紀錄,西方國家媒體與機構的民調,其實普遍表現不佳,而且近年誤差範圍逐漸擴大,只是,理由並非川普懷疑的人為操縱、造假。

歐美民調結果,頻頻跌破眼鏡

以英國6月脫歐公投為例,公投前,傳統機構民調、市場預測、賭盤趨勢一面倒預測「留歐」勝出;公投當天,指標機構YouGov的出口民調仍顯示,留歐派得票52%。結果卻剛好相反,不僅跌破大家眼鏡,民調界心情更加沈重,因為前一年大選民調預測,同樣錯得一踏糊塗!
2015年5月選前,英國民調普遍預測,執政的保守黨無法保住過半席次,時任黨魁的首相卡麥隆(David Cameron)淨支持度降至-22%(註4)
支持度-22%代表,反對者多出22個百分點。
,頂多拿到三分之一選票,必須籌組聯合政府,甚至把大位輸給工黨黨魁米勒班(Ed Miliband)。選舉結果卻是,保守黨取得過半席次,獲得25年來難得的重大勝利。
大西洋彼岸的美國,民調表現也不靠譜。2012年歐巴馬競選連任,選舉日前夕,包括蓋洛普、親民主黨機構在內的民調結果,多數預測對手羅姆尼勝出。開票結果:民主黨總得票數領先3.9%,拿到332張選舉人票。2014年中期選舉,民調預測更是錯得離譜,共和黨在國會兩院、州長選舉大勝,但選前預測卻嚴重低估。
另外,2015年3月以色列大選,總理納坦亞胡(Benjamin Netanyahu)成功二度連任;同年10月加拿大自由黨取得歷史性大勝;9月希臘國會大選,推翻紓困案公投結果而下台的前總理齊普拉斯(Alexis Tsipras)班師回朝;6月西班牙大選,極左派滑鐵盧;7月澳洲大選現任總理滕博爾(Malcolm Turnbull)與執政黨贏得過半席次等等各國大選結果,都與民調預測大不相同。
由此可知,選舉民調測不準,並非個別機構的失誤,也促使學者、民調研究或產業協會投入大規模研究。從陸續發表的報告來看(註5)
參見2016年3月發布的《2015年英國大選民調探究報告》、10月發布的《選舉民調偏差與變異量數解析
,民調偏差可能比業者承認的糟糕。史丹佛大學、哥倫比亞大學與微軟近期發表一份研究報告,他們追蹤1998年到2014年間美國各州總統、國會與州長選舉的4,221個選前最後民調,與開票結果相比,1,000人的調查平均誤差範圍達±7%,而不是一般宣稱的3%。

民調不準,出了哪些問題?

以《福斯》民調為例,11月1日~3日間,希拉蕊、川普支持率分別是46%、45%,誤差範圍±7代表著,希拉蕊支持率介於39%~53%、川普為38%~52%,這樣來看,多數民調預測都在差不多區間。
民調不準確的原因──排除刻意造假的情況──則包括:抽樣代表性不足、民調回覆率過低、民調設計不良、受訪者不願吐實、游離票比例過高等原因,分別簡單說明如下,有助於進一步對照台灣情況。
首先、抽樣不具代表性,投票意願難測。民調業者決定樣本特性時,會參考當地人口特性,但具有投票資格的人,不見得是真正去投票的人,民主國家多採「不記名」投票,政府不可能釋出領票紀錄,開票結果只能算出投票率,真正選民結構仍然是謎。選舉當天的出口民調(註6)
2015年5月7日英國大選當天,英國選舉研究(British Election Study)調查人員,在300個選區完成3000人的面對面民調,結果吻合開票結果。由此可知,只要樣本分布夠平均,就能測出準確民意。
,有助於業者調整採樣模型,但選民關切議題各不相同,這次有投票的,下次可能不會。
業者只能推論出自認可靠的選民結構、權重,來估算民調數字(註7)
研究指出,民調業者的採樣,無法避免傾向單一政黨,像是普遍高估或低估民主黨得票,每回選舉偏向不同,但通常蠻一致的。
。美國18歲以上具投票資格的人口約2.22億,註冊選民約1.53億,約有1.3億人(60%)會投票,但即便知道人口組成以及各種族、性別、教育程度、經濟條件、年齡層族群的政黨偏好,仍不能確知各地實際選民結構。《紐時》曾將相同民調的原始資料交給4家信譽良好的機構分析,由於各自認定的選民結構不同,最終得出4種與《紐時》不同的結論。
第二、民調回覆率過低,不確定漏掉哪個族群。1990年代的美國,民調回覆率約35%,打室話很容易找到人,如今回覆率不到10%,有些業者必須打40通電話才有1人願意回覆。雖然可以透過手機、網路(電子郵件)多管齊下,但室話、手機或網路的使用者,人口結構不同,又該如何整併數據?(註8)
根據報導與學者俞振華的看法,接室話的多是婦女與老人家,手機族可能會過濾陌生來電,或上班、上課時不方便接電話,Email 民調可能被當垃圾郵件,網頁民調不是隨機抽樣,通常吸引好惡強烈的人,不具備代表性。因此,有的民調業者選擇分開統計,而不是合併計算。
還有一群人口黑數,他們不接電話、不用網路或只潛水,同樣無法估計人數、特性、投票意願。因此,就算樣本的人口比例正確,可能仍無法取得相應的回覆數,難找的類型(如非裔年輕男性)1人回覆可能影響0.5%或更高,找錯人就會錯很大。
第三、提問方式、內容會影響回覆意願、正確性。有經驗的民調人員,能提高答題的回覆率、正確性,像是藉由詢問投票紀錄來確認投票意願,或是透過政黨支持度、施政滿意度,推估不願明講的心儀候選人,因此電訪或面對面民調的準確性、回覆率,會比機器民調好,但後者成本只有十分之一。
民調問題方面,字句太複雜或模稜兩可,受訪者可能會答錯。脫歐公投民調研究就發現,對英國人來說,「保留現況(Remain)」不等於「留歐」,很多希望脫歐的民眾以為,「保留現狀」是阻止歐盟影響擴大,因此留歐民調被高估,可能就是很多人答錯了。
此外,當社會氛圍對立或選情一面倒,不受歡迎或落後方的支持者可能就不想說實話,像是留歐派工黨議員柯克斯(Jo Cox)在公投前一周遭槍殺,一度衝高留歐民調數字,事後分析應該是,凶案發生後,脫歐民眾保持沉默、卻沒有改變心意。至於最後一刻才決定心意的游離票,影響很有限(註9)
選前兩週還在猶豫的選民比例,美國不到1成,台灣大約1成,英國近年比例較高,達2至4成。
台灣的選舉民調,是否也遭遇相同問題:選民結構模糊?民調回覆率低?受訪者不說真話?
若民調不正確,會有什麼影響?2004年總統大選爭議,幾十萬民眾上街抗議選舉舞弊,國民黨提起選舉無效訴訟,主因就是開票結果遠低於民調預測。後來司法驗票證實陳呂配票數勝出,那麼,問題其實出在當年民調「過度高估」連宋配的支持度嗎?

台灣個資保護,增加民調難度

台灣民調遭遇的問題接近歐美情況,台灣《個人資料保護法》禁止政府逕自提供個人隱私資料給外界,同時為了避免干擾選舉,拒絕公開選舉人名冊的領票紀錄,用於學術研究也不行,所以台灣民調界無法透過實際投票資料,驗證樣本的正確性。台灣出口民調也很少,因為很快就能知道開票結果。
除了樣本問題,室話、手機、網路族群能夠接觸到的民眾類型不一,該如何彙整資料,產學間還沒有定見,需要更多嘗試與驗證。至於民調回覆率,政大等學術單位推估大約介於5%~10%之間,也就是為了取得1,067筆回覆,至少要撥打1萬~2萬個電話號碼。
但是回覆率低不代表取樣沒有代表性,政治大學選舉研究中心副研究員俞振華受訪時解釋,有些機構取得的電話號碼只有室話前4碼,無法很有效率的排除空號,行動電話也是一樣道理,這些都是回覆率偏低的可能原因。政大選研中心會事先發簡訊通知,來提高手機族的回覆意願,目前也與中研院開發新的抽樣模式,希望透過「地理位置」的隨機抽樣,擴大樣本的代表性。
俞振華不否認,2004年選舉爭議,可能跟民調預測錯誤有關,他解釋,2004年陳呂連宋兩組候選人,得票數那麼接近,沒有民調能預估得出來。正因為民調過程的諸多不確定因素,與其在意民調數字,不如多觀察變化趨勢,相同調查方式儘管有偏差,變化趨勢仍有參考價值。他特別強調:
「選舉民調是預測,不是底牌,若把預測當底牌,一旦開票有落差,就可能發生爭議。」
至於美國大選前民調哪個可靠?俞振華看法是,不管誰領先,多數民調都在誤差範圍內,還是要看關鍵搖擺州的開票結果。從趨勢來看,FBI宣布重新調查希拉蕊電郵案、或公開柯林頓特赦富豪、甚至川普性騷擾醜聞,並未真正改變選情態勢,事件剛發生時的民調變化,總會慢慢彈回來。他相信,FBI 目的不是影響選情,絕大多數人也不會改變投票決定。 (註10)
FBI 大量增加人力、加快調查速度後,11月6日書面告知國會,未發現違法事證,因此維持之前結論:不建議起訴希拉蕊,可說是還她清白。
Fill 1
2016美國總統大選民調變化:俞振華認為,這次選舉希拉蕊、川普的基本盤變化不大,個別事件造成的民調波動都回逐漸彈回。圖片來源:RealClearPolitics(http://bit.ly/1foXXRS)
2016美國總統大選民調變化:俞振華認為,這次選舉希拉蕊、川普的基本盤變化不大,個別事件造成的民調波動都回逐漸彈回。圖片來源:RealClearPolitics(http://bit.ly/1foXXRS)
尤其兩位候選人的類型,俞振華認為,有一定相似性。川普看似吸引大批中低教育水準的白人階層,但他們支持川普多基於經濟因素、而非共和黨傳統保守觀點,還有一大批支持者(兩黨都有)是因為討厭希拉蕊才支持川普,當然也有很多人因為厭惡川普而支持希拉蕊,這些賭爛選民像鐵板一塊、難以鬆動,那些負面選戰打法,明顯要激出賭爛族出來含淚投票、或忍住不投票。

如何正確解讀民調數字?

既然民調測不準才是常態,你我又該如何看待各種民調數字?美國全國民意調查委員會(The National Council on Public Polls, NCPP)2004年發布的《面對民調,記者應該要問的20個問題》、美國民意研究協會(American Association for Public Opinion Research, AAPOR)2016年發布的《今日複雜環境下評估民調品質的17個問題》都值得參考。
兩文件建議大家注意必須揭露的資訊(Transparency)、調查範圍(Coverage)、樣本選擇(Sampling)、未回覆情況(Nonresponse)、調查方法(Measurement)等因素,甚至比較其他同類民調的結果,來判斷民調的參考或報導價值,同時留意個別民調本質上的偏差。
至於要不要出門投票?與其參考民調、考慮政黨宣傳的棄保效應,不如好好思考民主選舉對於個人的意義吧。
【參考資料】
對於台灣選舉民調實務與學理有興趣的讀者,可進一步參考2014年12月12日台大政治系舉辦的專題演講《誰最準?以2014臺北市長選舉為例比較次數機率學派、貝氏學派與預測市場》,由3位民調學者、業者以上屆地方選舉為例,說明台灣民調準確性的影響因素。
美國18歲以上人口、註冊選民人數,各資料來源說法不同,若有官方更新數字,隨時更新。

用行動支持報導者

優質深度報導必須投入優秀記者、足夠時間與大量資源⋯⋯我們需要細水長流的小額贊助,才能走更長遠的路。 竭誠歡迎認同《報導者》理念的朋友贊助支持我們!

本文依 CC 創用姓名標示-非商業性-禁止改作3.0台灣授權條款釋出

延伸閱讀

載入更多文章