從美國總統大選看民調「測不準」現象

國際時事

從美國總統大選看民調「測不準」現象

政治社會

政策

2016/11/6

文字

組合照片／AFP PHOTO

2016年底的美國總統大選，主流媒體與傳統民調組織，多顯示希拉蕊領先；反而是異於傳統調查方法的學者與民調單位，斷言川普當選。事實上，近來許多西方國家媒體與機構的民調，普遍表現不佳，而且誤差範圍逐漸擴大，究竟是什麼原因？

美國上屆大選，兩大黨推派的候選人原本客觀條件懸殊，希拉蕊（Hillary Clinton）曾任4年國務卿、8年參議員、8年第一夫人、法律援助機構辯護律師、國會法律顧問，12年州長夫人期間，她還是全美影響力前百大律師。30多年公職生涯縱有零星爭議，她的從政經驗、論述能力、專業形象與繳稅紀錄，明顯優於對手。

憑藉實境節目《誰是接班人》塑造成功地產大亨形象的川普（Donald Trump）曾是民主黨黨員，2009年才投靠共和黨，他自戀且難以捉摸的行事風格，讓黨內同志大感吃不消，155名同黨議員斷然劃清界線。他口無遮攔又信口開河，但砲轟政府、攻擊對手的激進言詞，卻讓許多不滿現況的美國人感覺出了口怨氣，願意相信他能恢復美國昔日榮景，他那「Make America Great Again」競選口號，吸引力猶如當年陳水扁的「有夢最美，希望相隨」。

從選前網友反應來看，川普人氣遙遙領先，他的推特有1,300萬追蹤者、臉書有1,210萬粉絲，很多支持者還在YouTube開頻道播送他的政見與幹譙內容；而希拉蕊的推友1,020萬、臉書粉絲800萬，YouTube上的非官方頻道，多數是為了羞辱她，她與川普3場辯論的影片，下方留言大多為川普喝采。

各媒體與機構的民調數字，卻反映相反情況，即便是聯邦調查局（FBI）宣布重啟希拉蕊電郵案的調查，並公布其夫婿特赦遭通緝的富豪友人（註1）

FBI先於10月28日報告眾議院，就希拉蕊使用個人電郵處理公務是否危害國家安全一案，有必要重啟調查，原因是在調查其他案件過程中，發現另一批相關信件。

FBI並於11月1日無預警公開一批調查檔案，內容顯示，柯林頓在總統任期最後一天，赦免因逃稅等罪名遭通緝20年的猶太富豪李奇（Marc Rich），李奇的妻子多次捐款支持希拉蕊的參議院競選、柯林頓基金會，內情似乎不單純，但FBI最終以查無不法結案。

，重創柯林頓夫婦信譽，但多數主流媒體與組織民調仍顯示，希拉蕊領先對手。

從RealClear Politics、FiveThirtyEight、Huffpost Pollster等美國3大民調蒐集網站與彭博社資料來看，希拉蕊仍保持3到6個百分點的領先，《紐約時報》、《華爾街日報》、《華盛頓郵報》、《經濟學人》等多數台灣人較熟悉的權威媒體民調，都顯示希拉蕊領先。

網路人氣、媒體民調迥異的情況，讓川普大喊民調造假，指控對手不惜作弊贏得選舉。唯一例外是《洛杉磯時報》與南加州大學朵恩塞夫學院（USC Dornsife）合作的「破曉民調」（Daybreak Poll）數據顯示，川普10月下旬選情回溫，逐漸拉開領先幅度，35歲以上選民多數挺他。（註2）

不同於多數民調讓受訪者2選1，Daybreak每天隨機抽樣3,000人（誤差1.8％），詢問支持每位候選人的程度，以數字0（死都不願意）～100（全心支持）回覆，分數越高統計時加權值越高。

2012年美國總統大選，民調普遍預測歐巴馬會輸給對手羅姆尼（Mitt Romney），Daybreak 則推估歐巴馬贏3.32％，選舉結果歐巴馬得票率較羅姆尼多出3.85％。Daybreak的準確率，FiveThirtyEight 評為「A-」，與《紐約時報》、《華爾街日報》相當。

儘管主流媒體民調不賞臉，卻有2名學者引用歷史資料彙整的評估原則，斷言川普贏面大很多。美國紐約州立大學石溪分校（Stony Brook University）政治學教授諾帕（Helmut Norpoth）分析歷屆大選，歸納出2個預測模型：初選模型、搖擺效益模型，並成功預測過去5任勝選總統。（註3）

過去5次，美國大選有3次兩黨實力都在伯仲之間，2000年（布希vs.高爾）、2004年（布希vs.凱瑞）、2012年（歐巴馬vs.羅姆尼）選前情勢都陷入膠著。這次諾帕預測，川普勝選機率為97％。

初選模型（ the Primary model）是指，1912年至今，初選過程表現較佳的候選人，通常在大選時能夠勝出。這次兩黨初選期間，川普遙遙領先對手群，希拉蕊與桑德斯（Bernard Sanders）差距卻逐漸縮小。鐘擺效應模型（Swing of the Pendulum model）則是指，1960年至今，政黨連續2任入主白宮的機率是54.7％，之後再繼續執政的機率下滑到49.4％。

美國政治史學家李特曼（Allan Lichtman）1981年發表大選預測理論〈入主白宮13關鍵〉，成功預測之後30多年的8任總統當選人，他也斷言川普勝出。他分析1860年到1980年間的總統大選，歸納出影響「執政黨」續任與否的13個關鍵是非題（見下表），得分越高、施政成績越好，「錯」6題以上就會選輸，民主黨這次便有6題失分。

美國,總統,選舉,白宮 — 入主白宮13關鍵問題／歐巴馬政府得分：李特曼9月底受訪時，表示若獨立參選人票數陡然降至5％以下，民主黨仍有可能勝選。資料來源：《華盛頓郵報》(http://wapo.st/2f9zFi4）

在李特曼眼中，川普是前所未見的候選人，他信口胡謅、性醜聞纏身、拒絕公布稅務資料、還公開讚揚俄羅斯獨裁者⋯⋯照理說不會當選的這位非典型候選人，正適合用來檢驗預測系統的準確性，或是他落選了，便是一舉推翻了過去150年的當選模式。

相較於學者們有憑有據的正確預測紀錄，西方國家媒體與機構的民調，其實普遍表現不佳，而且近年誤差範圍逐漸擴大，只是，理由並非川普懷疑的人為操縱、造假。

歐美民調結果，頻頻跌破眼鏡

以英國6月脫歐公投為例，公投前，傳統機構民調、市場預測、賭盤趨勢一面倒預測「留歐」勝出；公投當天，指標機構YouGov的出口民調仍顯示，留歐派得票52％。結果卻剛好相反，不僅跌破大家眼鏡，民調界心情更加沈重，因為前一年大選民調預測，同樣錯得一踏糊塗！

2015年5月選前，英國民調普遍預測，執政的保守黨無法保住過半席次，時任黨魁的首相卡麥隆（David Cameron）淨支持度降至-22％（註4）

支持度-22％代表，反對者多出22個百分點。

，頂多拿到三分之一選票，必須籌組聯合政府，甚至把大位輸給工黨黨魁米勒班（Ed Miliband）。選舉結果卻是，保守黨取得過半席次，獲得25年來難得的重大勝利。

大西洋彼岸的美國，民調表現也不靠譜。2012年歐巴馬競選連任，選舉日前夕，包括蓋洛普、親民主黨機構在內的民調結果，多數預測對手羅姆尼勝出。開票結果：民主黨總得票數領先3.9％，拿到332張選舉人票。2014年中期選舉，民調預測更是錯得離譜，共和黨在國會兩院、州長選舉大勝，但選前預測卻嚴重低估。

另外，2015年3月以色列大選，總理納坦亞胡（Benjamin Netanyahu）成功二度連任；同年10月加拿大自由黨取得歷史性大勝；9月希臘國會大選，推翻紓困案公投結果而下台的前總理齊普拉斯（Alexis Tsipras）班師回朝；6月西班牙大選，極左派滑鐵盧；7月澳洲大選現任總理滕博爾（Malcolm Turnbull）與執政黨贏得過半席次等等各國大選結果，都與民調預測大不相同。

由此可知，選舉民調測不準，並非個別機構的失誤，也促使學者、民調研究或產業協會投入大規模研究。從陸續發表的報告來看（註5）

參見2016年3月發布的《2015年英國大選民調探究報告》、10月發布的《選舉民調偏差與變異量數解析》

，民調偏差可能比業者承認的糟糕。史丹佛大學、哥倫比亞大學與微軟近期發表一份研究報告，他們追蹤1998年到2014年間美國各州總統、國會與州長選舉的4,221個選前最後民調，與開票結果相比，1,000人的調查平均誤差範圍達±7％，而不是一般宣稱的3％。

民調不準，出了哪些問題？

以《福斯》民調為例，11月1日～3日間，希拉蕊、川普支持率分別是46％、45％，誤差範圍±7代表著，希拉蕊支持率介於39％～53％、川普為38％～52％，這樣來看，多數民調預測都在差不多區間。

民調不準確的原因──排除刻意造假的情況──則包括：抽樣代表性不足、民調回覆率過低、民調設計不良、受訪者不願吐實、游離票比例過高等原因，分別簡單說明如下，有助於進一步對照台灣情況。

首先、抽樣不具代表性，投票意願難測。民調業者決定樣本特性時，會參考當地人口特性，但具有投票資格的人，不見得是真正去投票的人，民主國家多採「不記名」投票，政府不可能釋出領票紀錄，開票結果只能算出投票率，真正選民結構仍然是謎。選舉當天的出口民調（註6）

2015年5月7日英國大選當天，英國選舉研究（British Election Study）調查人員，在300個選區完成3000人的面對面民調，結果吻合開票結果。由此可知，只要樣本分布夠平均，就能測出準確民意。

，有助於業者調整採樣模型，但選民關切議題各不相同，這次有投票的，下次可能不會。

業者只能推論出自認可靠的選民結構、權重，來估算民調數字（註7）

研究指出，民調業者的採樣，無法避免傾向單一政黨，像是普遍高估或低估民主黨得票，每回選舉偏向不同，但通常蠻一致的。

。美國18歲以上具投票資格的人口約2.22億，註冊選民約1.53億，約有1.3億人（60％）會投票，但即便知道人口組成以及各種族、性別、教育程度、經濟條件、年齡層族群的政黨偏好，仍不能確知各地實際選民結構。《紐時》曾將相同民調的原始資料交給4家信譽良好的機構分析，由於各自認定的選民結構不同，最終得出4種與《紐時》不同的結論。

第二、民調回覆率過低，不確定漏掉哪個族群。1990年代的美國，民調回覆率約35％，打室話很容易找到人，如今回覆率不到10％，有些業者必須打40通電話才有1人願意回覆。雖然可以透過手機、網路（電子郵件）多管齊下，但室話、手機或網路的使用者，人口結構不同，又該如何整併數據？（註8）

根據報導與學者俞振華的看法，接室話的多是婦女與老人家，手機族可能會過濾陌生來電，或上班、上課時不方便接電話，Email 民調可能被當垃圾郵件，網頁民調不是隨機抽樣，通常吸引好惡強烈的人，不具備代表性。因此，有的民調業者選擇分開統計，而不是合併計算。

還有一群人口黑數，他們不接電話、不用網路或只潛水，同樣無法估計人數、特性、投票意願。因此，就算樣本的人口比例正確，可能仍無法取得相應的回覆數，難找的類型（如非裔年輕男性）1人回覆可能影響0.5％或更高，找錯人就會錯很大。

第三、提問方式、內容會影響回覆意願、正確性。有經驗的民調人員，能提高答題的回覆率、正確性，像是藉由詢問投票紀錄來確認投票意願，或是透過政黨支持度、施政滿意度，推估不願明講的心儀候選人，因此電訪或面對面民調的準確性、回覆率，會比機器民調好，但後者成本只有十分之一。

民調問題方面，字句太複雜或模稜兩可，受訪者可能會答錯。脫歐公投民調研究就發現，對英國人來說，「保留現況（Remain）」不等於「留歐」，很多希望脫歐的民眾以為，「保留現狀」是阻止歐盟影響擴大，因此留歐民調被高估，可能就是很多人答錯了。

此外，當社會氛圍對立或選情一面倒，不受歡迎或落後方的支持者可能就不想說實話，像是留歐派工黨議員柯克斯（Jo Cox）在公投前一周遭槍殺，一度衝高留歐民調數字，事後分析應該是，凶案發生後，脫歐民眾保持沉默、卻沒有改變心意。至於最後一刻才決定心意的游離票，影響很有限。（註9）

選前兩週還在猶豫的選民比例，美國不到1成，台灣大約1成，英國近年比例較高，達2至4成。

台灣的選舉民調，是否也遭遇相同問題：選民結構模糊？民調回覆率低？受訪者不說真話？

若民調不正確，會有什麼影響？2004年總統大選爭議，幾十萬民眾上街抗議選舉舞弊，國民黨提起選舉無效訴訟，主因就是開票結果遠低於民調預測。後來司法驗票證實陳呂配票數勝出，那麼，問題其實出在當年民調「過度高估」連宋配的支持度嗎？

台灣個資保護，增加民調難度

台灣民調遭遇的問題接近歐美情況，台灣《個人資料保護法》禁止政府逕自提供個人隱私資料給外界，同時為了避免干擾選舉，拒絕公開選舉人名冊的領票紀錄，用於學術研究也不行，所以台灣民調界無法透過實際投票資料，驗證樣本的正確性。台灣出口民調也很少，因為很快就能知道開票結果。

除了樣本問題，室話、手機、網路族群能夠接觸到的民眾類型不一，該如何彙整資料，產學間還沒有定見，需要更多嘗試與驗證。至於民調回覆率，政大等學術單位推估大約介於5％～10％之間，也就是為了取得1,067筆回覆，至少要撥打1萬～2萬個電話號碼。

但是回覆率低不代表取樣沒有代表性，政治大學選舉研究中心副研究員俞振華受訪時解釋，有些機構取得的電話號碼只有室話前4碼，無法很有效率的排除空號，行動電話也是一樣道理，這些都是回覆率偏低的可能原因。政大選研中心會事先發簡訊通知，來提高手機族的回覆意願，目前也與中研院開發新的抽樣模式，希望透過「地理位置」的隨機抽樣，擴大樣本的代表性。

俞振華不否認，2004年選舉爭議，可能跟民調預測錯誤有關，他解釋，2004年陳呂連宋兩組候選人，得票數那麼接近，沒有民調能預估得出來。正因為民調過程的諸多不確定因素，與其在意民調數字，不如多觀察變化趨勢，相同調查方式儘管有偏差，變化趨勢仍有參考價值。他特別強調：

「選舉民調是預測，不是底牌，若把預測當底牌，一旦開票有落差，就可能發生爭議。」

至於美國大選前民調哪個可靠？俞振華看法是，不管誰領先，多數民調都在誤差範圍內，還是要看關鍵搖擺州的開票結果。從趨勢來看，FBI宣布重新調查希拉蕊電郵案、或公開柯林頓特赦富豪、甚至川普性騷擾醜聞，並未真正改變選情態勢，事件剛發生時的民調變化，總會慢慢彈回來。他相信，FBI 目的不是影響選情，絕大多數人也不會改變投票決定。（註10）

FBI 大量增加人力、加快調查速度後，11月6日書面告知國會，未發現違法事證，因此維持之前結論：不建議起訴希拉蕊，可說是還她清白。

美國,總統,選舉 — 2016美國總統大選民調變化：俞振華認為，這次選舉希拉蕊、川普的基本盤變化不大，個別事件造成的民調波動都回逐漸彈回。圖片來源：RealClearPolitics（http://bit.ly/1foXXRS）

尤其兩位候選人的類型，俞振華認為，有一定相似性。川普看似吸引大批中低教育水準的白人階層，但他們支持川普多基於經濟因素、而非共和黨傳統保守觀點，還有一大批支持者（兩黨都有）是因為討厭希拉蕊才支持川普，當然也有很多人因為厭惡川普而支持希拉蕊，這些賭爛選民像鐵板一塊、難以鬆動，那些負面選戰打法，明顯要激出賭爛族出來含淚投票、或忍住不投票。

如何正確解讀民調數字？

既然民調測不準才是常態，你我又該如何看待各種民調數字？美國全國民意調查委員會（The National Council on Public Polls, NCPP）2004年發布的《面對民調，記者應該要問的20個問題》、美國民意研究協會（American Association for Public Opinion Research, AAPOR）2016年發布的《今日複雜環境下評估民調品質的17個問題》都值得參考。

兩文件建議大家注意必須揭露的資訊（Transparency）、調查範圍（Coverage）、樣本選擇（Sampling）、未回覆情況（Nonresponse）、調查方法（Measurement）等因素，甚至比較其他同類民調的結果，來判斷民調的參考或報導價值，同時留意個別民調本質上的偏差。

至於要不要出門投票？與其參考民調、考慮政黨宣傳的棄保效應，不如好好思考民主選舉對於個人的意義吧。

【參考資料】

對於台灣選舉民調實務與學理有興趣的讀者，可進一步參考2014年12月12日台大政治系舉辦的專題演講《誰最準？以2014臺北市長選舉為例比較次數機率學派、貝氏學派與預測市場》，由3位民調學者、業者以上屆地方選舉為例，說明台灣民調準確性的影響因素。

美國18歲以上人口、註冊選民人數，各資料來源說法不同，若有官方更新數字，隨時更新。

政治社會

政策

2016/11/6

文字

楊芬瑩

組合照片／AFP PHOTO

美國