新媒體充電站

林辰峰/記者為什麼要學寫程式?

想像你是一名記者,一名追求事實,挖掘真相的記者。你對政治獻金相關議題很有興趣,做訪前研究時,發現網路上有多筆龐大政治獻金數據。你盯著電腦螢幕,看著眼前一筆又一筆的數據。你順手點了滑鼠右鍵,希望下載這份資料庫,卻發現網頁不開放右鍵下載。「或許我應該將這些數據一筆一筆抄下來。」你或許會這樣告訴自己。無奈數據共有數萬筆,書手抄寫容易犯錯又耗時。你單手托腮,無奈地嘆了一口氣。你肯定新聞就藏在這些數據裡,但卻不知該如何是好。
我曾是這樣子的記者。因為數理差而理所當然地選了文組,又因新聞熱情而填了新聞系。一次在做探討德國核能政策的新聞時,找到有趣資料,卻因自己Excel糟糕離譜,又對數據處理與分析一竅不通,而寫不出好新聞。不過卻也因此意識到自己能力的不足,而決定花時間學寫程式與資料分析,並希望能將新聞與科學方法和數據分析有所結合。
事實上,記者運用量化數據來輔佐報導早就不是新鮮事,而資料的視覺化一直以來也都存在(知名英國護士南丁格爾就曾發表許多醫學相關數據圖表,奠定她在醫學與統計學的學術地位)。由於科技普及以及資訊透明化,降低了記者學習數據分析與處理的門檻,科技與新聞跨領域的特性,也讓一群老鳥記者和新記>者開始用量化科學方法處理新聞,也利用寫程式的方式來蒐集、處理、分析和呈現資料。
這些記者用程式語言Python將網路上的數據取出,再利用統計語言R來清理資料並做數據分析。當需要比對與整合多比資料庫時,他們寫出一條又一條SQL程式碼,將多筆資料庫綁在一起。他們用D3.js設計出互動圖表,在碰到含有地理資訊的數據則用LeafletQGIS製作出精美的地圖。他們不是電腦工程師,也談不上是設計師,他們是記者。一群會寫程式,了解視覺設計,又懂採訪寫作的記者。他們有時也被稱作資料記者或數據記者(data journalist)。
這樣的記者在美國不佔少數。當國際媒體因經營困難,力求精簡人力而陸續裁減編輯與記者的同時,卻也不斷釋出資料記者與資料編輯職缺。
由於業界對於資料記者的需求,美國各傳統老牌新聞院校也陸陸續續開出電腦程式編輯相關課程。哥倫比亞大學開設了新聞與資工雙主修學程,西北大學則有整合新聞與科技的實驗室,而美國加州大學柏克萊分校新聞所與密蘇里大學新聞學院也有多項程式設計與資料新聞相關課程。
讀到這裡,你或許會納悶,為什麼不將資料丟給報社內工程師來操作與分析呢?答案很簡單,當新聞點藏在數據中,身為記者的你怎麼能不自己親手處理,就如同你不會要求其他人幫你做採訪與寫稿。此外,「數據」(data)這個字本身,在拉丁文的意思是「被給予的事物」(given),意謂事實的材料。就如同紐約時報編輯David Leonhardt所提到,數據只是記者的一個工具,就如同記者在做新聞時使用其他工具如引用受訪者所說的話、文字、照片等。
記者運用數據報導,除了能提升新聞準確度與增加報導信服力外,也能藉由資料視覺化的形式,讓文字無法精準描述的部分轉成互動圖表,幫助讀者快速地了解新聞。此外,網路的互動性更是成為會寫程式的記者們的新敘事工具,開創新的可能。

延伸閱讀

載入更多文章