首頁 國際 要聞

透視搜尋引擎 谷歌演算法存在偏見(2)

【記者楊傑凱/報導】前言:谷歌(Google)和臉書(Facebook)等科技巨擘,可能會操縱演算法來影響使用者的認知、觀感態度,甚至投票傾向嗎?搜尋結果的排名又如何影響中間選民呢?在瀏覽網頁的背後,搜尋演算法對我們的行為到底產生多大的影響?

英文《大紀元時報》資深記者楊傑凱(Jan Jekielek)2019年9月專訪《今日心理學》(Psychology Today)雜誌的前主編羅伯特.愛潑斯坦(Robert Epstein),討論上述問題。以下為訪談內容:

2016大選數據 顯示谷歌存在偏見

愛潑斯坦:在2016年,我建立了史上第一個解決此問題的系統。我建立了一個監視系統,你可以將其視為一種尼爾森型(Nielsen)系統。自1950年以來,尼爾森公司就有徵求家庭參與調查;保證家庭資料保密,在受試家庭的允許下安裝調查盒,以追蹤家庭成員觀看的電視節目類型。這就是著名的尼爾森評級,該評級決定投入多少廣告費用、繼續播放何種節目、取消何種節目。現在全球有47個國家地區使用,該評級公司使用了非常有效的調查方法。

我創立了類似尼爾森型的網路系統,在24個州有95個調查員,在確保他們的身分保密的情況下,將開發的軟體安裝在他們的電腦上,這個軟體讓我們可以監測調查員的網路使用過程。當然,這是獲得調查員許可的。

然後,我們追蹤他們在谷歌、微軟(Bing)和雅虎(Yahoo)上進行與選舉相關的搜尋時所看到的內容。此點極為重要,我們研究3個搜尋引擎。我們觀察的受試者是來自24個州、多元化的美國選民,並每天蒐集數據流量。

於2016年5月我們收到第一組數據,選舉前大約25天,我們已組成完整的調查小組。所以,在選舉前的一個月左右,能開始大量蒐集數據。我們保留了1萬3,207個與選舉相關的搜尋及與搜尋結果連結的9萬8,044個網頁,並開始研究衡量是否存在偏見。

我們還採用了所謂的「群眾外包」(Crowdsourcing)方式,以網際網路上的一個群體,來衡量調查網頁中的偏見。我們對網頁有了偏見評級之後,即可以算出我們儲存的搜尋結果的平均偏見。

關鍵問題是,如何評量某個網站存在偏見?這個研究領域已有100年的歷史。專家通常會依據衡量尺度進行評分。在這次的實驗中,我們設計的尺度是從-5(希拉蕊.柯林頓)到+5(唐納德.川普)。接著,專家查看網頁,確定是否存在偏見。如果沒有偏見,就計分為0,由多人對每個網頁進行評分後,即可算出平均偏見分數。隨後,我們就能計算搜尋結果中可能存在的偏見。

實驗結果顯示,像谷歌這樣的公司具備轉變人們觀點和投票傾向的影響力。我們大量蒐集來自實際選民的數據,即由24個州的95名選民組成的多元化群體,及超過1萬3千個及許多網頁。選舉前夕,我們故意將注意力集中在蒐集數據,故意沒有進行分析數據,因為如果我們在選舉前發現存在偏見,該怎麼辦?

換句話說,我該怎麼辦?意即如果我宣布分析結果的消息,那絕對會引起混亂,尤其我認為,如果這個偏見是針對川普的。如果我不宣布這一消息,那我就會變成操縱選舉的同謀。因此,我們決定專注於數據蒐集。在選舉之後,我們花了幾個月時間專注於分析。

2017年春季,我將結果提交給了一些科學研討會、將分析結果提交給了相關領域評審委員。當結果被一個研討會接受後,我聯繫了一位《華盛頓郵報》的記者。

谷歌搜尋掌握九成使用者
可影響總統大選

我們發現谷歌的搜尋結果首頁上,所有10個搜尋位置都偏向希拉蕊,微軟Bing或雅虎卻沒有。這又是很重要的一點。我們發現谷歌有偏見,而其他搜尋引擎沒有。

此外,我們還發現,不僅在傾向投給民主黨州的人們看到了這種偏見,傾向投給共和黨州的人也看到了親希拉蕊的偏見。

我們還採用標準的統計方法來檢驗數據結果是否存在顯著差異。在統計學的意義上,通常設定顯著水準為0.05,但研究結果顯著值達到近0.001,表示非常顯著。當然,我在公開研究結果時遇到了一些新的阻力,因為這表示谷歌搜尋結果存在很大的偏見。

那這會對選票產生何種影響呢?根據我在《美國國家科學院院刊》2015年的論文中提出的方程式,計算結果是,如果在全國,使用谷歌搜尋都存在這種程度的偏見,那麼將能操縱260萬至1,040萬選票支持希拉蕊,而我本人是希拉蕊的支持者。

換句話說,我的調查與科學研究所得出的結論,在某種程度上有損我自己的政治偏好和政治傾向。但由於我們的結果如此顯著,以至於我有責任公布調查結果。當然,(前)國務卿希拉蕊以超過280萬選票的優勢贏得了普選,她選舉失利是因為輸在選舉人票上。但是我的研究和調查項目表明,如果谷歌的搜尋結果沒有偏見,普選結果可能有很大不同,這可能是一場不分軒輊的競選。

再說一次,我不得不承認這一點,這讓我感到不舒服,但這就是我從研究中得出的結論。(未完,待續)◇