編者按:自從兩年前給黑人照片貼上 " 大猩猩 " 的標簽後,谷歌照片對 " 大猩猩 " 等相關詞語的處理上一直都非常謹慎,他們給出的做法是,將大猩猩和其他靈長類動物的標簽從該服務的詞庫中刪除。但是在谷歌其他的應用中,比如雲計算服務和谷歌 Assistant 中,都能直接識別。文章發表在《連線》雜志,由 36 氪編譯。
2015 年,一名黑人軟件開發人員在 Twitter 上說,谷歌的照片服務(Google Photos)把他和一個黑人朋友的照片打上瞭 " 大猩猩 " 的標簽,這讓谷歌感到非常尷尬。谷歌宣稱自己 " 感到震驚和由衷的歉意 "。一名相關的工程師表示,谷歌正在 " 研究更長期的解決方案 "。
兩年多之後,谷歌給出的其中一項修復措施就是將大猩猩和其他靈長類動物的標簽從該服務的詞庫中刪除。這一尷尬的變通方案表明,谷歌和其他科技公司在推進圖像識別技術方面仍舊面臨著諸多困難,盡管這些公司希望能夠在自動駕駛汽車、個人助理和其他產品上使用這些技術。
《連線》雜志用 4 萬張圖片對谷歌照片服務進行瞭測試,這些照片中有很多動物。谷歌照片在尋找包括熊貓和貴賓犬在內的許多動物上表現得非常棒。但當使用 " 大猩猩 "、" 黑猩猩 " 和 " 猴子 " 等詞進行搜索時,谷歌照片反饋稱 " 沒有結果 "。
在谷歌照片服務中 , 谷歌對 " 大猩猩 "、" 黑猩猩 " 和 " 猴子 " 等詞的搜索進行瞭審查。
作為一款移動應用和網站,谷歌照片為 5 億用戶提供瞭管理和備份個人照片的地方。它使用機器學習技術,自動將照片進行分組,比如湖泊或拿鐵。同樣,用戶也可以利用該技術對他們的照片進行搜索。
在《連線》雜志的測試中,谷歌照片確實識別出瞭一些靈長類動物。 使用 " 狒狒 "、" 長臂猿 "、" 狨猴 " 和 " 猩猩 " 等詞進行搜索,結果都還不錯。隻要搜索時使用術語而不是使用 M 開頭的詞語 , 就可以找到卷尾猴和疣猴。
在另一項測試中,《連線》上傳瞭 20 張黑猩猩和大猩猩的照片,這些黑猩猩和大猩猩來自非營利組織 " 黑猩猩天堂 " 和 " 黛安 · 福西研究所 "(Diane Fossey Institute)。有些猩猩可以用使用 " 森林 "、" 叢林 " 或 " 動物園 " 等關鍵詞來搜索到,但事實證明,其餘的都很難被發現。
結論是:在谷歌照片中,狒狒是狒狒,但猴子不是猴子。大猩猩和黑猩猩是不可見的。
智能手機上的谷歌 Lens 應用,也無法識別出來大猩猩。
在第三次測試中,《連線》雜志上傳瞭一組 1 萬多張用於面部識別研究的圖片。用 " 非洲裔美國人 " 這個詞進行搜索,最後隻出現瞭一幅羚羊的畫面。輸入 " 黑人男性 "、" 黑人女性 " 或 " 黑人 ",谷歌的系統會返回黑白圖像,按照性別正確排序,但不被種族過濾。對於膚色較深的人來說,可以使用 " 非洲式 "(afro)和 " 非洲人 "(African)等詞進行搜索,盡管結果好壞參半,並不那麼準確。
谷歌的一位發言人證實,在 2015 年的事件發生後," 大猩猩 " 就從搜索和圖片標簽中刪除瞭 , 直到今天 " 猩猩 "、" 黑猩猩 " 和 " 猴子 " 等標簽仍在屏蔽中。該發言人在電子郵件中寫道:" 圖像標簽技術還處於早期階段,但不幸的是,它還遠遠不夠完美。" 他強調瞭谷歌照片的一個功能,即允許用戶報告錯誤。
谷歌對大猩猩圖片的謹慎處理,說明瞭現有的機器學習技術上的一個不足之處。有瞭足夠的數據和計算能力,軟件就可以被訓練,可以用來對圖像進行分類,或者在較高的精確度下對語音進行轉錄。但它無法輕易超越這種從訓練中得出的經驗。即使是最優秀的算法,也缺乏像人類那樣運用常識或抽象概念的能力,來完善它們對世界的詮釋。
因此,機器學習工程師在現實世界中部署他們的成果時,必須對他們的訓練數據中沒有發現的 " 邊緣案例 " 保持警惕。維吉尼亞大學教授維恩特 · 奧達尼斯 · 羅梅恩(Vicente ord ez rom n)說:" 你的系統一旦開始上線運行,你就很難再對它進行建模。" 去年,他參與瞭一項研究,該研究表明,應用於圖像的機器學習算法可以識別並放大人們對不同性別之間的偏見。
谷歌照片用戶上傳的照片是在各種不完美的條件下拍攝的。考慮到數據庫中的圖片數量,將一種類型的 " 類人猿 " 誤認成另一種類型的可能性極小。
谷歌母公司 Alphabet 和更廣泛的科技行業面臨著更大的風險,比如應用在自動駕駛汽車上。羅曼(Rom á n)和他的同事、軟件可靠性專傢拜沙希 · 雷(Baishakhi Ray)一起,正在探索如何限制視覺系統在自動駕駛汽車等場景中可能的誤判行為。雷說,這方面已經取得瞭一些進展,但目前還不清楚如何能夠很好地控制這些系統的局限性。" 我們仍然不能非常具體地知道這些機器學習模型正在學習什麼," 她說。
谷歌的一些機器學習系統被允許在公開場合使用大猩猩照片進行檢測。該公司的雲計算部門為企業提供瞭一項名為雲視覺(Cloud Vision) API 的服務來構建他們自己的項目。當《連線》雜志用大猩猩和黑猩猩的照片對在線演示進行測試時,它同時識別出瞭這兩張照片。
例如,一隻成年大猩猩抱著雙胞胎寶寶的照片被谷歌的雲視覺服務貼上瞭 " 西部大猩猩 " 的標簽,其信心指數為 94%。系統會在相關的標簽上返回一個最佳猜測列表。" 哺乳動物 " 和 " 靈長類動物 " 的得分也達到瞭 90% 甚至更多。
谷歌向企業提供的雲計算圖像識別服務可以自由地稱大猩猩為大猩猩。
谷歌的 Assistant 也可以自由地將大猩猩稱為 " 大猩猩 "。在安卓手機上,谷歌 Assistant 可以被召喚去嘗試解釋手機屏幕上的內容。當被要求識別 " 一隻成年大猩猩抱著雙胞胎寶寶 " 的照片時,谷歌 Assistant 給出的建議是 " 山地大猩猩 "。
但是," 谷歌 Lnes",被標榜為展示該公司 " 計算機視覺上的進步 " 的應用,在去年 10 月添加到瞭谷歌照片上。當被要求識別同一幅圖像時,它回應道:" 嗯……還沒看清楚。"
原文鏈接:https://www.wired.com/story/when-it-comes-to-gorillas-google-photos-remains-blind/
編譯組出品。編輯:郝鵬程