日前,由於 Facebook 平臺用戶的數據被非法采集和利用,一時間全球社交媒體老大成為眾矢之的,而隨著整個事件的始作俑者劍橋分析(Cambridge Analytica)公司更是遭到口誅筆伐。那麼我們今天去除上述事件中 " 惡 " 的一面,僅從 AI 技術、市場應用的角度來看劍橋分析可能會得到另外的啟示。
眾所周知,所謂劍橋分析采用的對於搜集到的個人信息分析的計算模型最初是來自於邁克爾 • 科辛斯基(Michal Kosinski),其是心理測驗學(一個由數據驅動的心理學分支)領域的領軍人物,其發明的個人信息計算模型可以根據簡單的個人信息就推斷出該數據提供者可靠的個性特質。究竟有多可靠?
早在 2012 年,科辛斯基就證明,平均基於 Facebook 上的 68 個 " 點贊 ",就可以預測用戶的膚色(準確度 95%)、性取向(準確度 88%)以及政治傾向(民主黨或共和黨,準確度 85%)。可預測的內容遠不止於此,還包括智力、宗教信仰,以及酒精、香煙和毒品使用。
基於數據,科辛斯基甚至可以推斷某人的父母是否離婚。而在不斷研究和改進後,其模型變得日益完善,即僅僅基於 10 個點贊,他就能比受試者的同事更準確地評價受試者;70 個 " 點贊 " 足以讓他比受試者的朋友更瞭解受試者。
150 個點贊可以讓他比受試者的父母更瞭解受試者;300 個點贊可以讓他比受試者的合作夥伴更瞭解受試者。基於更多的點贊,科辛斯基對受試者的瞭解,甚至超過受試者自己。之後,科辛斯基等人開發瞭一種非常簡單的方法。
首先,他們以在線測驗的形式向測試對象提供問卷。根據他們的回答,心理學傢計算瞭受試者的個人 " 大五 "(開放性 Openness,對新經驗的開放程度、盡責性 conscientiousness,完美主義程度、外向性 extraversion,社交活躍程度、隨和性 agreeableness,體貼和合作程度和情緒穩定性 neuroticism,焦躁不安程度的簡稱,又稱為 OCEAN)分數。
然後科辛斯基的團隊將結果與受試者的其他在線數據進行比較,例如,他們在 Facebook 上 " 點贊 "、分享或發帖的數據,以及性別、年齡、居住地點等數據。這使研究人員能夠建立特定網絡行為與個性特質之間的關聯。
不知業內,尤其是那些整天把大數據、AI 掛在嘴邊的企業作何感想?我們看到的是,如果 AI 真的發揮作用,如何理解 AI 專攻的領域及在相關領域的專傢至關重要,尤其是針對這個領域基礎理論的瞭解和研究一定要透徹、紮實,因為這直接影響到計算建模的水平和其輸出的結果(是否真的具有價值)。
那麼以此作為標準之一的話,我們國內號稱自己是 AI 企業的有多少是合格的?又有多少是渾水摸魚的?也許就像我們有的業內人士所言,我們偌大國傢不缺少用戶的數據,但如果技術不過硬,這些數據又有何用呢?又有什麼值得炫耀的?
其實此前,某些號稱采用 AI 技術的國內企業在向所謂的目標用戶推送內容、廣告、服務的時候已經引發瞭用戶的不滿,甚至鬧出一系列的笑話,原因很簡單,就是推送的這些根本不是這些用戶所需要的,更反映出這些企業 AI 技術與人傢的差距。
如果說科辛斯基為某種 AI 應用奠定瞭堅實的技術基礎,那麼此次被曝光的劍橋分析公司則是為這種技術找到瞭最佳的應用並實現瞭最佳的效果,即政治選舉。這也是為何外界又稱劍橋分析是政治 AI 公司的原因。
例如在歐洲,劍橋分析幫助曾在上世紀 80 年代獲得成功的復興政黨參與瞭 2012 年意大利政治競選活動,而其改革建議使該黨的表現超出瞭最初的預期;2014 年幫助烏克蘭展開顏色革命,使親西方總統維克多 • 尤先科(Viktor Yushenchenko)掌權。
在肯尼亞,劍橋分析公司曾兩次用於幫助肯尼亞總統烏胡魯 • 肯雅塔(Uhuru Kenyatta)先後在 2013 年和 2017 年獲得選舉勝利。當然除此之外,最大應用就是其在英國脫歐的投票中讓英國脫歐及特朗普在美國總統大選中擊敗希拉裡當選。
提及美國總統大選,我們補充說明的是,其實除瞭特朗普,其競爭者希拉裡也采用基於大數據的 AI 分析,即與來自藍色實驗室(BlueLabs,2013 年在華盛頓創辦的一傢數據分析和技術公司,創辦人包括奧巴馬數據團隊的高級成員)的前沿大數據分析師合作,並獲得瞭谷歌和夢工廠(DreamWorks)的支持。
甚至當特朗普於 2016 年 6 月宣佈聘請劍橋分析時,希拉裡陣營還嘲笑該公司 AI 分析準確性肯定不及本土的藍色實驗室。但最終的結果證明,這兩傢同樣基於 AI 技術的分析公司,顯然劍橋分析更高一籌,這似乎再次證明瞭 AI 技術本身與適用市場的重要性。
不過這裡我們再次強調,我們堅決反對和譴責劍橋分析幹預別國政治的做法,隻是借此說明 AI 要真正發揮價值和作用,技術過硬和應用對口(要易於最大化技術的價值)的不可或缺。
相比之下,還是我們國內的某些 AI 企業,總是把自己的 AI 技術吹得天花亂墜,無所不能,其實針對不同的行業,不同的市場,AI 也是有專攻的,盲目的選擇應用和市場,不僅事倍功半,甚至有噱頭的嫌疑。
最後就是通過劍橋分析,我們重新認識瞭英國在 AI 領域的實力。其實,AI 不僅是美國在引領未來。過去十年,英國一直是歐洲 AI 的研發中心,AI 創業公司屢獲谷歌、亞馬遜、蘋果等巨頭青睞,並購和投資消息不斷。這裡我們不妨簡單看看英國在 AI 方面有哪些知名的公司或者初創企業,它們在幹什麼?
提及 " 阿爾法狗 " 打敗世界圍棋冠軍李世石成為大量媒體的頭條新聞,相信有部分人會認為這是谷歌 AI 牛逼的代表,實際上 " 阿爾法狗 " 的開發商是成立於 2011 年的英國 DeepMind 公司。
該公司由神經系統科學傢 Demis Hassabis、網絡語音通訊軟件 Skype 開發者 Jaan Tallin 和研究人員 Shane Legg 共同創辦,是前沿的人工智能企業,其將機器學習和系統神經科學的最先進技術結合起來,建立強大的通用學習算法,隻是在 2014 年被谷歌以 4 億美元收購。
再看當下火爆的自動駕駛,除瞭經常見諸報端的美國科技企業谷歌、Uber、特斯拉外,其實英國在自動駕駛上也早有涉足。例如 2014 年末從牛津大學機器人團隊中衍生的 Oxbotica 公司,就專註於機器人和自動駕駛汽車工程技術的研究。
其開發的自動駕駛軟件 Selenium 可以通過搭載的視覺攝像頭、激光掃描器或者雷達系統獲得數據。通過一系列算法確定自身的位置和周圍的環境狀況,進而判斷下一步的行動,實現自動駕駛。該軟件系統具備自主學習能力,它會在行駛過程中收集數據並進行分析和學習,以此訓練感知系統並獲得自主駕駛能力。
此外,劍橋大學 SegNet 研究小組,其開發的高性價比的自動駕駛識別系統 SegNet,具有低成本低特性且不需要任何 GPS 連接,無論是白天還是黑夜,都可以正常工作。一旦 SegNet 系統啟動,便可臨時接管汽車的基本操作,這一功能與部分車輛的自動駕駛功能類似。
SegNet 系統還可識別道路、建築物、電線桿、路牌、行人和騎行者等 12 類標註。可保持實時工作狀態並在較短時間內對各種新圖像進行評估,精確度高達 90%。
更讓我們吃驚的是,英國現在已經開始研究量子計算與 AI 的結合,而 Cambridge Quantum Computing Ltd. 就是一傢在量子信息處理技術,人工智能,優化與模式識別相結合的領先獨立公司。
該公司開發可實現當前或未來工業的技術,專註於量子器件的算法和數據協議。該公司目前關註的領域包括:量子操作系統與量子模擬、認證隨機性、人工智能、安全認證和量子對抗加密貨幣。
看到這些,再結合近期外媒屢屢發文稱中國 AI 水平正在趕超英美,我們是否應該冷靜下來思考,這背後的目的究竟是什麼?實際的情況又是怎樣?
綜上所述,我們認為,當業內將目光紛紛聚焦到 Facebook 和與之相關的劍橋分析非法搜集和利用用戶數據用於左右別國政治選舉負面的時候,我們不妨站在 AI 產業的高度,從技術和應用的角度去看待這一事件,提取出對於我們 AI 產業發展有利的啟示也同樣具有重要意義,畢竟任何事物都具有兩面性。
更多精彩內容,關註鈦媒體微信號(ID:taimeiti),或者下載鈦媒體 App