個人數據的支配,一個基本的邏輯是,選擇權應該始終掌握在用戶手中。
全文約 6328 字,閱讀大概需要 9 分鐘。
財經天下(ID:cjtxzk) 文|任曉漁
編輯|趙艷秋
北大經濟學教授薛兆豐註意到自己在亞馬遜 Kindle 上 " 讀書標記 " 的處置權問題。
我的 Kindle 筆記屬於亞馬遜?
薛兆豐邊閱讀書籍,邊會利用電紙書 Highline 劃重點。這些重點既保存在電紙書上,又會上傳到亞馬遜雲端。薛兆豐發現,這些筆記數據歸屬於亞馬遜。" 書是我買的,下劃線也是我親手劃的,但為什麼會歸亞馬遜呢?" ——這聽起來相當具有爭議性。
但這個結果是從薛兆豐首次使用 Kindle 時,點擊用戶使用合約中的 " 同意 " 按鍵開始的。那個合約文件用最小字符 8 號字打印出來,也有好幾十頁,很多人不會看,就會直接選擇 " 同意 "。
不過,薛兆豐也看到瞭這個選擇有益的一面。亞馬遜會把從數以萬計讀者那裡統計來的某本書的筆記數據匯總回推給讀者。薛兆豐正是利用這些大眾筆記,用 5 分鐘就能掌握一本書的大眾關註點。
結合瞭經濟學理論,薛教授認為,亞馬遜掌握這些筆記數據的所有權具有其合理性和某種程度的必然性。因為相較於單個讀者,亞馬遜掌握瞭筆記數據後,能夠把它們用起來,為大眾提供更經濟有效的服務。
薛兆豐的發現和思考在今天很具代表性。很多人享受到瞭數據時代更貼心的服務,前提是要讓渡出一部分自己的數據。
這種模式根源於二進制世界裡機器智能的運行方式——喂給機器足夠規模的數據,它就能更準確地在物理世界與數字世界間建立起聯系。用戶之前的行為數據能勾畫出他們的畫像,進而預測他們未來的行為,甚至能挖掘滿足用戶自己尚未察覺的需求。
朱明對電商企業的個性化推薦印象深刻。她是名編輯,朋友中有人罹患一種罕見的癌癥,苦於國內相關資料的缺乏。偶然間,她輾轉聽說瞭一本專著並在淘寶找到瞭它。讓人吃驚的事情發生瞭,與這種疾病相關的書籍推薦頻繁出現在她眼前。
通過電商平臺的推薦,她一下子買到瞭國內外的最新著作。" 幫瞭大忙,原本我根本都不知道有這些書的存在。" 朱明感慨說。這類基於用戶行為和瀏覽偏好數據的推薦算法最早應用於亞馬遜,1998 年上線。之後,在線影片租賃提供商 Netflix 等多個平臺也都使用這套算法。" 千人千面 " ——阿裡巴巴的淘寶、天貓電商平臺和今日頭條的新聞頁面都達到瞭這種效果。
▲所有 App 都用上瞭個性化推薦。圖片來源於網絡
" 幾乎所有面向消費者的軟件都用上瞭個性化推薦,大數據提高瞭信息搜尋的效率 ",百分點首席數據科學傢杜曉夢博士認為,基於個人知情的數據匯集和分析,能更高效地為用戶提供服務。
"AI 是推動人類進步的下一個引擎,數據就是燃料。" 用創新工場 CEO 李開復在某次演講中的表述,可以形象地表達出數據對即將到來時代的重要意義。
不過,正如薛兆豐所發現的細節,許多人忽視也無意去仔細閱讀各種應用的用戶授權文件。但當聽說這些應用收集瞭自己的數據後,又會驚慌憤怒,擔心自己的信息安全和隱私不保。
近年來頻繁傳出的數據泄露案例也加劇瞭這種恐慌。今年 3 月,58 同城被曝出全國簡歷數據泄露,700 元買套軟件就能在 1 個月內不斷采集 58 同城的數據。這則消息的後續雖以 58 同城報案,公司信息安全部門會加固安全系統等結果收場,但很多人依然在焦慮。
人們擔心,在龐大的技術機器面前,個人隱私處於裸奔狀態。
慢一秒交出你的數據
據公安部 7 月 17 日公佈的數據,自今年 3 月公安部開展打擊整治黑客攻擊破壞和網絡侵犯公民個人信息犯罪專項行動以來,全國共偵破侵犯公民個人信息案件和黑客攻擊破壞案件 1800 餘起,抓獲犯罪嫌疑人 4800 餘名,查獲各類被泄漏公民個人信息 500 餘億條。
數據犯罪和信息詐騙規模已不容小覷。用戶建立個人信息保護意識迫在眉睫。
而個人提交和讓渡各類自己的信息是第一道關口。這一步是許多人不曾留意的。但往往個人信息泄露也是從這一步開始的。
杜曉夢習慣去看一些軟件提供服務時發出的用戶授權協議。
涉及到最在意的出行信息時,她會認真看完航旅類 App 的調用數據授權文件。數據科學傢的身份在她身上的痕跡不少。她極少使用公共場合的 Wi-Fi。萬一要用,也有個底線,絕不填寫各類賬號密碼。" 商傢的 Wi-Fi 也許並不存在問題,但不能保證 Wi-Fi 沒有被劫持或攻擊 "。每一次收到快遞,她還特意找出黑色筆塗掉電話號碼和傢庭住址,外賣的單據也會依此處理。
數據科學傢能讀懂用戶授權協議,普通人怎麼辦?據瞭解,政府近期正要求企業降低這類隱私文書的閱讀門檻,盡量能讓普通用戶讀懂。除此之外,普通用戶該做些什麼,讓個人信息以更合適的方式從自己手中被交出去?
" 其實沒有什麼一勞永逸的秘訣,關鍵還是要有安全意識 ",這是陳澤帥的觀點。
陳澤帥對個人賬號的管理略顯極客,這與他的背景有關。作為上海鏈傢研究院院長和鏈傢網上海負責人,他的團隊需要處理龐大的房屋數據匹配及地產行業的數據挖掘需求。他有多個郵箱、兩個手機號和不同的 QQ,在不同場景下使用不同的郵箱。多個賬號體系的存在,能讓個人不同類型的隱私處於相對隔絕的狀態。" 各個郵箱收到的廣告都不一樣,這樣我能知道是哪個場景下的賬號發生瞭數據泄露 "。
螞蟻金服的數據隱私保護團隊負責人聶正軍用一個詞來形容提交數據的過程—— " 明白消費 "。
" 你要想一想提交的信息是不是獲得某類服務所必須的。不提交是否也可以享受到這類服務。提交的那一刻要慢一秒,想一想 "。他建議用戶定期去手機的隱私設置頁面觀察,是否有不合適的隱私授權行為,有些不用的軟件應該及時註銷。
某社交平臺的數據分析師李勝就很警惕各類 App 對通訊錄的調用。在他看來,許多軟件的使用場景與通訊錄並不相關,而通訊錄裡又有太多的個人關系網絡信息。他還建議,不要下載沒有認證的手機 App,在填寫個人信息時要多確認獲取信息機構或個人的資質。
▲提交個人數據那一刻要慢一秒,想一想。圖 @視覺中國
聶正軍還建議密碼的設置要復雜化,不能 " 一個密碼走天下 "。不然小平臺被攻破瞭,大平臺的信息安全也得不到保障。
行業從業者的建議都是從日常細節出發,多做一兩步,讓用戶提交和讓渡信息的方式更安全。
除瞭個人要更善用自己的信息讓渡權外,獲得用戶授權數據的企業也要更透明化。" 恐慌主要來自於未知。你不知道你的數據會被用來幹什麼。如果你知道它的具體用途,很多疑慮就會打消。" 杜曉夢說。
數據 " 黑匣子 " 的秘密
螞蟻金服的聶正軍突然收到瞭一則郵件。
" 你團隊的成員 XXX 在 2017 年 x 月 x 日在物理編號為 xxxx 的電腦終端進行瞭拷貝操作 "。郵件的內容詳細到瞭具體時間、地點和人的具體操作動作。它來自螞蟻金服的數據安全風險提示系統。一旦系統判定為違規操作,郵件會即刻發到操作者直接上司的郵箱中。
這是企業在數據安全上所采取的動作之一。它的出現,旨在解決一個隱憂——大數據時代,用戶在數據擁有方的面前越來越透明,而反向的過程——數據擁有方都做瞭什麼,對普通大眾而言,一無所知。現在,普通大眾有必要瞭解這個數據 " 黑匣子 "。
行業內部其實早已把這個黑匣子進行過具體分解。按數據的生命周期,它分為數據采集、存儲、分析加工和清洗、使用、對外提供和銷毀幾步。
以地圖類產品為例,通過攝像頭、街景采集車及用戶定位系統獲得數據,這屬於數據采集。被采集的街景及用戶的位置定位,會進入到不同的存儲中心。一旦用戶以某個關鍵詞檢索,這些數據會從數據庫中被調用,返回給用戶一個結果界面。有時候也會有第三方平臺調用地圖類數據,如餐飲類軟件需要與地圖類產品合作,這涉及到的是數據的對外提供。有些產品會有用戶的個人賬號,一旦進行刪號操作,用戶在平臺上的數據就應該被銷毀。
在數據的整個生命周期裡,行業企業要探索和提煉相應的原則和規范,來保障用戶數據不被濫用。這也是企業長遠走下去所必須做的。
" 在第一步數據采集中,最基本的要求是最小采集原則。" 螞蟻金服聶正軍介紹。這是在數據產生的源頭就要做的規范。在這個原則下,企業應該隻要求用戶提供使用某項服務所必須提供的信息,不過多采集其他信息。一旦采集數據,一定告知用戶,保證用戶的知情權。
某大型 IT 公司大數據科學傢王剛指出,目前一些服務提供商的不規范做法。" 有些軟件不開位置數據根本沒法正常使用,讓用戶沒有選擇的餘地。且一些軟件調用數據也沒有征求用戶的同意 "。
" 涉及到相關服務時才獲取與之相關的用戶數據,這才是合理的。" 王剛說," 特定的場景裡用戶確認 OK 瞭,才能進行數據追蹤。" 例如,主流的餐飲類軟件即使不開實時位置追蹤也能正常使用。使用某些功能時彈出一個對話框,提醒用戶不開啟位置服務可能會影響服務質量和數據精度。
采集後,數據進入存儲環節," 防范內鬼 " 是第一要務。很多情況下,安全事故是由企業內部或其合作夥伴的行為直接導致的。今年 6 月,浙江警方破獲一起非法獲取計算機系統數據、侵犯公民個人信息案,涉案金額巨大。其中被售賣的是大量蘋果手機 Apple ID 相關信息。案中涉及蘋果國內直銷公司及蘋果外包公司員工 20 人。即使蘋果這樣的大公司也中招瞭。
為瞭防范內鬼,常用的辦法是匿名化和數據脫敏。鏈傢陳澤帥介紹,鏈傢會對進去數據倉庫的數據做嚴格的脫敏,例如,用戶敏感信息在鏈傢會進行加密保存,且理論上數據分析與挖掘並不會使用諸如手機號、身份證號這類敏感信息。
讓用戶的個人信息在企業內部以匿名化方式存儲,在不少企業都已成為共識。比如支付寶前臺、後臺產品都集成瞭敏感數據的識別和脫敏技術框架。這樣,頁面展示中的身份證號、銀行卡號、手機號和郵箱四類敏感信息都會加密配置,防止泄密。比如,身份證號僅顯示第一個和最後一個數字,銀行卡號僅顯示最後四位,手機號僅顯示前三位和最後兩位,郵箱僅顯示前 3 位。
北京師范大學法學院教授劉德良認為,對個人隱私數據失控的最大擔憂來自於,通過對數據的收集、加工技術,海量數據將原來不能識別出一個人的 N -1、N - 2、N -3 個信息還原為 N 個信息,就可以找到這個人。為瞭緩解這種擔憂,劉德良堅持,企業必須堅守一個原則:在大數據背景下,對數據加工分析匹配過程一定要匿名化。" 遵循這個原則,隱私遇到互聯網其實沒有什麼大問題,不像傳說中那麼恐怖 "。
▲數據的存儲和分析過程匿名化,成為不少企業的共識。圖 @視覺中國
而在數據加工和分析處理環節,一個常見的操作是要控制不同部門的數據權限。不同崗位看到數據的權限不一樣,正規公司會有一個比較嚴格的數據保護和數據權限分配體系。杜曉夢介紹,在這套規則下,即使是內部人也不能拿到用戶的資料。" 我們在做底層存儲甚至可以做到對同一個庫表不同列的數據獲取都可以有隔離。" 杜曉夢說。
業界公司也采用技術手段來保證數據權限規則的實施。
聶正軍收到的風險提示郵件就是一個典型的案例。通過技術手段,系統能自動監控員工的行為是否有異常操作。一旦有異常,郵件會發送到直接主管那裡。員工要遵守的數據安全規則聽起來也略顯繁瑣——首先,員工隻能在特定終端(公司發放給個人的筆記本)、特定網絡環境(公司的內網)和特定平臺(某個專門的數據分發平臺)才能處理下載相關數據。另外,那臺發到個人的筆記本沒有 U 盤口,無法進行拷貝操作。即使能插入 U 盤,一旦有這個操作,異常提醒郵件就會同一時間發送。
鏈傢的陳澤帥把這樣的溯源機制比作實驗室裡貴金屬的追蹤。" 就像化學實驗室裡的貴重金屬,誰使用瞭都要登記領取,能追查到個人。" 陳澤帥說。鏈傢內部有 5 級數據安全等級,除瞭嚴密的權限管理,還可以監控追溯所有數據使用行為。
即使相關操作人具備操作權限,而一旦操作者的動作觸發瞭某個異常審查機制,系統也會自動發送類似聶正軍收到的那種郵件提醒。在螞蟻金服,異常審查機制具體到過往操作習慣及大規模拷貝行為等一百多個點。
很多企業也把數據安全納入瞭考核之中。螞蟻金服每年會對員工進行信息安全考試,上到 CEO,下到剛入職的新員工,必須考試通過,否則就會收到 HR 的提示郵件,督促重考。同時也對信息安全違規的行為進行瞭定義,分一級違規、二級違規、三級違規,如果觸犯一級違規,會受到開除的處分。
除瞭防范內鬼,應對外部的黑客攻擊也是企業多年來一直做的。美團點評集團信息安全部有一個說法,叫 " 進不來、拿不走、看不懂 "。據美團點評方面介紹,在技術上從前臺的用戶事務處理,到後臺的數據分析,整個鏈條都對關鍵信息進行加密存儲,必要的流轉環節進行脫敏處理,同時對所有的數據采集點進行異常監控,外來的攻擊即使突破重重限制進入內網,也拿不走相關數據。
很多人憂心的是數據交換環節,擔心企業在向合作方提供服務時會導致數據泄露。在這一環節中,用戶的知情原則應該再次生效,企業需要審核第三方合作夥伴的資質及數據使用用途才能開展服務。" 一個基礎邏輯是,交換或傳輸的數據是需要得到數據擁有者的授權和知情的。" 杜曉夢說,即使是不敏感數據,也應該告知用戶,她認為選擇權應該始終掌握在用戶手中。
而用戶數據在平臺具有可銷毀性也是合規的企業應該具備的做法。比如螞蟻金服的賬戶管理界面能看到永久刪除賬號選項,用戶能通過這一選項決定是否繼續向平臺提供數據。
" 未來保護用戶信息隱私一定會成為企業的核心競爭力。" 聶正軍說,用戶會用腳投票,讓那些更能保護個人隱私的企業成為市場上的勝者。
演進的隱私觀念
在加強個人信息保護的過程中,另一些變化在悄無聲息地發生著。
" 我其實根本不在意出生時間、年收入,但我給手機號碼很謹慎。" 一名年齡段在 18~34 歲之間的用戶接受調查時稱。它源自全球知名會計公司 PWC 發佈的消費者洞察報告《消費者願意分享什麼》。報告的數據顯示,用戶對不同層級的個人信息的分享意願並不一致,不同年齡段的用戶的數據分享意願也不一致。隱私越來越成為一個變動中的概念
在報告中,73% 的受訪者說在能獲得回報的情況下,樂意分享個人信息。其中,18~29 歲人群的分享意願最高,達到 78%,而 45~59 歲人群的分享意願則為 68%。這意味著年輕群體對數據信息的態度更為開放。
▲ 73% 的受訪者說,在能獲得回報的情況下,樂意分享個人信息。圖 @視覺中國
從數據內容看,性別因素是大傢最樂意分享的,其次是對在線娛樂產品的口味喜好,之後是在線購物偏好、個人姓名、收入和郵箱地址等。而現住址和電話號碼及過往的工作經歷,隻有 30% 的人願意公開;電腦的瀏覽記錄和醫療信息的公開意願下降到瞭 11%~17%;通訊錄的細節和郵箱往來細節分享的意願低到瞭 4%~7%;最為私密的當然是各類密碼。
另一個問題是科技必然帶來隱私失控的焦慮麼?業者並不如此悲觀。陳澤帥認為,技術和大數據的應用,正在增加人對生活的掌控度。電商平臺在下單後會顯示物流動向,朋友出行航班的跟蹤信息反饋,這些都是大數據應用的結果。" 很多時候,這種掌控度是在緩解人在日常生活中的焦慮。" 陳澤帥說,不能把技術視作信息泄露及由此而來的焦慮主因。
" 科技永遠是雙面的,未來技術的進步會在保護個人隱私方面發揮更重要的作用。" 聶正軍則認為。
與此同時,法律環境也在逐步完善中。世界各地都有相應的法律法規保護個人數據安全及隱私。歐盟 2016 年頒佈的 " 通用數據保護規范 " ( GDPR ) 將於 2018 年生效,美國 2012 年頒佈的《消費者隱私權利法案》也為應對大數據時代的隱私保護問題。在國內,《網絡安全法》已經施行,世界范圍內對數據安全提出要求的法律及行業規范正逐步生效。
值得關註的是,今年 7 月,中央網信辦、工信部、公安部、國傢標準委 4 部委宣佈,對互聯網產品和服務進行個人隱私政策進行評審,首批選取瞭用戶使用頻率較高的 10 款互聯網產品,包括京東商城、航旅縱橫、滴滴出行、攜程網、淘寶、高德地圖、新浪微博、支付寶、騰訊微信、百度地圖。
在 9 月 24 日 " 個人信息保護日 " 當天,評審成績單揭曉。微信、淘寶網、支付寶、滴滴出行、京東商城、航旅縱橫、百度地圖、高德地圖 8 款產品和服務做到瞭向用戶主動提示並提供更多選擇權,例如運用增強式告知、即時提示等方式,在註冊、使用環節引導用戶閱讀、瞭解隱私條款的核心內容,主動區分核心功能和附加功能供用戶選擇。
此外,微信、淘寶網、支付寶、滴滴出行、京東商城 5 款產品和服務還提供瞭更便利的在線 " 一站式 " 撤回和關閉授權,在線訪問、更正、刪除其個人信息,在線註銷賬戶等功能。
" 大數據產業正走向更加合規的時代。" 王剛說。這種大環境會讓 " 灰色地帶的生存者 " 喪失生存空間,必然也將對普通人的信息安全提供更全面的保護。