6 月底的上海,世界移動大會(GSMA)上,科大訊飛消費者 BG 副總裁賀曉光把手下兩個部門十幾號人全部撒到會場裡,並下瞭命令:" 進去要給我帶東西出來,看看別人在做什麼,做的是不是足夠好。"
他在為語音助手尋找更多可行的落地場景:弄明白咪咕靈犀能解決以及應該解決什麼問題?通過什麼載體、怎麼介入應用之中?總之,訊飛內部的規劃,是今年找到更多真正有需求的場景,而且要把東西做出來。
做蘋果 Siri、亞馬遜 Alexa 這樣的語音助手,是人工智能領域最光鮮熱鬧的一個領域。但折磨人的地方也在這裡,語音助手一面烈火烹油,大傢覺得分分鐘就應該改變未來,成為下一個入口,但在實際應用上,卻又遲遲找不到一個突破點。
商業化上也舉步維艱。
鄔霄雲和樂視移動手機 EUI 高級副總裁馬麟,面對面坐在樂視大廈附近一間咖啡館裡時,鄔感覺到,對方打算用半杯咖啡的時間 " 打發 " 掉自己,甚至坐在這,也是出於中間人的人情。
" 找我做什麼語音助手的人特別多,你們有什麼瞭不起?" 馬麟發問瞭。
鄔霄雲創立的奇點機智的語音助手產品剛起步,正需要搭載上一款手機,以獲取進一步訓練算法的用戶數據。
然而大腿並不好抱。正如 5 年前曾風靡一時的暢銷書《大數據時代》所言,比起算法,數據會變得更加稀缺和珍貴。
一番產品演示後,鄔霄雲最終順利贏得瞭樂視的合作,但是是以免費模式提供服務——這已經是這個行業的常態。
缺乏話語權,直接導致這些語音助手公司很難向手機、電視等合作方收費。
今年 3 月,小米和出門問問間爆發瞭一場爭執。出門問問控訴小米在新品電視發佈前,臨時拋出 " 霸王條款 ",使用瞭問問的技術卻不願在發佈會上給予露出。而小米則回應,是由於出門問問不想合作,以及技術 PK 的結果,小米電視的語音識別技術供應商已經換成瞭搜狗。
諸如手機、電視這類高出貨量的硬件,每傢制造商身後,都至少追著三五傢語音助手公司,希望把自己系統送進去。
" 語音助手到現在都沒有商業模式。" 創業的 5 年過去瞭,這是出門問問李志飛的結論。對於語音助手如何商業化,36 氪采訪的多位采訪對象,均未給出明確的答案。
從手機、電視,到現在正開始熱起來的智能音箱,語音助手最終可以靠什麼硬件、應用場景落地?
這個被寄予瞭厚望的新人機交互模式,是否能如願成為 " 入口 "?
以及它們最終怎麼賺錢?
這些問題,都還待解。
貌似光鮮的語音助手行業,正處在煎熬時刻。
從 Siri 橫空出世、各路創業者開始做語音助手,轉瞬間,五六年已經過去瞭。
成為 Siri 的挑戰
曾經,做一個中國版的 siri ——這意味著改變未來、開拓巨大的市場、從技術落到實地的專業追求——是讓許多全球頂尖的華人工程師熱血沸騰、夜不能寐的主意。
2012 年 1 月,李志飛還在矽谷 Google Research Lab 研究語音識別,聽說好朋友趙勇有意離開 Google 回國創業,自己也坐不住瞭。他是個急性子,五個月後,就拿著一款手機 APP 開始融資瞭。
如今成為格靈深瞳 CEO 的趙勇記得,李志飛給他看瞭個帶有基本語音交互功能的助手,純白色界面,幾乎什麼設計都沒有。他試瞭試:
" 我要去長沙。"
" 乘火車還是坐飛機?"
選擇火車後,助手顯示瞭幾個班次,不過都是虛擬的。它是個 demo,還沒連接到任何服務數據庫上。再問其他,助手就回復不瞭瞭。
盡管如此,同年 8 月,李志飛憑借這款不能再簡單的 demo,拿到瞭融資。投資人們認為,語音助手的控制功能,會讓它成為一個大流量入口,以後無論接入什麼應用,都能收上一筆 " 過路費 "。這讓資本感到興奮。資本們也特別青睞 "Google 科學傢 " 們。
鄔霄雲甚至覺得,2016 年才開始做語音助手,自己有點後知後覺。他和被拉他出來創業的科學傢林德康,此前分別在 Google 工作瞭 8 年和 12 年,與李志飛同在一個實驗室。
在國內,Siri 出現後,科大訊飛這樣的公司,也為此感到興奮。當時,訊飛的語音助手項目(包含訊飛輸入法和靈犀語音助手),和其他 3 個方向,是訊飛探索的新業務。
還有更多創業者,前赴後繼地投身進來。亞馬遜 Echo 和語音助手 Alexa 的出現,又激發瞭一些想從智能音箱,切入語音助手生意的創業者。每隔兩個月,鄔霄雲至少會聽說一傢新的語音助手公司出現,且多半曾在 Google 工作。
李志飛甚至覺得,如今算法創業有些過剩瞭。
但這些這些頂尖的、代表未來、熱血沸騰的算法科學傢和科技公司們,在現實面前遭遇瞭困難。
第一道門檻,就是商業化。
靈犀的起步並不算順利。和出門問問在 2013 年底遇到的情況一樣,從訊飛研究院孵化出來後,靈犀空有一身技術,卻缺乏落地場景、資源和運營經驗,直到接受中國移動入股,才找到用武之地。
" 運營商有到達用戶的能力,資源豐富。比如中國移動的咪咕現在在內容上就跟我們有大量合作。" 盡管人們因 " 入口 " 而瘋狂,但賀曉光覺得助手對於創業公司而言,門檻不低。" 需要大量整合資源,而且工具型的東西,來錢特別慢,創業公司耗不起。"
" 當時其他三條線掙錢掙嗨瞭,但靈犀一年不掙一分錢,公司願意給它往裡投。" 賀曉光告訴 36 氪,靈犀之所以能常年保持戰略投入型產品的地位,是因為劉慶峰和時任研究院院長的胡鬱,堅信未來語音助手一定能以另外一種形態賺錢。
圖靈機器人,當初遇到瞭同樣的狀況。2012 年,俞志晨創業做瞭款蟲洞語音助手,兩年間迅速將種子用戶擴大到 3500 萬註冊用戶。這在當時算不小的規模,然而作為一傢創業公司蟲洞,也並未摸索出 to C 的商業模式。2014 年 11 月,這傢公司發佈瞭圖靈機器人,並在隔年發佈人工智能機器人操作系統 Turing OS,自此蟲洞在產品線上退居次位。
第二道門檻,技術不完備限制瞭用戶體驗。
雖然搜狗還在做智能語音系統,但搜狗語音助手的 IOS 版卻停擺在 2014 年的 10 月 23 日。此前,這款產品搜狗運營瞭一年,盡管口碑尚可,但留存率卻差強人意。搜狗團隊最終的判斷是,語音助手是未來的方向,但當時不能成熟地解決用戶痛點,產品本身價值不夠大。
此後兩年間,搜狗一直默默打磨語音技術,直至 2016 年看到行業準確率有普遍提升,才鎖定瞭車載、智能電視這兩大主要場景。
搜狗之所以首選把助手灌入電視,原因在於電視是高頻、剛需性硬件。按照王硯峰的標準,這意味著起碼每年得有幾千萬量級的銷量。另外,在電視端,用戶使用語音輸入的比例達到 20%。
" 去年從樂視電視開始,廠商才逐漸把語音作為標配。我們也是在市場相對成熟,能帶出來語音助手的價值時,才決定切入。" 搜狗語音交互技術中心負責人王硯峰,認為傢庭場景中的語音交互,會是比手機場景更早成熟。
" 大傢在手機上做的都是通用型助手,既要通過助手把咖啡定瞭,是不是又可以把京東上的貨買瞭。本質上,助手是想替代手機裡所有的 APP 而存在,甚至超越 APP 的體驗,這意味著它面臨的技術等等難題,是一條很漫長的路。"
即使強大如蘋果,用戶在最初經歷用 Siri 調用 APP、查詢天氣、安排日程、回復郵件這類小任務的興奮期後,siri 展露出功能的局限性。
歸根結底,凡事要先談用戶體驗。
第三道門檻,抱品牌商的大腿不容易。
要做好語音助手,並不止要好算法,更關鍵的是數據:訓練人工智能所需的用戶數據,如今都握在 BAT 手裡,創業公司要是想往前走,至少第一步,要先拿到數據來訓練算法。還有什麼選擇?
這正是大傢紛紛抱緊硬件品牌商大腿的原因。
當初出門問問決定自己做 " 不討喜 " 的硬件,也是經歷瞭一番與制造商的撕扯,被逼之下的舉動。" 當初做個入口級的東西,但要做進去應用不僅要免費,還得求著他們。說服不瞭他們,又想往前走一步,那我就自己做唄。" 李志飛告訴 36 氪。
前述奇點機智拿下樂視的單子不易,不過他們想不到,以科大訊飛的體量要搞定品牌商,同樣充滿挑戰。
靈犀語音助手(今年 5 月更名咪咕靈犀)目前是國內最大的語音助手平臺之一。但靈犀在產業鏈裡的話語權尚未達到賀曉光期望的程度。" 因為用戶水平、整合難度還有 IT 上的難度,(帶來瞭挑戰)。如果我有四個億用戶,客戶會排隊來找我們。"
用戶量和活躍度,是助手公司和硬件廠商、內容服務商談判時的硬指標,能說明消費者是否真的對語音助手具備需求。
但目前,這些數字還不夠樂觀。
根據易觀千帆提供的數據,咪咕靈犀的月活為 709.45 萬人次,微軟 Cortana 的月活人數為 47.56 萬人。5 月初的微軟 Build 大會提出全面 AI 化轉型後,Cortana 環比增幅上升至 34.36%。但在活躍數據上,小廠普遍呈現出下滑趨勢。
語音風口說雖然已經炒起來瞭,但由於技術不完備,資源整合艱難,大部分玩傢都出於 " 熬 " 的狀態。
搶在巨頭身前沖刺
無論李志飛、賀曉光還是鄔霄雲,都意識到,語音助手並不會是一門販賣流量的入口生意。
" 引流的服務大傢都願意做,然而做這個對用戶沒用,時間長瞭用戶粘性不高,因為你沒法在靈犀上完成想要的服務。"2015 年,更新到 3.0 版本時,訊飛發現和手機廠商一樣,應用廠商也不願意把所有數據流程都開放給你,這就導致用戶在使用靈犀操作到一定地步,就沒法在往下深入操作瞭。
比如查詢明天機票,但查完瞭無法在咪咕靈犀內完成購買。以及查天氣、打電話等功能,雖然讓用戶感到方便,但顯然不是讓他們願意花錢來獲取的服務。
賀曉光覺得,破解的方法,是幹脆放棄做大而全的引流服務,把垂直領域做深做透。
這意味著尋找合適的落地場景,和硬件載體很重要,單純的助手沒有商業模式。
" 助手就跟鬼上身一樣,灌入各種各樣的硬件,軟硬結合的時候會產生價值。"
對外,咪咕靈犀以一款 to C 的語音助手 APP 的面目示人,但事實上,咪咕靈犀這個概念,幾乎等同於訊飛超腦技術平臺。
" 過去我們什麼都接入,但很多真正有需求的內容卻做不下去。現在跟很多公司深度合作,他們會把內容給打我們,我們就相當於去到代理。當用戶在我這裡聽瞭一本書、買瞭一張票,我能獲取數據對你不斷學習,知道你的喜好,慢慢就能告訴你,你需要什麼,提供更多服務、產品和內容。" 賀曉光告訴 36 氪。
鄔霄雲的想法一樣。
剛回國時,他做過一個基於深度鏈接的 SDK 實現應用內搜索的產品。那個項目後來並未做大,但整日與應用商打交道,讓他在 2014 年就想明白一件事——做語音助手,如果自己沒有垂直的內容是不靠譜的。應用商肯定不希望你守在它跟用戶之間,或者在它的 APP 裡搞。如果想做個自己的界面,嫁接所有第三方功能,就得挨個跟對方談 BD,求對方開放 API 接口。對創業公司,這個任務太過於艱難。
所以奇點機智選擇不通過獨立的 APP 界面提供服務,而是通過底層技術,在用戶使用各類應用時,在 APP 裡面提供服務。鄔霄雲說,目前奇點機智能連接的 APP 有 100 多傢,日後會試著進一步擴大到 1000、甚至 10000 萬傢。
咪咕靈犀和奇點機智都在努力擴大服務,但速度還需要更快,因為危險的訊號來瞭——百度這類巨頭開放瞭免費的開發者平臺。盡管為開發者提供的定制化工具還不完善,但創業公司的處境會更艱難。巨頭入場,意味著以後單點競爭會演變為生態戰。最簡單的例子,騰訊的 QQ 音樂,百度的愛奇藝,阿裡的電商,隻要有一款助手,巨頭很容易在自己的生態內打造一個閉環。
擺在創業者面前的隻有兩條路:其一,趁巨頭還沒作出爆款,盡快建立自己的生態,或連接更多內容和服務商;其二,純算法生意勢必更加難做,一部分公司迫於無奈轉去做 to C 的硬件。
至於技術服務商轉型 to C,最在吃螃蟹的是出門問問。
那是 2014 年上半年,出門問問開始做智能硬件,李志飛為此糾結瞭半年,但想到雖然語音技術有瞭,但短期內用戶不看好,沒有流量和收入,技術幾乎沒有用武之地,他還是下瞭決心。不過在當時,九成同行認為他在往火坑裡蹦。
如今,出門問問依舊沒有盈利,但可穿戴設備、車載產品、智能音箱等幾款硬件產品,有的開始賺錢瞭。加之,有百度這樣的大廠商開始做免費的開放語音平臺,李志飛做硬件的路子,開始被更多做純 to B 的業務的算法公司效仿。
今年,以智能音箱居首,語音助手的落地場景開始有明朗的跡象。
但這門生意仍不好做。搜狗在與 to B 技術服務商拼技術,鄔霄雲近日忙著說服更多強勢的手機廠商,出門問問在打磨新硬件,咪咕靈犀也在想方設法吸引更多應用商的合作。不那麼沉迷流量後,廠商越來越接地氣。
而留給創業公司的時間也不多瞭。
語音分析創業公司 VoiceLabs 發佈的《2017 語音報告》顯示,2016 年 12 月對 Amazon Echo 和 Google Home 設備的調查中,隻有 11% 的消費者願意在購買 Amazon Echo 之後再購買 Google Home。這意味著,消費者開始自行劃分陣營。語音助手是個贏傢同吃的市場。
這是美國的情況。在中國,盡管消費者對智能傢居的接受度還不夠高,但是 BAT 引領的生態具有更強的封閉性和絞殺能力。除瞭與小魚在傢和做的百度,7 月 5 日阿裡的智能音箱天貓精靈上線後,三大巨頭中隻欠一款騰訊的音箱。
能否在巨頭的佈局成熟之前,打通語音技術準確度、服務和內容的豐富度,以及銷售渠道,三個環節,會直接決定一傢創業公司,能否搶到 " 中國版 "siri 的入場券。