AI 不僅會下棋,已經開始在救人瞭

08-01

7 月 20 日下午,由杉樹科技和鈦媒體聯合主辦的 "AI 大師圓桌系列會議 " 在上海財大豪生大酒店召開。會議中,清華大學助理教授唐平中博士首先介紹瞭人工智能(AI)與經濟學的結合。

隨後,上海財經大學教授,中國運籌學會青年科技獎獲得者何斯邁教授則介紹 AI 怎麼與運營管理和商務中的實踐結合起來。

何教授用腎移植作為例子解釋瞭 AI 是如何幫助腎移植提高匹配效率的,在目前 AI 系統的幫助下,器官交換移植配對系統的效率一直在提升,最好的系統效率已經到瞭 90%,也就是能保證達到理論最優解得至少 90% 的配對率。另外在各個非盈利腎移植機構內,腎移植的數量已經從每年 28000 例提升到 33600 例。

隨後,何教授還介紹瞭 AI 如何幫助商傢定價,定價是一個非常動態,變化很快的過程。客戶、友商、商品性質都會導致定價產生重大變化,這時就需要 AI 幫助商傢進行重要的決策。

何斯邁博士發表演說

以下為演講全文:

何斯邁:大傢好,剛才唐老師介紹瞭博弈論怎麼和 AI 結合,接下來我主要是介紹 AI 怎麼與運營管理和商務中的實踐結合起來。

演講主要是關於商務智能,就是運營管理中的人工智能。主要內容分三塊,其中第一部分是 AI 在器官移植中的應用,也是向 Sandholm 教授致敬(他是腎移植這方面的專傢)。這一系列工作由於社會的極度需求,對公眾利益有著重大意義。

現場的另外一位嘉賓、" 冷撲大師 " 開發者 Tuomas Sandholm 教授

第二部分是關於收益管理,主要討論在定價和庫存這些具體的決策問題的時候,怎麼把 AI 和具體的商務環境結合。

第三部分,在收益管理,包括庫存管理的時候,也需要考慮到一些策略性的顧客行為,這個牽涉到很強的博弈背景。 顧客觀察到或猜測出商傢的決策規律,會相應的做出一些策略性的購買行為,對商傢的策略效果及最優決策有很大的影響。

在運營管理領域的人工智能應用主要分三大塊。一部分和傳統的 AI 很接近,也就是有數據以後怎麼去分析數據,怎麼依托數據進行預測。一部分是模型,需要結合具體的商務環境和需求,進行定制化的調整。一部分是算法,因為商務場景經常需要在有限的時間和計算資源內,解決復雜的決策問題。

傳統的 AI 現在有一些很好的應用,比如說著名的 Alpha Go。在圖象識別、語音識別、文字翻譯這些領域,AI 已經做得很好瞭。這些領域都有一個普遍的共同特征,是目標非常明確。比如說圖象識別、人臉識別,評判標準就是識別準確度多高?一般來說無論是問題還是目標定義都比較明確,外部環境也比較穩定。

但是在商務智能的時候,我們面臨完全不同的問題和環境。今天的商務環境,可能到明年就完全不一樣瞭,經濟大環境可能會變,競爭對手也在變。尤其在 AI 的應用領域,目前很多應用是關於電商。但是對於主流電商來說,目前每年的增長率都極高。可能每一年內,它的產品結構、客戶結構都在變。

第二個大問題,在商務環境中有很多目標,但沒有唯一明確的目標。可能企業在裡面,有的部門想要追求庫存管理的優化。另外的部門想要保證定單滿足率,越高越好。收益管理中銷量和利潤之間的往往也需要平衡。在不同部門之間追求的目標並不一致時,我們應該如何決策?在具體的實際場景,不同部門之間的需求差異如果能夠充分挖掘、不同約束之間的復雜關系如果可以得到充分梳理和考慮,對於收益的提升是非常顯著的。因此需要結合問題的本身,通過模型把 AI 的技術和問題更好結合起來。

AI 與器官移植

這兒說一些具體的例子,首先是器官移植,傳統的器官移植主要是兩種,一種是親屬捐獻。另外一種傳統的捐獻方式是死者捐獻,死者在死前簽署器官捐贈協議。但是,基本上任何一種器官,死者捐獻的數量目前來說是遠遠不夠的。比較嚴重的腎移植,隻有 10%-20%,這個數目是非常非常低的,那麼怎麼辦?

在醫療實踐中,經常有親屬願意捐獻但是不能捐獻,往往是因為血型、各種抗體的原因導致不匹配。因此有可能會有這樣兩個傢庭,A 的傢屬給自己的親屬 A 捐獻不瞭,但是適合另外一傢的病人 B。 而 B 的親屬的器官適合病人 A。在這種情況發生的時候,雙方可以通過交換捐獻的方式解決問題。慢慢的這種應用越來越廣泛,因為它確實能救很多人的命。後面大傢發現,能不能做得更多?比如說我兩個人配不起來,但是三個傢庭通過循環的方式進行匹配,四個傢庭、五個傢庭都可以。

歷史記錄最多的一次是同時有十多個傢庭構成大循環一起手術,但是這種移植方案有一個嚴重的問題,就是多臺手術必須同時做。因為腎移植可能出現捐贈者突然翻悔,這是會出現嚴重的問題,尤其是反悔方的捐贈對象的親屬已經捐贈完畢的情況出現。為瞭避免這些問題出現,現在的法律就嚴格規定,必須在同一個時間交換執行。但即使如此,有時候還是會有一些問題。

多人交換腎移植手術

還有一種方法是鏈式匹配。簡單的說就是將死者捐獻的器官移植給某個病人,但是前提條件是病人的親屬答應把腎捐給下一個病人,這個病人的親屬又答應把腎捐給下一個,形成鏈式反應。鏈式移植的最大好處是並不需要嚴格同時執行,每一個傢庭都是病人先得到腎再由捐贈人捐獻器官。如果有人翻悔,雖然會有一些負面的影響,但是相對來說小很多。鏈式移植的另一個好處是可選擇性高,相對來說,會大大提高系統的移植效率。缺點是會消耗一部分死者捐獻的腎源。

選擇死者腎源的鏈式移植

目前美國已與 2007 年已經正式立法,允許交換移植。已經成立瞭一些機構和平臺作為腎移植交換機構,比如說 UNOS 等。主要是非營利性的,目的是搜集病人的數據和願意捐獻器官的親屬的數據,更好地把這些親屬匹配起來。在這些機構建立 4-5 年之後,腎移植的數量從每年 28000 例提升到 33600 例。

但是鏈式移植會面臨一個道德難題,死者捐贈的腎遠遠不夠滿足無親屬捐贈的病人需求。一個腎在一方面可以通過鏈式移植救很多的病人,但是同時一定會有病人因此無法得到合適的器官移植。這個有點像著名的電車難題,軌道上有一群小朋友在玩。當你看到一個火車過來瞭,可以選擇將火車扳一個岔道從而拯救這些小朋友,但是會害瞭在岔道上工作的另一個人。

著名的電車難題

這是一個普遍性的道德難題。所以在腎移植的時候,決策不是簡單的人越多越好。因為有些類型的病人,因為抗體和血型特殊很難配上,在隻追求短期移植效率最高時這種特殊病人就會積壓下來。在這種時候,就不是一個簡單的預測,我必須預測每一個腎捐給一位病人之後能活多久,他們之間移植存活率有多高。這種時候我們用機器學習,讓人工智能決策,效率會高很多。

這種決策是典型多階段的動態決策,牽涉到一些沖突,這種時候你怎麼去解決?目前來說在 UNOS 使用整數規劃算法,好處就是相對來說移植率比較高,每一個階段配的人數比較多,但是也有一些問題。我們最近有一篇論文,提出瞭一個比較簡單的隨機近似算法,用這個算法甚至可以不依賴計算機,通過人工執行,達到很高的效率。並且困難病人不會積壓。目前這個器官交換移植配對系統的效率一直在提升,最好的系統效率已經到瞭 90%,也就是能保證達到理論最優解得至少 90% 的配對率。

值得一提的是對於這些決策的研究,理論上的深入探討,是非常困難的。斯坦福大學的諾獎 Roth 教授等做出瞭傑出的工作。今天到場的 Sandholm 教授更是美國最大腎源庫 UNOS 的實際算法管理者。我們過去幾年也在試圖回答這方面的問題,特別是實際網絡中有效算法的估計,並取得瞭一些理論上的很出人意料的突破,獲得瞭 Sandholm 教授等人的註意和贊揚。也是我們最初結識他並能夠邀請他到上財講學的主要原因。

AI 在收益管理中的應用:商傢定價難題

接下來介紹一下 AI 在收益管理中的應用,這個是基於我們跟很多傢電商合作時碰到的實際問題。在收益管理中間,關鍵的一個問題就是如何定價。這個問題很復雜。

首先,對於不同產品定價邏輯不一樣。很多商傢隻是簡單地預測定一個價格能夠賣多少件,然後選取一個看上去比較合適的價格。但這是不夠的。有些產品在市場上采用最簡單的成本定價,就是成本是多少,加一個權重,產生售價。而在電商環境中,大部分關鍵產品采用的定價邏輯都是比價活著跟價,就是要保證比競爭對手價格低。大傢現在能看到很多電商平臺的產品都會保證比競爭對手產品價格低,如果高瞭會賠償損失。還有一些產品,它面臨的競爭環境不是很激烈,那麼它的定價邏輯要考慮供需關系。

這種時候往往是利潤空間比較大的。還有其他的定價方式,比如價格歧視,區別於一般的定價對所有顧客都是統一價格,價格歧視需要對不同顧客給出不同價格,從而最大化利潤。我們還提出一種定價模式,叫做魯棒定價。本質上是即使預測精度不盡人意,依然有可能通過模型和理論保證給出的定價策略有效,並且風險可控。綜上所述,如果對產品沒有比較好的理解,那麼根本不可能做到一個合適的定價。對不同的產品,首先要瞭解不同的產品定位,決定基本的定價邏輯。

其次,定價需要考慮很復雜的因素,簡單拿數據分析的時候,容易把一些關鍵因素漏掉。比如說需要考慮友商的價格和客戶的心理價位。今天我一直定價 20,但是友商可能從 20 調到 25,如果數據中不包括友商的價格因素不可能做出高精度的預測。

此外還有顧客價格的敏感度,有些顧客對於價格無所謂,小幅度調整的時候,他關心的是你的服務。但是另外有些顧客會比較敏感。 這會產生一個有趣的問題,商傢是做周期性做促銷,還是一直讓價格定在中間保持平穩更好?另外還有季節性的產品。或者替代性產品,比如手機,三星、蘋果、華為等等,他們之間有嚴重的替代效應。最後是互補性產品,顧客買電腦的時候會買鍵盤、鼠標各種配件。

2015 年的 " 雙 12",鄭州某商場也打出瞭促銷招牌 @視覺中國

定價的時候最大的挑戰是促銷,不光是你自己做促銷,競爭對手也長期做促銷,很多產品,你會發現一年 90% 的時候,你或者你的競爭對手都在做促銷。這時候怎麼定價,促銷會產生各種各樣的影響。

比如說從跟價和比價的時候使用對象是什麼?高關註度和競爭度比較高的產品,在比價的時候,有一個很嚴重的問題。計算顧客對價格的量價關系,傳統的統計或者經濟學模型往往用參數模型,很多人用線型模型。但是在比價的時候,量價關系一般極度脫離線型關系。顧客在心理價格段附近比較敏感,偏離心理價格比較遠的時候不太敏感,這裡會牽涉到很多問題,比如說怎麼捕捉心理價格位,這往往和友商的價格以及類似產品的價格有關。

還有一個就是我調瞭價格,友商很可能跟著調。這種情況是動態的,我可以選擇跟著友商一起調價,也可以避開調價做促銷的日子,拿到他不做促銷的時候去做。這時所要采用的手段包括網絡爬蟲及機器學習,預測和捕捉對方的行為。因為牽扯到博弈,需要知道在市場上,我們是一個價格主導者,還是價格跟隨者,跟競爭對手處於一個什麼關系?具體的決策和市場定位密切相關。

另外,我的當期利益和遠期利益的平衡點是什麼。比如亞馬遜的策略,是在競爭對手中保持絕對低價。這個策略在美國大獲成功,使得亞馬遜取到壟斷地位。但是在中國同樣的策略效果很差,亞馬遜基本被擠出市場。

在美國,亞馬遜的網絡銷售占據總銷量(包括線下銷售)的 14.3%,遠超第二名沃爾瑪網絡商店(圖:statista)

關於供需關系,我們可以看到利用供需關系去做定價的話,通過整體的一個調整,可以讓銷量、營收和利潤都大幅增加,而且幅度相當高,這是魯棒定價的效果。圖中所示是某閃購電商平臺的訂貨策略效果,我們通過兩階段,第一階段采用魯棒定貨,第二階段結合人工智能學習的手段,把新數據運用進去,可以對績效產生大幅度提升。

精彩圖片
文章評論 相關閱讀
© 2016 看看新聞 http://www.kankannews.cc/