下一個星巴克會開在哪？這裡有個 AI 選址的科學姿勢

編者按：本文來自微信公眾號"DT 財經 "（ID：DTcaijing），編譯 | 儲奕宇胡世龍；36 氪經授權發佈。

" 不眠之城 " 的咖啡情節

咖啡是紐約的 " 城市之魂 "。當你看到 " 大蘋果 " 街頭遍佈著 3389 間咖啡店，便會明白這座城市是一個 " 不眠之城 "。

追溯到 17 世紀中葉，當時其他殖民地偏愛茶飲料，將咖啡打入冷宮，而紐約卻對咖啡情有獨鐘，成瞭重要的咖啡大區。

到瞭 19 世紀中葉，紐約已經成為美國最大的咖啡烘焙中心之一。最近，初創企業 MassiveHealth 的研究就發現，紐約市民的咖啡攝入達到瞭美國其他城市居民的 6.7 倍左右。

如果你是一位紐約人，那麼你現在很可能正喝著一杯咖啡。

（圖片說明：咖啡品牌店 Caffe Reggio 在 1974 年的店面；圖片來源：Caffe Reggio）

咖啡對紐約來說如此重要，以至於它的容器之一——由 Leslie Buck 在 1963 年設計的經典 Anthora 紙杯成為瞭這座城市的標志之一。

（圖片說明：Anthora 咖啡杯在經典美劇《法律與秩序》中常常 " 露臉 "；圖片來源：NBC）

不過，盡管你現在還是可以從街上的雜貨店或酒店買上一份紙杯咖啡，但這種咖啡已經不是市場主流。

和美國的其他區域一樣，紐約的咖啡場景經歷瞭各種 " 咖啡浪潮 " 的洗禮。

然而，你要是覺得本文是想要回答類似 " 第四次咖啡浪潮是否出現 " 這些爭議性的話題，那就理解錯瞭。我們感興趣的核心問題是紐約咖啡店的店鋪分佈。

在這篇文章中，我們希望以紐約的咖啡店為例，來探索一個空間經濟學中的基本問題——商店是如何確定營業地址的？

為瞭解決這個問題，我們需要借助不同領域的技術和理論，來建立一套可以科學預測紐約最佳咖啡店選址地點的模型。

科學預測選址地點的方法：建立一套預測模型

下面這張地圖展示瞭紐約城所有 3389 傢咖啡店的分佈（排除餐館、超市和其他可能售賣咖啡的商鋪）。

地圖上的每一點都代表著一個基於地理位置作出的商業選址決策，顯然，紐約的某些地區相較其他區域更受咖啡店主的歡迎（這其中曼哈頓中城和下城獨占鰲頭）。

為瞭更好地理清咖啡店的選址因素，我們開始思考：

是什麼原因使得一個地區比另一個更具吸引力呢？為什麼咖啡店存在著在相同地區集群化的趨勢？目前的咖啡店佈局是商業的最優佈局嗎？

為瞭弄清楚這些問題，我們建立瞭一個模擬紐約城咖啡店地理分佈的模型。參考瞭博弈論中的思想，我們把建立模型的過程分成瞭三部分：

1. 輸入：確定哪些是影響咖啡店選址的關鍵因素

2. 模擬：基於不同的輸入，反復進行模型優化

3. 預測：紐約未來的咖啡店的最佳選址是哪兒

影響咖啡店選址因素：價格、距離、人口、競爭、文化等

首先我們來看看，哪些是影響咖啡店選址的主要因素呢？

作為消費者，決定去哪裡買咖啡往往非常簡單。大多數情況下，我們基於口味偏好，價格高低，遠近方便程度等進行選擇：為瞭喝上一杯你喜愛的咖啡店的咖啡，你願意走多遠的路，花上多少錢呢？

作為咖啡店店主，決定在哪裡開店卻會相當復雜。

是不顧市場飽和且有激烈競爭的情況，在靠近佈萊恩公園（曼哈頓）的地方開上一傢店呢？還是在一個顧客密度較小但競爭不大的地方，比如托滕維爾（斯塔騰島）開上一傢呢？倘若定位是高端咖啡店，選址是不是應當遷往公寓租金最高的葛蘭姆西公園（曼哈頓）呢？

為瞭總結出一套能夠預測咖啡分佈的影響因素，我們從著名的霍特林模型和它背後的最小差異原則入手。霍特林模型來自於 " 供應商傾向於選擇靠近顧客的地址 " 這一假設。

基於這一原則，競爭者傾向於在所有可能的顧客中心——相同地點選址。這便是上圖的由來：曼哈頓中城和下城，這兩個紐約人口最密集的地區以壓倒性的優勢匯集瞭紐約大多數的咖啡店。

（圖片說明：霍特林模型相關分析演示，紅色和綠色方塊代表某沙灘邊上的 2 個冰激凌攤販，假設總共有 100 名顧客都準備就近購買，那麼隻要其中一個攤販的位置移動，它們的顧客數量也會相應發生改變。）

盡管霍特林的理論有助於我們更好地理解店鋪和顧客之間的距離、以及店鋪之間的競爭是如何影響商業選址的，它仍有局限之處：霍特林假設所有的競爭者都提供相同的服務，這與 2017 年紐約咖啡業的真實情況大有不同。

而一些霍特林模型的修正版本甚至認為，兩個異質的競爭者傾向於最大化彼此之間的距離，來更好地形成壟斷勢力。

因此，我們還需要考慮那些使咖啡店彼此互不相同的因素——飲品的質量，價格水平和咖啡店的店鋪文化。

最後，鑒於我們在對真實世界的選址進行建模（存在規劃上的限制、需考慮周邊的環境），我們將可獲得的商業區位信息、周邊地區的社區文化和經濟水平也納入模型之中。

算法和模型的不斷打磨、優化

接著我們進入模擬環節。

我們利用接近霍特林模型原始公式等一系列基礎方程進行模擬過程的初期推導。對於每個方程，我們通過數學計算進行調整，以賦予不同的權重值（Wu1,Wu2 等），不斷對模型進行改進優化以產生更接近現實的結果。

下面我們以咖啡店 C 為例，給出瞭不同指標的計算公式。

咖啡店 C 的功效評分值：我們基於咖啡店飲品質量與距離兩個因素之間的均衡，定義瞭評價咖啡店 C 的功效函數。

（其中飲品質量的數值通過整合從不同渠道獲得的關於咖啡店 C 的點評得到）

顧客光臨咖啡店 C 的可能性：我們將店鋪的功效評分值占所在地區其他所有咖啡店功效評分總值的比例，作為顧客選擇咖啡店 C 的概率。

咖啡店 C 位於區域 N 時的顧客人數期望值：假設一傢咖啡店選址在區域 N，我們可以通過將咖啡店選址在區域 N 內各地區時顧客光臨的概率乘以該地區的人口總數進行加和，來估計咖啡店 C 可能擁有的顧客人數。

詳細寫法表達如下：

得到上述方程後，我們對紐約市的 3389 傢咖啡店進行瞭模擬，並不斷通過對咖啡店進行重新定位、使總體最接近納什平衡情況，得到瞭我們第一份關於咖啡店最佳分佈的結果。

不過，這份結果對於我們分析紐約咖啡分佈圖毫無幫助，反而與紐約的人口分佈圖有著驚人相似。

這一失敗的嘗試提醒我們要考慮街頭咖啡的一個重要特征：它們一般是白天飲用的飲料。因為需要對模型做的第一點優化便是在模型中利用白天的人口（而不是一般居民）的地理分佈信息。

（圖片說明：紐約人口居住分佈情況。）

（圖片說明：紐約白天人口分佈情況）

完善瞭這一點後，我們的模型就立刻發現，咖啡店在曼哈頓中城和下城顯示出瞭明顯密集的集中趨勢，修正後的地圖也與實際的情況更加相近。

然而在一些特定地區（如第五大道，華爾街等）卻出現明顯過於飽和的現象，周邊大量地區密密麻麻地被咖啡店占據，而這個數字幾乎是不符合實際的。

顯然，咖啡店應當隻位於經濟貿易集中的地帶（即商圈）；我們想起瞭之前討論到的一個關鍵輸入變量：周邊區域的經濟水平，將它納入模型後該問題得到瞭解決。

接著，將商圈的相關信息納入模型後，我們的地圖離目前紐約咖啡分佈情況又近瞭一步。

中央公園南部和華爾街的過飽和情況得到緩解，而曼哈頓以外的咖啡店分佈開始清楚地表現出沿著主幹道分佈的特點；在更遠的區，咖啡店往往靠近居民生活圈的中心。

就當我們對整合結果十分滿意時，我們還想起瞭沒有考慮過、卻是最為舉足輕重的經濟因素：價格。

我們通過修正我們的功效函數，將價格因素整合到瞭模型之中：

把價格作為輸入量納入模型是我們為瞭成功度量而進行優化的過程中必不可少的一環——畢竟一傢店鋪的成功與否，是由總收入的多少而非顧客的數量定義的。

進一步的，為瞭解釋紐約城各地區飲食，租金，房價等價格差異，我們將周邊社區經濟綜合指數作為輸入量納入模型；因此當地區的物價總水平越高時，咖啡的價格因素在我們模型中產生的影響也越小。

盡管目前模擬的全部店鋪選址分佈已經同現實高度近似（在前面已指出），我們得到的地理價格分佈地圖卻遠非如此：尤其在模擬曼哈頓區咖啡價格時，實際情況遠遠低於預測的理論值。這主要是由以下原因導致的：

曼哈頓超高的咖啡店密度→曼哈頓店鋪間激烈的相互競爭→導致曼哈頓咖啡的低價格

這次試驗的失敗主要原因出在瞭咖啡文化上。任何一個 2017 年在紐約東村地區 ( 在曼哈頓，是嬉皮士出沒的地區 ) 買過咖啡的人都知道——如今在曼哈頓，咖啡店之間比拼的不是價格，而是文化。

因此，在模型中還需要考慮到文化的因素。

La Colombe 和 Dunkin ’ Donuts（兩傢紐約的著名咖啡店）之間的競爭不僅僅在於價格方面，還存在文化上，因為它們展現給消費者的是完全不同的兩類文化（以及產品）。

不同的咖啡店有著不同定位的目標顧客——一傢精品咖啡店也許在佈什維克走紅，卻很可能在時代廣場碰壁；Dunkin ’ Donuts 可能在時代廣場吃香，卻在對它不太友好的地鐵沿線遭到冷遇。

為瞭描述這些差異，我們將咖啡店分為（互相存有競爭的）三類：

1. 主流咖啡店（Blue in maps、Dunkin ’ Donuts、星巴克、7-11 ……）

2. 精品咖啡店（Pink in maps、Stumptown、La Colombe、Blue Bottle ……）

3. 紐約當地特有的咖啡店（例如隻有 NYC 才有的 Green in maps）

利用 Topos 上相關的特征和指數加權（抓取每個地區的 " 心理 " 特征），我們能夠對紐約每一個地區（N）的咖啡店（C）計算出其文化契合值。

因此我們進一步修改瞭功效函數，將文化契合也作為其中的一項參考因子。

和之前模擬過程相同，我們允許每一傢咖啡店重新進行分佈，直到總體近似達到綜合各方面因素下的納什平衡。

這一平衡的條件確保瞭區域內部不會因為特定的一類咖啡店而出現明顯過於飽和的情況，即便在該區域中這一類咖啡店的文化契合度達到瞭最佳狀態。

（圖片說明：左圖為咖啡店的實際分佈圖，右圖為基於各種因素模擬出來的結果。）

如圖可見，最終模擬的結果與 2017 年紐約的咖啡文化實際情況相近。曼哈頓中城被主流咖啡店占領；精品咖啡店攻陷瞭曼哈頓下城區、佈魯克林和皇後區東部，但很少在佈朗克斯出現，在斯塔騰島更是寥寥無幾；本土咖啡店由於相互之間的異質性，並不會局限於任一特定地點。

當然，還存在很多的細節信息（手沖咖啡？京都冷萃咖啡？下一代咖啡汽水？……）能夠讓我們來細化目前的模型，不過在現階段，我們更好奇該模型會對紐約城未來的咖啡店分佈做出怎樣的預測。

預測未來的 200 傢咖啡店開在哪

最後到瞭揭曉我們模型的預測結果的時候瞭，紐約接下來可能會開的 200 傢咖啡店會開在哪裡呢？

根據目前紐約三大類咖啡店鋪的數量比（主流：當地：精品），我們試圖對紐約未來開張的 200 傢咖啡店鋪的最優佈局利用模型進行模擬。

上圖是模型預測的曼哈頓地區未來 200 傢咖啡店的分佈，圖中綠色代表本土型咖啡店，藍色代表主流咖啡店，粉色代表精品咖啡店。

令我們大出所料的是，曼哈頓新開咖啡店數目低於大傢的預期；相比之下的佈朗克斯區則如同一片機遇的沃土，在 200 個模擬點中占據瞭 31% 的最大份額。這也恰好與該區近年來人口數量的增長以及私人領域工作機遇的增加相對應。

為瞭獲得更多有關文化特異性的信息，我們決定針對特定的咖啡店類型和品牌，繪制出它們未來 10 傢店鋪對應的選址地圖。

未來的 10 傢 Dunkin ’ Donuts 開在哪？

除去炮臺公園這一例外，佈朗克斯區 4：皇後區 4：曼哈頓區 1 的結果表明：Dunkin ’ Donuts 在距離曼哈頓區較遠的地方擁有更多的成功機遇。

（佈朗克斯：4 傢；皇後區：4 傢；曼哈頓：1 傢；佈魯克林：1 傢）

未來的 10 傢星巴克開在哪？

與 Dunkin ’ Donuts 的情況相反，星巴克在曼哈頓更有可能獲得成功，畢竟在那裡，它的高價格造成的影響將被削弱。另外我們還發現，超過半數的星巴克的位置都選址在外部的區域。

（曼哈頓：5 傢；皇後區：3 傢；佈朗克斯：1 傢；佈魯克林：1 傢）

未來的 10 傢精品咖啡店開在哪？

曼哈頓和佈魯克林仍然更青睞於精品咖啡店，為其保留瞭最多的機遇（意料之中）。值得一提的是，精品咖啡店在每一個地區都表現出選址上的特定趨勢：在曼哈頓選址偏向上部，在佈魯克林偏向外部。店鋪不再是簡單地聚集在曼哈頓下城和佈魯克林的通勤區，我們發現其在曼哈頓區的位置正向著哈萊姆區上移，而其在佈魯克林的選址正逐步偏離通勤區，一直遠到皇後區的瑞吉屋（坦白說這也許是皇後區最佈魯克林的地區瞭）。

（曼哈頓：5 傢；佈魯克林：4 傢；皇後區：1 傢）

結語：分析咖啡店選址的意義

無疑，比起現代城市生活這一更大的謎題，咖啡店分佈不過是其中小小的一塊；然而它們的重要性絲毫不容小覷。

從它們在啟迪上的影響到它們始終作為 " 第三生活空間 " 的中心地位，咖啡店——以及它們置身參與、創造、設計的咖啡文化——在現代生活體驗中扮演瞭一個重要的、也不無爭議的角色。

因此，通過不同途徑瞭解咖啡店，從自然語言處理到模擬預測未來的咖啡店選址等，都是一種微小而重要的途徑。而我們還希望通過大數據和人工智能這一對利器來改變人們對城市的傳統認知。

註：本文編譯自 Medium.com 網站文章《The Next Wave: Predicting the future of coffee in New York City》，略有刪節，文中圖表均來自原文。

意見反饋

下一個星巴克會開在哪？這裡有個 AI 選址的科學姿勢