科普 | 想了解地址解析聚合服務?看這一篇就夠了!


最後一公里配送是整個物流業務鏈路中的重要環節,爲了提高配送效率,企業通常會將物流運單地址聚合。目前傳統企業面臨諸多不便,一個是傳統逐一配送的方式會造成重複運輸、運力浪費的情況;另一個是人工劃分區域聚合的方式不僅效率低下,當碰到一些奇怪的地址時還很難確定其真實位置。


地址解析聚合是一種高度集成化的服務, 根據用戶輸入的運單地址,解析該地址真實座標;並結合多類地圖數據,從空間關係和文本結構兩個角度,將運單分類聚合至最小派送單位。地址解析聚合服務支持多維度的聚合功能,可根據POI、路段、道路、行政區劃(省、市、區、鎮)等維度來進行聚合,滿足不同的需求。



地址解析聚合最爲基礎的能力是地址解析,這個能力類似於地理編碼服務,但優於地理編碼服務,優勢主要體現在兩個方面:


一、地址解析聚合的準確率更高這得益於多方面的能力的集成。數據方面,地址解析聚合充分使用全國五級行政區劃的數據、路網數據和地圖底層數據(如POI數據),並進行聚合數據挖掘,可以解決全國絕大多數地區包括偏遠地區的地址解析精度問題;語意理解方面,地址解析聚合藉助於強大的NLP分詞能力,可切出行政區劃、POI、主體和手機號等多類型信息,爲後續的解析提供良好的基礎;自學習能力方面,地址解析聚合並非一成不變,解析聚合擁有學習優化能力,在原始解析精度較好的基礎上,不斷提升解析結果的準確率。


二、地址解析聚合的輸出信息更多其結果不僅僅包括經緯度座標,還包括標準化地址信息信息,如姓名、電話、行政區劃、道路、路段、POI等。座標僅僅只是解析的結果之一,在很多的應用場景中,行政區劃、道路、路段、POI等信息的使用率完全不低於經緯度座標信息。


舉例說明地址解析,現有地址爲“李白135****1111上海市金科路百度上海研發中心F6A000”,最終可以解析出來姓名爲“李白”,聯繫方式爲“135****1111”,行政區劃信息爲“上海市上海市浦東新區張江鎮”,其中“浦東新區”和“張江鎮”爲解析服務補全的信息;另外,原地址文本中的“金科路”被糾正爲“中科路”,並且解析出路段信息爲“中科路(百業路到納賢路)”。解析結果中,還包括POI點的信息“百度上海研發中心”,以及其他內容“F6A000”。



地址解析聚合服務充分發揮了百度地圖的“AI+地圖“能力。在架構設計中,底層對物流行業的地圖基礎數據進行鍼對性挖掘,得到聚合場景下所需要的數據。相對於基礎數據,聚合數據的粒度會更細,同時聚合結果可加快數據搜索速度。


中間層結合了文本理解和空間結構分析兩大能力空間結構分析主要是一個地理編碼與逆地理編碼的過程,當地址中的POI信息可以精準匹配的時候,該地址的解析結果會非常準確,但是當地址中存在無效POI或者錯別字等誤導信息的時候,解析結果的誤差比較大。而文本理解主要包含文本分詞、消歧、補全的過程,並在最終通過標準地址庫得出標準化地址,這種方式可以充分利用原地址中的行政區劃、道路、POI等信息,不依賴於地址的空間關係進行地址補全和消歧,但是這種方式完全脫離了位置座標信息,可靠性也較爲依賴地址文本質量。地址解析基於這兩大能力,可以得出比單獨一種更好的解析效果,同時也具備了一些額外的能力:對於文本較爲精準的地址具備部分地址信息補全能力,對於異常地址具備識別的能力,對於道路等信息具備部分糾錯能力。


最上層由機器學習算法進行最終優化和確定解析結果機器學習算法會根據地址文本的特徵以及文本理解和空間結構分析得出的結果判斷如何對結果進行優化和選擇,除此之外,機器學習算法具有成長性,基於下層的可靠解析結果,在不斷的進行學習後,準確率會持續提升。



地址解析聚合提供多維度地址分級聚合能力,可簡單歸納爲七級——省、市、區、鎮、道路、路段、POI前述的省、市、區、鎮聚合能力,特別是前兩級,可以用於幹線運輸的運單地址聚合,而後幾級則可以用於最後一公里配送過程中運單地址聚合。在傳統末端配送中,運單聚合通常只通過POI聚合的,但是很多POI(小區、園區、商場等)配送點我們並不知道它們的具體大小和形狀,即使是同一類型的POI,它們的情況也可能會迥異,這就是爲什麼地址解析聚合提供更多維度聚合:比如按照道路、路段進行聚合,一條道路或者路段可能會橫跨過多個POI、AOI甚至是鄉鎮街道行政區劃。基於地址解析聚合服務,你可以選擇:


1、區域面聚合:有些POI(小區、寫字樓、園區、風景區等)有具體的邊界座標,通過空間位置關係計算可以確定哪些運單地址位於這個區域,從而將相同區域的運單聚合到一起。這種聚合方式較爲常見。


2、關聯關係聚合:有些POI(如“百度上海研發中心-東門”)有父POI(如“百度上海研發中心”),可以將其關聯到父POI上。


3、挖掘聚集區:從歷史運單地址中用數據挖掘算法找出運單相對集中的區域,將這些挖掘出的區域面作爲以後的聚合區。


4、地標建築聚合: 地圖中大多數POI(住宅小區、寫字樓、園區、商場、景點等)只有一個座標位置,並不知道具體的大小、形狀,無法判斷運單地址跟這個POI的關係,但是很多地標性建築(小區、大廈、商場、酒店、地鐵站、政府機構等)常常用來粗略標誌一個小區域,因此可以選取大量的地標性建築將附近一定範圍內運單全部關聯起來。


5、路段聚合:大多數運單地址都可以關聯到附近的一條道路上,但是道路一般很長,不適合直接作爲聚合點。將道路沿路口切開,分成路段,給每個路段賦予一個名字來標識,如“百度上海研發中心所在的中科路路段”命名爲“中科路(百業路到納賢路)”,用路段將沿線的POI關聯起來。這種方式可以既有實用道路聚合的靈活性,又可以避免道路過長導致的聚合量級過大的問題。



百度地圖智能物流解決方案


百度地圖智能物流解決方案是爲物流行業量身打造的一整套核心場景應用體系,基於自身超級時空數據體、物流地圖和強大的智能調度服務, 目前我們已在業界推廣,幫助合作伙伴大幅降低運輸成本,已成爲物流全域行業降本增效的利器。同時,百度地圖智能物流解決方案已覆蓋 快遞快運、貨運平臺、同城配送、快消、能源、冷鏈等 衆多物流行業垂直領域,並與 雙匯物流、中國建材、日日順供應鏈、古茗科技、叮咚買菜、步步高商超等 行業標杆企業達成深入合作,成爲物流行業的新基建底座及降本增效利器。


如需瞭解更多“百度地圖智能物流解決方案”,請點擊『閱讀原文』


往期回顧:

Redis 主從複製的原理及演進

讓塗鴉小人跟隨真人學跳舞

前端工程師的成長故事


本文分享自微信公衆號 - 百度開發者中心(baidudev)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章