4月24日,高德地圖面向導航場景正式推出“AI 伴行”產品,它不僅能理解用戶的語言,還能實時感知用戶的位置、方向與周邊環境,通過攝像頭理解街景畫面,并結合地圖數據給出與當前處境高度相關的建議。
這是行業首款面向真實世界出行場景打造的全模態出行伙伴。通過多模態感知與地圖能力融合,高德正試圖把導航服務升級為能夠理解現實世界的 AI 伙伴。

從“找方向”到“做決策”
在日常出行中,許多用戶都會遇到這樣的情況:導航剛開始時站在路口,卻不知道自己應該往哪個方向走。某些導航會提示“向東步行200米”,但對于不熟悉方向的人來說,“東”并不是一個直觀的概念;如果以“向左或右……”替代,雖然能解決大部分問題,但在某些特殊位置也會顯得不那么直觀。
AI 伴行則會給出更貼近現實環境的指引。例如用戶詢問“我該往哪邊走”,AI 伴行會根據用戶當前朝向與周邊地標回答:“朝著你右手邊那個麥當勞的方向走。”系統會將抽象方向轉化為用戶眼前可見的參照物,從而降低理解成本。
在更復雜的出行需求中,AI 伴行也能夠理解多重意圖。例如,當用戶說“我走累了,前面哪里可以坐公交回酒店?我還想買瓶水”,系統會同時分析當前位置、酒店位置、附近公交線路與周邊店鋪信息,給出完整方案:先經過附近便利店購買飲料,再步行至公交站乘坐相應線路回到酒店,并在地圖上同步標注路徑與地點。
在景區場景中,AI 伴行還可以充當實時導覽。例如用戶提出“故宮必逛路線,順便看看翊坤宮”,系統會生成一條完整的游覽路徑,并標注沿途核心景點。當用戶在行進過程中提出新的需求,如“最近的洗手間在哪”,AI 伴行會結合當前位置即時給出導航方案。
此外,AI 伴行還支持視覺識別場景。用戶在街區或歷史建筑前舉起手機,詢問“這棟建筑給我講講”,系統會識別畫面中的建筑,并結合地理位置提供歷史信息、開放時間、門票情況等,同時提供前往入口的導航選項。如果用戶對一家店鋪感興趣,也可以通過拍照獲取評分、人均消費和招牌菜等信息。
四項關鍵技術支撐真實世界理解
這些場景背后,是高德為 AI 伴行構建的一套以 Agent 為核心的技術體系,主要由時空上下文感知、多模態融合理解、空間行動能力以及復雜任務處理機制四個部分組成。
首先是時空上下文感知能力。AI 伴行始終運行在一個持續更新的時空上下文中,系統會實時感知用戶的位置、行進方向、導航進度以及周邊環境,并持續更新空間、時間、環境和行為等信息。當用戶提問時,這些信息會一起參與AI的推理,使系統能夠準確理解“前面”“左邊”“順路”等與具體情境密切相關的表達。隨著使用時間增加,系統還可以逐漸積累長期記憶,從而更好地支持用戶連續和復雜的出行需求。
第二是多模態融合能力。AI 伴行能夠同時融合文本、語音、視覺和位置信息,對用戶所處的真實場景形成整體理解。例如,當用戶對著一棟建筑說“這棟建筑真壯觀,給我講講”時,系統會結合語音內容、攝像頭畫面以及當前位置識別建筑并提供相關介紹。
第三是空間行動能力。傳統 AI 助手通常只提供信息,而 AI 伴行可以直接調用地圖能力完成具體操作,例如規劃路線、發起導航、在地圖上標注推薦地點,或根據用戶需求實時調整路徑,系統還可以結合用戶位置進行主動提示。這讓 AI 實現了從被動應答到主動伴行的轉變,成為能同時操控語音、視覺、地圖和導航的出行伙伴。
第四是復雜任務處理機制。AI 伴行內置了“龍蝦模式”,能夠將包含多個條件的需求拆解為不同步驟,并調用相應能力逐步完成。例如用戶提出“在雙井附近找一家評分4.5以上、人均100元以內的淮揚菜,飯后還能遛彎”,系統會先篩選符合條件的餐廳,再以餐廳為中心尋找適合散步的公園,并將相關地點和路線展示在地圖上。
這一能力依托于 QwenPaw 任務處理框架,通過調用搜索、路線規劃、視覺識別等不同工具,并在多輪對話中持續記錄用戶需求,使 AI 能夠一步步完成更復雜的任務。與此同時,這一架構也支持持續擴展能力,使AI 伴行可以在真實出行中承擔越來越多的輔助角色。
從導航服務到出行伙伴
從行業角度看,AI 伴行代表著地圖導航的一次重要范式變化。
過去十多年,地圖導航主要是在把真實世界“數字化”——把道路、建筑、商鋪等信息變成地圖里的數據,再通過算法幫用戶規劃路線。而 AI 伴行更進一步,它嘗試讓 AI 不只是讀取這些數據,還能理解用戶所處的真實環境和當下情境。
這種能力意味著用戶可以用更自然的方式與地圖交互——通過說話、提問或拍照獲取信息并執行行動。AI 不再只是搜索工具,而是能夠在用戶身邊持續理解環境、提供建議并主動協助決策的出行伙伴。
從導航到伴行,高德正嘗試讓 AI 不僅理解互聯網信息,也能理解真實世界。在高德看來,步行導航是這一能力最合適的起點。相比駕車導航,步行場景更復雜、需求更碎片化,也更依賴環境信息,因此最能體現 AI 理解現實世界的能力。
隨著技術和生態能力的持續擴展,這種“伴行式導航”有望逐漸延伸到更多出行場景,重新定義人與地圖、人與城市空間的交互方式。
目前,用戶開啟高德步行導航后,即可通過導航頁面下方的“按住說話”按鈕進行交互。該功能目前已啟動測試,并正穩步擴大開放范圍,預計將于近期向更多用戶提供體驗。