近日 卡內基·梅隆大學、臉書等機構的研究人員提出了一個新的AI環境探索模型。這個新模型綜合了傳統環境探索模型和基于學習方法的環境探索模型的優點 更簡單和不易出錯。
這項研究已經發表在學術網站arXiv上 論文標題為《利用主動神經SLAM學習探索環境(Learning To Explore Using Active Neural SLAM)》。
論文鏈接:https://arxiv.org/pdf/2004.05155.pdf
一、ANS模型:真實模擬探索環境
導航能力是智能代理的核心能力之一。導航任務有許多形式 比如點目標任務指導航到特定的坐標 語義導航任務指導航到去特定場景或對象的路徑。
不論哪一種任務 在未知環境中導航的核心問題都是如何高效地探索盡可能多的環境。這樣才能擴大在未知環境中找到目標的機會 或者在有限的時間里有效地預映射環境。
傳統的探索模型原理是用傳感器觀察幾何體。之后有研究者提出了基于學習的導航模型 該模型依據RGB圖像直接推測出幾何體。
基于學習的導航策略通過端到端(end-to-end)訓練神經網絡實現 可以處理原始的傳感器數據 直接輸出代理該執行的操作。這種策略有3個優勢:
1、提高了輸入方式選擇的靈活性;
2、提高顯式狀態估計誤差的穩健性;
3、通過學習掌握真實世界的結構規律性 使代理更有目的性地行動
理論上端到端的學習策略有上述優勢 但也有局限性。
首先 純粹從數據中學習映射、狀態評估、路徑規劃可能會非常昂貴。因此 以往的端到端學習依賴于模仿學習和以百萬計的經驗框架。
其次 以往針對端到端學習策略的研究缺乏真實性。比如使用的是合成室內環境數據庫SUNC、簡化了代理動作、運行環境去除了傳感器噪音等。
從表現來說 端到端的學習策略也往往比不需要任何學習的傳統方法差。
為了解決全面端到端學習的局限性 卡內基·梅隆大學、臉書、伊利諾大學厄巴納-香檳分校的研究人員推出了“主動神經即時定位與地圖構建(ANS Active Neural SLAM)模型”。
實驗設計上 研究人員盡量使模型訓練環境更真實 用到了生境模擬器和兩個基于真實情景的數據庫(Gibson和Matterport) 不限制代理的動作 還模擬了傳感器噪音。
二、縮小搜索范圍 兼顧搜索性能和效率
本項研究中 導航模型的任務是在固定時間內覆蓋最大范圍。覆蓋范圍定義為地圖中已知被穿越的總面積。
ANS模型包括一個學習神經即時定位與地圖構建(SLAM Simultaneous localization and mapping)模塊 一個全局策略(global policy)和一個局部策略(local policy)。它們通過地圖和一個分析路徑規劃器相連。
層次化和模塊化的設計和分析規劃的使用 大大減小了訓練過程中的搜索范圍 同時提高了性能和樣本效率。
▲模型示意圖
訓練過程中 學習神經SLAM模塊產生自由空間地圖 并依據輸入的RGB圖像和運動傳感器數據預測代理的姿勢。SLAM模塊的學習提升了輸入方式的靈活性。
全局策略利用代理的姿勢來占據自由空間地圖 并把學習現實世界環境布局的結構性規則作為長期目標。全局策略可以探索真實世界環境的布局。
長期目標可以為局部策略生成短期目標。局部策略通過學習 直接從RGB圖像中映射出代理應該做出的動作 呈現可視化反饋。
▲模型運行過程示意圖
三、ANS模型能探索更大范圍 比基線模型性能優秀
利用Gibson訓練集 研究人員完成了對ANS模型的訓練 運行了1000萬幀探索任務的所有基線。結果如下表。
運行結果基于模型在14個未知場景中994次運行的結果進行平均。與最佳基線的24.863m^2/0.789相比 模型的覆蓋率為32.701m^2/0.948。這個數值說明 與基線相比 ANS模型在窮盡探索上更有效。
研究人員還對比了模型和基線在較大訓練集、較小訓練集、全部Gibson訓練集中的運行效果。
較小訓練集中 ANS模型能在500步探索完未知環境 而基線運行1000步后仍只探索了位置環境的85~90%(上圖中)。
較大訓練集中 隨著情節的發展 ANS模型與基線之間的差距會擴大(上圖左)。
基線模型中 代理經常只探索局部區域 這說明它們無法記住長期視野的探索區域 不能進行長期規劃。相比之下 ANS采用全局策略 可以記憶探索過的區域 有效地規劃并實現長期目標。
受到結果鼓舞 研究人員用ANS模型部署了一個環境探索機器人。通過調整攝相機的高度和垂直視野 并匹配棲息地模擬器 機器人成功探索出一個公寓的生活區域。
結語:ANS模型效率更高 未來或有更多應用
ANS導航模型克服了之前的基于端對端學習策略的缺陷 基于更真實的數據庫進行訓練 最終探索效率有所提升。
研究人員認為這個模型在未來或許會有更多應用。“未來 ANS模型可以擴展到復雜的語義任務 比如語義目標導航和回答具體問題 這將創建出一個能捕獲對象語義屬性的地圖。”
另外 這個模型也可以與先前的本地化工作結合 在此前創建的地圖中重新定位 使之后的導航更高效。
責任編輯:PSY