国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<rt id="0woe2"><s id="0woe2"></s></rt><center id="0woe2"><li id="0woe2"></li></center>

<rt id="0woe2"></rt>

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員

2年前作者：AI科技大本營分類：Toy博客閱讀(23)違法舉報

這篇具有很好參考價值的文章主要介紹了大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

【導(dǎo)讀】機器人應(yīng)用，因其充滿變化的應(yīng)用場景與復(fù)雜的任務(wù)需求，其對定制化芯片的要求，一直是領(lǐng)域內(nèi)難以被攻克的一個難題。本文詳細闡述和討論了為機器人應(yīng)用定制芯片的困難所在、解決思路，并更進一步，介紹了可能給機器人產(chǎn)業(yè)帶來改觀的芯片自動生成問題。

本文精選自《新程序員 007：大模型時代的開發(fā)者》，完整專題可在小程序中立享閱讀。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

作者 | 甘一鳴

責(zé)編 | 唐小引

出品 | 《新程序員》編輯部

在大模型以其超前的文本輸出、邏輯推理能力出現(xiàn)在人們面前時，“具身智能”這一概念又一次把通用人工智能的可能性推到了人們面前。一種以定位感知模塊為輸入，以大模型為“大腦”進行邏輯推理和規(guī)劃，以傳統(tǒng)控制模塊為“小腦”執(zhí)行大模型的決策的機器人算法框架使得可以執(zhí)行長序列復(fù)雜任務(wù)的機器人幾乎成為了現(xiàn)實。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

圖源：Bing AI

當(dāng)然，這一美好想法并沒有那么容易實現(xiàn)，而橫亙在理想和現(xiàn)實之間的主要問題之一，就是當(dāng)前機器人領(lǐng)域芯片算力嚴重不足，難以滿足日益增長的機器人應(yīng)用的算力需求，導(dǎo)致機器人操作的硬實時性很難被滿足。

我從 2018 年開始進入機器人這個領(lǐng)域，希望在這篇文章里提出一個目前還尚未被大量關(guān)注到的思路：一個合適的模版可以為多個機器人領(lǐng)域的算法和應(yīng)用提供硬件定制化的基礎(chǔ)，甚至能加速芯片自動生成這一計算機體系結(jié)構(gòu)所有難題中的明珠問題的解決。

傳統(tǒng)的機器人算法框架通常包括了感知、定位、規(guī)劃、控制等幾個模塊。當(dāng)前除了感知模塊被深度學(xué)習(xí)網(wǎng)絡(luò)算法統(tǒng)治之外，其余的幾個模塊在不同場景下的機器人應(yīng)用中變化還是較大的。

根據(jù)傳感器數(shù)量、種類、機器人的應(yīng)用模式的變化，定位、規(guī)劃和控制模塊的算法變化也較大。以定位算法為例，可以使用的傳感器包括單目相機、雙目相機、激光雷達、GPS、IMU 等等?？焖僮兓乃惴蚣芎托问揭彩沟脼闄C器人算法定制芯片變得困難。為某一個算法設(shè)計的硬件有時難以運行其余算法，極大地減少了硬件平臺的移植性，增加了成本。

因子圖：優(yōu)化類算法的理想硬件加速模版

以定位算法為例，常見的算法框架通?？梢员环譃榍昂蠖藘蓚€部分，前端通常被用于提取特征點，計算描述子，尋找對應(yīng)關(guān)系并將特征信息傳遞給后端。后端通常負責(zé)根據(jù)前端的特征信息對機器人位姿進行優(yōu)化。前端特征提取利用傳統(tǒng)的 SIMD 硬件可以得到充分的加速，而后端的優(yōu)化算法則因為其不規(guī)則的運算更難被加速。

如此一來，后端的優(yōu)化算法會成為整個定位模塊的瓶頸。我們發(fā)現(xiàn)，不僅是在定位算法中，在路徑規(guī)劃、控制等多個算法中，都存在類似的問題。

優(yōu)化算法，以牛頓高斯消元法為例，在傳統(tǒng)的加速器設(shè)計中一直是難以解決的一環(huán)。這一問題難以被加速主要原因在于兩點：

首先，優(yōu)化過程中涉及到大量的矩陣乘法、矩陣分解等矩陣操作。這些矩陣的規(guī)模較大，通常維度可以達到幾百行、幾百列，而且除了矩陣乘之外，其余操作很難并行化。如此大規(guī)模的不規(guī)則矩陣運算，除了堆積算力規(guī)模之外，并無其他更好的加速方法。
另外，盡管優(yōu)化過程中的矩陣并不稠密，常常只有百分之十以下的元素為非零元素，但這些矩陣的稀疏性并不規(guī)則，難以被利用。

我們提出使用因子圖為中間模版來對機器人應(yīng)用中的優(yōu)化算法[1][2]進行加速。因子圖是一種描述變量關(guān)系的二分圖，可以被應(yīng)用于優(yōu)化問題的描述中。因子圖中有兩種不同的節(jié)點——變量節(jié)點和因子節(jié)點。變量節(jié)點即一系列需要優(yōu)化的變量，而因子節(jié)點即為變量節(jié)點之間的連接和約束。在圖 1 中，我們展示了一個因子圖與定位算法優(yōu)化后端的關(guān)系。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

圖 1? 定位算法因子圖示例

以高斯牛頓解法為例，后端優(yōu)化往往將整個過程轉(zhuǎn)換為解非線性方程組 Ax=b，將 x 解出后帶回到 x 的初始值中并判斷收斂條件是否滿足。我們發(fā)現(xiàn)，求解 Ax=b 的過程則與因子圖可以直接聯(lián)系起來。具體來說，因子圖的每一個節(jié)點，無論是因子節(jié)點或變量節(jié)點，都對應(yīng)著矩陣 A 與向量 b 的某些位置。

在圖 1 這一例子中，變量節(jié)點 x1 到 x3 表示了機器人在三個時間節(jié)點的位姿，y1 和 y2 表示兩個物理世界中的標志，而 f1 到 f5 分別表示了不同傳感器中采集的數(shù)據(jù)。f1-f3 位相機觀測因子，f4、f5 位 IMU 觀測節(jié)點，f6 表示前序位姿。所有節(jié)點構(gòu)成了圖 1 左下方的因子圖，同時也構(gòu)成了矩陣 A 與向量 b 的結(jié)構(gòu)，他們二者之間的關(guān)系如圖 1 中箭頭所示。

如前文所述，在絕大多數(shù)機器人應(yīng)用中，矩陣 A 的規(guī)模較大而稀疏度較高。直接求解 A 會帶來極高的延時與功耗負擔(dān)，而希望利用到矩陣的稀疏性時，其稀疏度又不夠結(jié)構(gòu)化。絕大多數(shù)加速求解稀疏矩陣的方法也并不能帶來很好的加速比，導(dǎo)致在定位、規(guī)劃、控制等多個模塊中，優(yōu)化算法都成為了加速算法性能的阻礙。

利用因子圖可以很好地解決這一問題。因為因子圖的結(jié)構(gòu)對應(yīng)了稀疏矩陣中稠密的非零元素，依據(jù)因子圖展示的變量順序，完全可以將大的稀疏矩陣求解轉(zhuǎn)換成多個小的稠密矩陣求解。這么做第一可以減少硬件資源的消耗，不需要構(gòu)建大規(guī)模的矩陣操作單元，第二則可以提升硬件資源的利用率。圖 2 就展示了一個對圖 1 中所建立的因子圖的一個變量先進行局部消元的例子。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

圖 2 逐步對因子圖中涉及到的變量進行消元

在這個例子中，由于原始矩陣維度過大且稀疏度較高，無論使用 CPU 或是 GPU 對其計算都難以達到實時性需求。而使用因子圖對其進行維度降低后，配合專用的矩陣加速單元，我們實現(xiàn)了對常見的桌面 Intel i7 處理器 9.3 倍的加速比，節(jié)約了超過 50 倍的能耗。對于常見的嵌入式 ARM 處理器，實現(xiàn)了 47.6 倍的加速比，節(jié)約了 16.8 倍的能耗。以因子圖為加速模版的定位算法加速器，可以實現(xiàn)接近 100fps 的定位算法運行速度，達到了機器人應(yīng)用中的實時性需求。

基于這一思想，我們又為規(guī)劃算法設(shè)計了一套以因子圖為模版的硬件加速單元。我們在設(shè)計中進一步發(fā)現(xiàn)，在確定了完整的因子圖后，從哪個因子開始消元會帶來硬件資源的極大不同。

以圖 1 和圖 2 為例，對于完整的因子圖，我們選擇圖 2 從左上角的 y1 節(jié)點開始消元。其實從右邊的 y2 節(jié)點，或中間的 x2 節(jié)點，都可以完成對因子圖的消元并求解出對應(yīng)的變量節(jié)點。從不同的因子節(jié)點開始求解，將會帶來完全不同的矩陣運算維度、計算速度和硬件資源消耗。

直接估計每一種消元順序的消耗是很難的，因為如果有 N 個節(jié)點的話，會有 N 的階乘種消元順序，對每一種順序進行硬件資源的分析是極難的。我們創(chuàng)造性地提出使用軟件的方法來估計硬件資源的消耗，從而快速評估不同的消元順序?qū)τ布Y源的使用。我們使用了三種軟件上的指標，分別是消元過程中的最大矩陣維度、平均矩陣維度和平均矩陣密度。這三種軟件上的指標分別對應(yīng)了所需最大硬件資源、平均加速比和硬件利用率。對于特定的規(guī)劃算法，我們還專門提出了一種領(lǐng)域?qū)Ｓ玫碾p向消元方法。利用特定的雙向消元方法，相比于隨機選取消元起點，還可以繼續(xù)提升超過兩倍的性能。

機器人應(yīng)用硬件設(shè)計的自動化

當(dāng)使用了因子圖作為硬件設(shè)計模版之后，我們可以大幅提高機器人領(lǐng)域多種算法的運算性能，包括定位、路徑規(guī)劃、控制等算法。然而，即便是對因子圖和硬件設(shè)計最熟悉的研究人員，也需要長達數(shù)月對單一算法的專用加速器進行設(shè)計，而機器人領(lǐng)域存在著難以計數(shù)的不同種類算法。如果使用常見的 High Level Synthesis（HLS，高層次綜合）對硬件進行自動生成，則會因為缺乏定制化的能力而導(dǎo)致無法利用特殊的數(shù)據(jù)流[3]，難以實現(xiàn)性能的大幅提升。

當(dāng)以因子圖為模版對機器人的多個算法進行加速之后，我們意識到，因子圖可以作為一個非常通用的模版，方便我們對機器人領(lǐng)域的硬件自動設(shè)計進行突破。直接將軟件映射到硬件電路的難度很高，而因子圖給我們提供了一個非常好的中間介質(zhì)，我們可以分兩步進行硬件的自動化設(shè)計：首先將機器人算法映射到中間介質(zhì)上，再將中間介質(zhì)映射到硬件電路中去。

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人

圖 3? 使用因子圖作為中間變量的硬件設(shè)計自動化

整體工作流程如圖 3 所示，我們針對機器人應(yīng)用，提供了一個完整的優(yōu)化算法的自動設(shè)計框架，使用者只需要依據(jù)我們的軟件框架對其所需要的軟件算法進行定義，編譯框架會將用戶的算法自動映射到因子圖的結(jié)構(gòu)上去。同時，依托因子圖的結(jié)構(gòu)，編譯框架會進一步生成基礎(chǔ)的矩陣操作的指令。根據(jù)這些指令和其數(shù)據(jù)流，會依賴一些矩陣運算的模版電路，自動生成整體的機器人專用架構(gòu)，實現(xiàn)硬件生成的自動化。

我們的工作整體上實現(xiàn)了三個大的貢獻。首先，提出了一個新的位姿表示，可以被應(yīng)用于多種機器人領(lǐng)域的應(yīng)用。通用的位姿表示可以方便不同的機器人應(yīng)用使用同樣的中間媒介（因子圖）。其次，我們提出了一套完整的編譯框架，對于開發(fā)者極其友好。開發(fā)者只需以構(gòu)建因子圖的形式進行編程，而無需關(guān)心背后的位姿表示、數(shù)學(xué)推導(dǎo)等等過程。最后，我們提出了端到端的硬件生成方式，對比傳統(tǒng)的 HLS 硬件生成方式，大幅提高了硬件對于機器人算法獨特的數(shù)據(jù)通路的應(yīng)用，實現(xiàn)性能提升。

機器人應(yīng)用的未來：硬件賦能具身智能

機器人領(lǐng)域的算法和應(yīng)用的變化是日新月異的，傳統(tǒng)的機器人 OODA 決策環(huán)在大模型涌現(xiàn)之后，出現(xiàn)了很多新的變化，大模型取代傳統(tǒng)的決策和規(guī)劃算法之后為機器人產(chǎn)業(yè)帶來了大量的新的機會。因為大模型涌現(xiàn)的決策和任務(wù)分解能力，機器人可以開始執(zhí)行長序列的復(fù)雜任務(wù)，實現(xiàn)真正的智能化。

盡管這種愿景非常美好，但現(xiàn)實與愿景之間仍存在著很大的鴻溝。一個最重要的問題就是當(dāng)引入大模型進行決策之后，機器人控制的實時性問題。機器人的控制算法通常需要的頻率高達幾百赫茲，而以現(xiàn)有的運算能力進行大模型推理則遠難達到這一頻率。這也就導(dǎo)致了機器人控制難以實現(xiàn)實時性，還遠沒有達到可以投入實際使用的地步。

我們希望能通過硬件與系統(tǒng)上的創(chuàng)新來解決這一問題。系統(tǒng)層面，希望提出大小模型分層的機器人算法架構(gòu)。在任務(wù)理解及分解時，使用較大的模型但以較低的頻率參與工作，對機器人進行較長期的任務(wù)規(guī)劃。在執(zhí)行任務(wù)時，使用小規(guī)模的模型，保證分解任務(wù)正確執(zhí)行的同時提高實時性。采用端云分層的執(zhí)行思路，將小模型放在端側(cè)進行硬件加速。我們認為，系統(tǒng)和硬件的定制化才是真正賦能具身智能的最有力的武器。

總結(jié)

機器人的智能化一直是這一產(chǎn)業(yè)進化的核心目標，我們希望機器人能正確高效地執(zhí)行更復(fù)雜的任務(wù)，為人類提供服務(wù)。隨著算法的不斷演進，機器人應(yīng)用對于算力的需求也日益增加。作為硬件架構(gòu)的研究者，面對日新月異的機器人應(yīng)用，這對我們來說既是機遇也是挑戰(zhàn)。尤其是在大模型逐漸占領(lǐng)機器人控制領(lǐng)域的今天，如何實現(xiàn)實時性地大模型控制、保證機器人正確高效地執(zhí)行任務(wù)，期待我們和大家一起對這些問題給出自己的回答。

參考文獻

[1] Hao, Yuhui, et al. "Factor Graph Accelerator for LiDAR-Inertial Odometry." Proceedings of the 41st IEEE/ACM International Conference on Computer-Aided Design. 2022.?

[2] Hao, Yuhui, et al. “BLITZRANK: Factor Graph Accelerator for Motion Planning.” 60th Design Automation Conference (DAC), 2023.?

[3] Liu, Weizhuang, et al. "Archytas: A framework for synthesizing and dynamically optimizing accelerators for robotic localization." MICRO-54: 54th Annual IEEE/ACM International Symposium on Microarchitecture. 2021.

大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員,機器人文章來源地址http://www.zghlxwxcb.cn/news/detail-829063.html

到了這里，關(guān)于大模型時代下的機器人應(yīng)用：我們離具身智能還有多遠？| 新程序員的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

OpenAI開發(fā)系列（六）：Completions模型的工作原理及應(yīng)用實例（開發(fā)多輪對話機器人）
授權(quán)聲明：本文基于九天Hector的原創(chuàng)課程資料創(chuàng)作，已獲得其正式授權(quán)。原課程出處：九天Hector的B站主頁，感謝九天Hector為學(xué)習(xí)者帶來的寶貴知識。請尊重原創(chuàng)，轉(zhuǎn)載或引用時，請標明來源。全文共7000余字，預(yù)計閱讀時間約15~30分鐘 | 滿滿干貨(附代碼)，建議收藏！本文
2024年02月13日
瀏覽(28)
機器人行業(yè)中我們常說的roll、yaw、pitch是什么？
標系建立：載體坐標系與載體坐標系的關(guān)系是三個Euler角：yaw，pitch，roll，反應(yīng)了載體相對基準面的姿態(tài)。 pitch是圍繞X軸旋轉(zhuǎn)，也叫做俯仰角。當(dāng)X軸的正半軸位于過坐標原點的水平面之上（抬頭）時，俯仰角為正，否則為負，如下圖所示。 ? yaw是圍繞Y軸旋轉(zhuǎn)，也叫偏航角。
2024年02月11日
瀏覽(20)
AI大模型在效率工具、內(nèi)容平臺、商業(yè)流程自動化、機器人、操作系統(tǒng)、智能設(shè)備等場景的應(yīng)用
隨著人工智能技術(shù)的快速發(fā)展，越來越多的公司開始利用AI大模型來解決各種問題和挑戰(zhàn)。AI大模型是指參數(shù)量巨大、擁有訓(xùn)練好的模型的人工智能系統(tǒng)，通常需要大量的數(shù)據(jù)和計算資源進行訓(xùn)練。本文將介紹AI大模型在效率工具、內(nèi)容平臺、商業(yè)流程自動化、機器人、操作系
2024年02月07日
瀏覽(23)
GCS軌跡優(yōu)化算法：有效提升機器人在復(fù)雜環(huán)境下的行動能力
原創(chuàng) | 文 BFT機器人? 機器人要在迷宮中找到出路并非易事，試想我們讓機器人穿越一個孩子的游戲室，散落在地板上的各種玩具和各類家具擋住了一些潛在的路徑。這個混亂的”迷宮“要求機器人在不與任何障礙物相撞的情況下計算到達目的地的最優(yōu)路徑，機器人該怎么做呢
2024年02月04日
瀏覽(22)
簡介：在這篇教程中，我們將使用React.js框架創(chuàng)建一個簡單的聊天機器人的前端界面，并利用Dialogflo
作者：禪與計算機程序設(shè)計藝術(shù) 介紹及動機聊天機器人（Chatbot）一直是互聯(lián)網(wǎng)領(lǐng)域中的熱門話題。而很多聊天機器人的功能都依賴于人工智能（AI）技術(shù)。越來越多的企業(yè)希望擁有自己的聊天機器人系統(tǒng)，從而提升自己的競爭力。為此，業(yè)界也出現(xiàn)了很多基于開源技術(shù)或云
2024年02月06日
瀏覽(26)
醫(yī)療機器人軟件中的機器人機器人編程技術(shù)：機器人技術(shù)的創(chuàng)新應(yīng)用
作者：禪與計算機程序設(shè)計藝術(shù) 隨著科技的發(fā)展，醫(yī)療機器人逐漸成為人們關(guān)注的熱門話題。醫(yī)療機器人可以在醫(yī)院、康復(fù)中心等各種場合為病人提供幫助，不僅可以提高工作效率，還能降低醫(yī)護人員的工作強度。而機器人編程技術(shù)則是實現(xiàn)醫(yī)療機器人功能的關(guān)鍵，本文將圍
2024年02月07日
瀏覽(34)
智能機器人在機器人機器人感知與運動控制技術(shù)與應(yīng)用案例
作者：禪與計算機程序設(shè)計藝術(shù) 當(dāng)前，物聯(lián)網(wǎng)、云計算、人工智能和機器人技術(shù)已成為我國產(chǎn)業(yè)界研究熱點。隨著機器人的高速發(fā)展，無論是研究、制造還是服務(wù)，都受到了越來越多的關(guān)注。同時，隨著大數(shù)據(jù)、IoT（Internet of Things）技術(shù)的廣泛應(yīng)用，機器人應(yīng)用也被迅速推向
2024年02月09日
瀏覽(24)
什么是RPA機器人？RPA機器人能做什么？RPA機器人的應(yīng)用場景
什么是RPA機器人？ RPA機器人是一種使用軟件機器人來模擬和執(zhí)行人類操作的技術(shù)。RPA代表Robotic Process Automation（機器人流程自動化）。它是一種自動化技術(shù)，可以使用預(yù)定規(guī)則和預(yù)定流程來執(zhí)行重復(fù)性、繁瑣或規(guī)定任務(wù)的工作。 RPA機器人可以模擬人類的操作，并與計算機系統(tǒng)
2024年02月10日
瀏覽(20)
機器學(xué)習(xí)-搭建輕量級機器人模型
在自己的機器上部署一個機器人簡直太酷啦，因為模型數(shù)據(jù)緣故，可能有時候回復(fù)會有一點點怪，不過不影響我們探索機器模型的學(xué)習(xí)，搭建安裝完畢，大家就可自行學(xué)習(xí)源碼啦。這是啟動后臺的圖片。 ?需要安裝環(huán)境：python3.7 、Transformers==4.2.0、pytorch==1.7.0、nginx（映射網(wǎng)頁
2024年02月11日
瀏覽(25)
計算機視覺與機器人：智能機器人的發(fā)展與應(yīng)用
計算機視覺和機器人技術(shù)是人工智能領(lǐng)域的重要研究方向之一，它們在各個領(lǐng)域的應(yīng)用都非常廣泛。計算機視覺技術(shù)可以讓計算機理解和處理人類世界中的圖像和視頻，從而實現(xiàn)對環(huán)境的理解和交互。機器人技術(shù)則可以讓機器具有行動和感知的能力，從而實現(xiàn)與人類相互作用
2024年02月22日
瀏覽(22)

^{<center id="yii2s"></center>}

<rt id="yii2s"></rt>