科普時報記者 陳杰?
“當前,智能機器人所取得的進展主要集中在底層建模和控制方面,但傳統物理模型難以適應交互環(huán)境變化,迫切需要將模型訓練與深度學習融合推進。”近日,清華大學訪問教授張建偉在首屆國際基礎科學大會“基礎科學與人工智能論壇”上指出,機器人在面臨未來動態(tài)和非結構環(huán)境下的相關研究已成為行業(yè)重要話題之一。
誠然,ChatGPT帶來的智能化應用,已經讓人們對大規(guī)模及算法快速進化下的智能機器人有了更高的期待。而在工業(yè)領域,機器人的廣泛應用讓工業(yè)自動化成為可能,智能化則成為其下一個目標。
(資料圖片)
微億智造創(chuàng)新系統部負責人馬元巍博士告訴記者,工業(yè)界傳統的自動化方案基本上都是將知識灌入機器人系統,通過編程的形式實現自動批量處理事務的功能。因此誕生了一系列計算機視覺的任務和機器人控制的任務,比如一個完整的抓取分揀操作,包含了3D感知、配準、點云分割、抓取點估計、任務重排、規(guī)劃、2D校準等任務,通過強大的工業(yè)軟件將這些技術點耦合在一起,催生了工業(yè)上的絕大部分應用?!斑@樣的應用具有可控、重復性高的特點,但是整個方案實施成本高、柔性低、換線復雜,并且每個方案都是獨特的,缺乏基準和技術一致性,非常不利于整體技術的進步?!?/p>
正因如此,幾乎每個行業(yè)對自動化的“解決方案”這四個字有錐骨之痛。如何破解這一現象,則成為智能機器人產業(yè)發(fā)展的重點方向。
“人類經常被物化為工業(yè)流水線中最柔性的執(zhí)行機構,是因為人觀察和學習周圍的環(huán)境,使用自己的大腦充分利用自己的身體完成各種復雜的任務,并且在執(zhí)行中不斷受到更新自己的認知?!瘪R元巍表示,這種模式正是智能化追求的一種理想形式,也是1950年圖靈在論文中提到的具身智能。
行業(yè)專家普遍認為,工業(yè)智能化發(fā)展始于具身智能。
具身智能是指具有身體的人工智能,需要與真實世界進行交互。這種交互不僅涉及視覺上的高維特征提取,還包括其他感官信息,例如聽覺、嗅覺、味覺和觸覺。通過這種交互,智能體可以獲取物理世界的真實反饋,并通過反饋來學習并進化,可以幫助機器人更好地完成任務。
具身智能執(zhí)行步驟一般為多傳感器從真實到模擬,然后從模擬到真實的過程,具體的過程就是通過多種感知設備和算法,盡量將現實世界的信息能夠還原到虛擬環(huán)境中,然后在經過模擬和規(guī)劃后,將算法和規(guī)劃應用到實際機器人上。
產業(yè)界以前為什么不提具身智能呢?馬元巍認為,主要還是因為技術復雜,各個技術點發(fā)展不成熟。隨著人工智能技術的快速發(fā)展,尤其是大語言模型徹底改變了語義理解和頂層規(guī)劃的困難?!癈hatGPT證明了大語言模型具有較強的綜合思考、邏輯能力、數理能力,大語言模型越來越被證明,其作為機器人的上層邏輯規(guī)劃器是非常有希望的,一舉改變了機器人系統不智能的缺點。多模態(tài)模型的發(fā)展,為統一圖像、行為理解、語音、動作等提供了技術基礎?!?/p>
基于當前智能技術的發(fā)展,微億智造提出了獨特的工業(yè)智能機器人漸進式路線:以“眼手腦云”的實施架構為基礎,聚焦于可累積數據場景和通用關鍵技術,打造虛實結合的應用產品,漸進式地實現機器人智能化。
縱觀整個工業(yè)智能的發(fā)展,之所以遠遠比不上消費端的發(fā)展速度,其根本原因是相關基礎元素沒有被很好地數字化。有理由相信,隨著各種大模型的發(fā)展和應用,機器人的感、知、控等技術將飛速發(fā)展,實現工業(yè)智能化的要素將逐漸齊備。
當然,這肯定需要一個過程。正如張建偉所言,未來的機器人大概率會是通用智能機器人,一個機器人既能夠給你端茶倒水,又能到餐館服務,還能到工廠干活。“這將是智能機器人產業(yè)的大目標,也是一個非常艱巨的目標。”
關鍵詞: