在工業界,傳統自動化方案均是將知識灌入機器人系統,通過編程的形式實現自動批量處理事務的功能。因此誕生了一系列計算機視覺的任務和機器人控制的任務,比如一個完整的抓取分揀操作,包含了3D感知、配準、點云分割、抓取點估計、任務重排、規劃、2D校準等任務,通過強大的工業軟件將這些技術點耦合在一起,這樣催生了工業上的絕大部分應用。
這樣的應用具有可控、重復性高的特點,但是整個方案實施成本高、柔性低、換線復雜,并且每個方案都是獨特的,缺乏基準和技術一致性,非常不利于整體技術的進步,因此“解決方案”這四個字是整個行業的痛。
人類經常被物化為工業流水線中最柔性的執行機構,是因為人觀察和學習周圍的環境,使用自己的大腦充分的利用自己的身體完成各種復雜的任務,并且在執行中不斷受到更新自己的認知,這種以身體為舟,性命為本,在塵世航行的模式,正是智能化追求的一種理想形式。這正是1950 年圖靈論文中提到的具身智能。
工業機器人的智能化發展始于具身智能。具身智能是指人工智能具有身體,需要與真實世界進行交互。這種交互不僅涉及視覺上的高維特征提取,還包括其他感官信息,例如聽覺、嗅覺、味覺和觸覺。通過這種交互,智能體可以獲取物理世界的真實反饋,并通過反饋來學習并進化。具身智能是一種重要的發展方向,可以幫助機器人更好地完成任務。
而在具身智能執行步驟一般為多傳感器的real to sim,然后sim to real的過程,具體的過程如下:
Real to Sim
通過多種感知設備和算法,盡量將現實世界的信息能夠還原到虛擬環境中
Sim to Real
在經過模擬和規劃后,將算法和規劃應用到實際機器人上
以前為什么不能提具身智能,是因為技術復雜,各個技術點發展不成熟,但是目前2023年,很多工作已經發展到一定的階段,尤其是大語言模型徹底改變了語義理解和頂層規劃的困難。
大語言模型的發展為高級規劃層鋪平了道路
隨著chatgpt證明了大語言模型具有較強的綜合思考、邏輯能力、數理能力,大語言模型越來越被證明,其作為機器人的上層邏輯規劃器是非常有希望的,一舉改變了機器人系統不智能的缺點。尤其值得注意的是最近chain of thought配合LLMs的一些研究表明,通用AGI似乎并不遙遠了。
大語言模型的發展
Chain of thought在無害化方向的作用
多模態模型的發展
Transformer等結構帶來的多模態模型的發展,對統一圖像、行為理解、語音、動作等提供了技術基礎。2023年3月6日,來自谷歌和德國林工業大學的一組人工智能研究人員公布了史上最大視覺語言模型 PaLM-E( Pathways Language Model with Embodied)。機器人可以通過圖片理解現狀,并根據文字指令完成任務。
CVPR2023的best paper,UniAD工作可以端到端的處理多個自動駕駛任務,并實現了一個自動駕駛的任務的全局最優化方案,這意味者模型可以統一的理解所有的關鍵信息并作出決策。
Nerf-based 模型的發展為2D感知和重建
提供了豐富的手段
NeRF(Neural Radiance Fields神經輻射場)最早是在2020年ECCV會議上的最佳論文中提出的概念,其將隱式表達推上了一個新的高度,僅用2D的posed images作為監督,即可表示復雜的三維場景。
Nerf的出現改變了2D估計3D的方案,基于Nerf的slam工作、重建工作等都獲得了極大的發展,改變了模型認知世界的方法。
Nerf-based slam技術在稠密建圖導航中大放異彩,以NICE-SLAM為代表的模型在精度上有了較大的進步。CVPR2023的UniSim工作實現了高度逼真、閉環測試(closed-loop simulation)、可擴展 (scalable), 只需要采集一次數據, 就能重建并仿真測試。
基于當前智能技術的發展,微億智造又是如何塑造其技術路線,朝向工業智能化發展的呢?
微億智造提出了獨特的工業智能機器人的漸進式路線:以“眼手腦云”的實施架構為基礎,聚焦于可累積數據場景和通用關鍵技術,打造虛實結合的應用產品,漸進式的實現機器人智能化。
“眼”指的是微億智造自研的圖像感知技術與可組合光學成像系統;“手”即是機器人智能控制,所有的技術都要通過“手”來實現工程化落地;“腦”是更貼合離散制造需求的多任務學習和小樣本訓練技術;“云”則是一個既能為“腦”提供算力支撐,又能鏈接政府與企業的云平臺。
下面拆解一下我們去年年底推出的數字工人——工小匠產品是如何踐行這個理念的。
針對碎片化的缺陷檢測工藝
建立統一的硬件載體和軟件系統
傳統的外觀缺陷工作分為光、機、電、算、軟五部分工作,而相關技術經驗和工作流都是散落在不同的工作流中。比如如果用到了機械臂,所有的機械臂程序都會在機械臂廠家定義的軟件空間里,那么相關的角度、打光方案、算法效果就無法被記錄,從而缺少了改進的機會。微億智造將機臺標準化、集成化,一體式的完成從方案到實施的全過程,這就將所有的技術工作串聯了起來。這樣統一工程化的形式,一是可改進,二是可量化,三是減少了閉環的回路長度。
全棧自研算法加持
加速實現全鏈條應用落地
工小匠集成了運動控制算法、缺陷檢測算法和光學智能推薦算法,加速全鏈條的應用速度。其中運動控制算法采用自研六軸機械臂位姿計算和三階約束的最優時間軌跡規劃,可以穩定快速的解算出機械臂的最優運動軌跡。而缺陷檢測方面,基于知識注入和缺陷生成的全流程缺陷檢測系統,在數據注入后馬上生成模型方案,并且在多條產線上實際驗證能夠2周內達到檢測標準。本系統中同時集成了對光學方案的智能推薦,并且把經驗源源不斷的注入到模型里,實現了光學的智能調試,這也是專機系統無法完成和持續進步的。如此強大的算法系統保證了速度最優、上線迅速、可迭代,且賦予了系統更強大的執行力。
踐行real2sim,sim2real的理念
在工小匠產品中,微億智造操作的對象是工件,工件的拍照點位、光學方案都可以在數字空間中設置和分析,優化后的實施方案可以通過所謂的“工小匠”硬件機臺去實施,而用戶無需關心“工小匠”是一個什么樣的機臺,這就為數據記錄和工藝記錄鋪平了道路,實施的擴展性和方便性非常高。比如更換了工裝,我們不用再調試機械臂了,復制100臺,我們也不用單獨去調試每個機械臂,機臺系統會自動適應這個對象。這便是具備了具身智能的概念,使機器智能的思考如何執行。
而相同的事情也發生在其他的工藝過程中,無論是缺陷檢測、尺寸量測、打磨、涂膠,都可以踐行相同的理念和系統,從而讓整個工業現場變得可被優化。縱觀整個工業智能的發展,之所以遠遠比不上消費端的發展速度,其根本原因是相關的基礎元素沒有被很好的數字化。而微億智造基于眼、手、腦、云的技術架構將整個機器人工藝鏈條全部數字化,在產線上不斷地與AI協同進化,可以預見這些工藝將會以前所未有的速度升級迭代。
在當前的技術潮流下,感、知、控等技術都已經飛速發展,實現工業智能化的要素逐漸齊備,微億智造這樣的公司正是推進這個流程的排頭兵,希望早日看到大潮漫灌!
審核編輯:劉清
-
運動控制器
+關注
關注
2文章
408瀏覽量
24809 -
人工智能
+關注
關注
1796文章
47681瀏覽量
240298 -
工業機器人
+關注
關注
91文章
3374瀏覽量
92881 -
計算機視覺
+關注
關注
8文章
1700瀏覽量
46129 -
自動駕駛
+關注
關注
785文章
13932瀏覽量
167010
原文標題:從工業的自動化走向智能化
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論