數(shù)字化轉(zhuǎn)型是將數(shù)字技術(shù)集成到您業(yè)務(wù)的所有領(lǐng)域的過(guò)程——沒(méi)有什么比人工智能技術(shù)更具變革性的了,尤其是計(jì)算機(jī)視覺(jué),它可以比人類(lèi)更快、更準(zhǔn)確地評(píng)估視覺(jué)信息。
事實(shí)上,最先進(jìn)的計(jì)算機(jī)視覺(jué)策略目前正在利用視頻流傳輸?shù)竭吘壴O(shè)備——檢查、分析和評(píng)估視覺(jué)數(shù)據(jù),包括圖片、視頻、衛(wèi)星圖像和實(shí)驗(yàn)室樣本——以進(jìn)行具有一定準(zhǔn)確性和成本水平的即時(shí)評(píng)估——使人眼的能力相形見(jiàn)絀。隨著我們訓(xùn)練越來(lái)越多的 AI 模型,計(jì)算機(jī)視覺(jué)將適用于幾乎所有的視覺(jué)任務(wù)。
我們所說(shuō)的計(jì)算機(jī)視覺(jué)和嵌入式 AI 是什么意思?
直到最近十年,計(jì)算機(jī)可以解釋任何類(lèi)型的視覺(jué)信息(具有與人類(lèi)相同或更好的敏銳度)的想法被視為計(jì)算機(jī)科學(xué)的一個(gè)不可逾越的前沿。然而,現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)現(xiàn)在由邊緣設(shè)備上的人工智能模型組成,這些模型可以分析和理解形成圖像和視頻的像素混亂——它們可以比人類(lèi)更好地執(zhí)行最廣泛的視覺(jué)任務(wù)。
事實(shí)上,人工智能解釋的攝像頭饋送目前非常先進(jìn),它們可以比人類(lèi)更好地計(jì)算載玻片下的細(xì)胞或識(shí)別工廠中有缺陷的瓶蓋,而且他們可以在幾毫秒內(nèi)完成。這只是兩個(gè)狹隘的例子。連接到服務(wù)器上嵌入式人工智能的攝像頭可以檢查商店貨架是否有貨,或者建筑工人是否穿著防護(hù)裝備。在這一點(diǎn)上,如果一項(xiàng)工作需要人眼來(lái)做出決定,那么訓(xùn)練有素的計(jì)算機(jī)視覺(jué)系統(tǒng)可能會(huì)做得更好。計(jì)算機(jī)視覺(jué)基本上是無(wú)限的。
計(jì)算機(jī)視覺(jué)比人類(lèi)視覺(jué)好在哪里?
與其說(shuō)無(wú)處不在,不如看看為什么計(jì)算機(jī)視覺(jué)在許多領(lǐng)域都比人類(lèi)表現(xiàn)更好。首先,我們需要探索人類(lèi)視覺(jué)的局限性以及它是如何影響準(zhǔn)確性的。
例如,科學(xué)家們?cè)缇椭溃祟?lèi)的視覺(jué)無(wú)法準(zhǔn)確客觀地反映我們周?chē)氖澜纭U绲つ萁z·格雷迪( Denise Grady)為發(fā)現(xiàn)雜志所寫(xiě)的那樣,“眼睛和大腦協(xié)同工作,以解釋來(lái)自外部世界的相互沖突的信號(hào)。最終,我們會(huì)看到我們的大腦認(rèn)為我們應(yīng)該看到的任何東西。”
事實(shí)上,我們的大腦不斷地填補(bǔ)盲點(diǎn),以創(chuàng)造對(duì)我們周?chē)澜绲臒o(wú)縫體驗(yàn)——即使他們必須“彌補(bǔ)”信息來(lái)做到這一點(diǎn)。大腦改變陰影,改變顏色,并無(wú)意識(shí)地決定我們?cè)诳词裁础T谠S多情況下,我們只是感知到一種充滿(mǎn)錯(cuò)誤和不準(zhǔn)確的錯(cuò)覺(jué)。
例如,您在上圖中看到了什么?鴨子?一只兔子??jī)烧叨际钦_的,但不可能同時(shí)看到兩個(gè)圖像。選擇看到兔子暫時(shí)失去鴨子,反之亦然(試一試)。
這些感知差異在日常生活中不會(huì)造成太大問(wèn)題 - 但在執(zhí)行需要高度準(zhǔn)確度的視覺(jué)任務(wù)時(shí),它們絕對(duì)是有害的,例如:
檢查機(jī)器是否存在維修問(wèn)題
監(jiān)控員工的 PPE 合規(guī)性
檢查基礎(chǔ)設(shè)施資產(chǎn)是否生銹和腐爛
在顯微鏡下計(jì)數(shù)細(xì)胞
檢查商店貨架是否有低庫(kù)存
除了簡(jiǎn)單地打瞌睡或被手機(jī)分心,我們?yōu)槭裁磿?huì)在任務(wù)中犯錯(cuò)誤?
根據(jù)密歇根州立大學(xué)的研究人員的說(shuō)法,視覺(jué)皮層會(huì)做出復(fù)雜的決定,就像大腦的更高層次一樣,它通常是在無(wú)意識(shí)的情況下發(fā)生的。事實(shí)上,視覺(jué)皮層決定了我們將要看到的內(nèi)容是否準(zhǔn)確反映了現(xiàn)實(shí)。當(dāng)人類(lèi)工作者解釋視覺(jué)數(shù)據(jù)時(shí),這可能會(huì)產(chǎn)生確認(rèn)偏差和錯(cuò)誤——當(dāng)我們感到無(wú)聊、疲勞和分心時(shí),這些偏差和錯(cuò)誤會(huì)變得更糟。
正如 Squilla Capital 的聯(lián)合創(chuàng)始人 Daniel Myakin 所說(shuō):
“人們總是保持偏見(jiàn)和情緒化,無(wú)論他們是否意識(shí)到這一點(diǎn)。每個(gè)人都知道人們會(huì)犯錯(cuò)誤。”
與人類(lèi)解釋容易出錯(cuò)的性質(zhì)相比,計(jì)算機(jī)視覺(jué)更客觀地看待和理解視覺(jué)數(shù)據(jù)——一次又一次地以絕對(duì)一致性呈現(xiàn)相同的結(jié)果。讓我們來(lái)看看為什么計(jì)算機(jī)視覺(jué)模型比人類(lèi)更擅長(zhǎng)執(zhí)行視覺(jué)任務(wù)的一些主要原因:
一致:視覺(jué) AI 任務(wù)性能的質(zhì)量不會(huì)因一天中的時(shí)間或 AI 運(yùn)行的時(shí)間長(zhǎng)短而變化。人工智能也不會(huì)變得無(wú)聊、疲倦、分心、生病、宿醉或沮喪——這些都是不可預(yù)測(cè)的變量,會(huì)對(duì)人類(lèi)的表現(xiàn)產(chǎn)生負(fù)面影響。這些“人”因素都不會(huì)影響計(jì)算機(jī)視覺(jué)任務(wù)性能的一致性和準(zhǔn)確性。
始終可用:視覺(jué) AI 系統(tǒng)不會(huì)占用午休時(shí)間、病假、假期或辭職。它們每周 7 天、每天 24 小時(shí)隨時(shí)可用。
可擴(kuò)展:隨著可視化監(jiān)控和評(píng)估任務(wù)量的增加,組織不需要雇用、尋找或培訓(xùn)新員工。只需按一下按鈕,他們就可以無(wú)限復(fù)制和擴(kuò)展現(xiàn)有的計(jì)算機(jī)視覺(jué)模型,以完成更多的工作。
更準(zhǔn)確:計(jì)算機(jī)視覺(jué)系統(tǒng)可以同時(shí)跟蹤更多變量。他們無(wú)需同時(shí)關(guān)注三個(gè)安全攝像頭,而是可以查看數(shù)百或數(shù)千個(gè),并且不會(huì)錯(cuò)過(guò)任何與安全相關(guān)的事件。他們可以識(shí)別人群中的數(shù)百或數(shù)千張面孔,而不是識(shí)別一張臉。同樣,計(jì)算機(jī)視覺(jué)無(wú)需花費(fèi) 30 分鐘在顯微鏡下一次計(jì)數(shù)一個(gè)細(xì)胞,而是立即立即計(jì)數(shù)所有細(xì)胞。
最終,計(jì)算機(jī)視覺(jué)提供了同時(shí)和客觀地跟蹤無(wú)限數(shù)量的視覺(jué)因素的能力,并且比人類(lèi)希望達(dá)到的更關(guān)注細(xì)節(jié)。它不會(huì)因?yàn)槠>搿⒎中幕驘o(wú)聊而產(chǎn)生不一致的分析——而且它具有無(wú)限的可擴(kuò)展性。
當(dāng)您考慮使用視覺(jué) AI 代替人眼的諸多優(yōu)勢(shì)時(shí),計(jì)算機(jī)視覺(jué)是否會(huì)很快成為企業(yè)簡(jiǎn)化工作流程、提高利潤(rùn)并讓人類(lèi)工人騰出時(shí)間從事更重要任務(wù)的競(jìng)爭(zhēng)必需品?
激進(jìn)的數(shù)字化轉(zhuǎn)型已經(jīng)改變了世界
如果您仍然看不到帶有攝像頭的邊緣 AI 將如何改變一切,想想我們所看到的全球智能手機(jī)采用直接導(dǎo)致的根本性變化——這已經(jīng)深刻改變了我們相互交流和娛樂(lè)自己的方式。
除了它們只是一種更好、更簡(jiǎn)單的交流和娛樂(lè)方式之外,智能手機(jī)成功的一個(gè)主要原因與它們變得更加實(shí)惠和易用有關(guān)。向智能手機(jī)添加短信和地圖以及約會(huì)和支付有助于鞏固它們的絕對(duì)必要性。
同樣,計(jì)算機(jī)視覺(jué)正變得越來(lái)越便宜和易用,為支持人工智能的相機(jī)成為提高商業(yè)、科學(xué)、軍事、政府等無(wú)數(shù)視覺(jué)任務(wù)的速度、效率和準(zhǔn)確性的競(jìng)爭(zhēng)必需品鋪平了道路。
現(xiàn)在,無(wú)論用例涉及滑倒檢測(cè)、煙霧和火災(zāi)警報(bào),還是監(jiān)視后門(mén)以確保沒(méi)有庫(kù)存,組織都可以在幾天內(nèi)輕松且廉價(jià)地建立獨(dú)特的視覺(jué) AI 系統(tǒng)被盜。當(dāng) AI 檢測(cè)到正在進(jìn)行的跌倒、火災(zāi)或盜竊時(shí),生成的數(shù)據(jù)會(huì)觸發(fā)警報(bào),這是一個(gè)數(shù)字化變革事件。
視覺(jué) AI 模型的快速開(kāi)發(fā)和部署
就像人類(lèi)兒童發(fā)展他們的思維來(lái)觀察、分析和解釋周?chē)h(huán)境一樣,視覺(jué) AI 系統(tǒng)也需要訓(xùn)練。曾經(jīng)需要數(shù)年時(shí)間來(lái)訓(xùn)練計(jì)算機(jī)視覺(jué)模型來(lái)執(zhí)行基本的視覺(jué)任務(wù)。盡管大多數(shù)視覺(jué) AI 策略仍需要 6 到 9 個(gè)月的時(shí)間來(lái)訓(xùn)練和部署,但我們現(xiàn)在看到更新、更快、更易于使用的視覺(jué) AI 平臺(tái)可用。
現(xiàn)在,計(jì)算機(jī)視覺(jué)平臺(tái)允許公司在 6 到 9 天內(nèi)開(kāi)發(fā)和部署 AI 模型。Chooch AI 通過(guò)為火災(zāi)、跌倒、面部、缺陷、細(xì)胞計(jì)數(shù)、產(chǎn)品庫(kù)存和其他用例提供預(yù)構(gòu)建的視覺(jué) AI 模型庫(kù)來(lái)實(shí)現(xiàn)這種高速部署。選擇現(xiàn)有模型進(jìn)行即時(shí)部署,例如人體跌倒檢測(cè),為更細(xì)微的應(yīng)用程序添加額外的訓(xùn)練層 - 或在需要時(shí)訓(xùn)練全新的模型。
Chooch AI用于生成和注釋圖像的自動(dòng)化工具也加快了培訓(xùn)速度,為組織提供了巨大的敏捷性和可負(fù)擔(dān)性,以快速開(kāi)發(fā)新穎的計(jì)算機(jī)視覺(jué)解決方案。
最終,隨著計(jì)算機(jī)視覺(jué)解決方案的培訓(xùn)和部署變得更容易、更快、更實(shí)惠,嵌入式視覺(jué)技術(shù)將像野火一樣蔓延——改變社會(huì)的速度甚至比智能手機(jī)還要快,因?yàn)槌讼鄼C(jī)和設(shè)備之外不需要特殊設(shè)備。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5093文章
19178瀏覽量
307708 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7540瀏覽量
88644 -
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270344
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論