機(jī)器現(xiàn)在可以識(shí)別憤怒、恐懼、厭惡和悲傷,而情感檢測已從一個(gè)研究項(xiàng)目發(fā)展到價(jià)值200億美元的產(chǎn)業(yè)。
檢測程序能通過讀取面部表情和行為發(fā)現(xiàn)潛在的***嗎?這是美國交通安全管理局(TSA)2003年提出的一個(gè)假設(shè),在開發(fā)這個(gè)項(xiàng)目時(shí),他們咨詢了舊金山加利福尼亞大學(xué)心理學(xué)榮譽(yù)退休教授保羅·艾克曼(Paul Ekman)。幾十年前,艾克曼(Ekman)已經(jīng)開發(fā)出了一種識(shí)別細(xì)微面部表情的方法,并將它們映射到相應(yīng)的情緒上,這種方法被用來訓(xùn)練“行為檢測人員”——掃描臉部觀察是否有欺騙的跡象。
但當(dāng)該計(jì)劃于2007年推出時(shí),卻面臨種種問題,比如警察利用該技術(shù)經(jīng)常錯(cuò)誤的逮捕嫌犯,更令人擔(dān)憂的是,該計(jì)劃據(jù)稱涉嫌種族歧視。
此后,艾克曼(Ekman)試圖與美國交通安全管理局的項(xiàng)目脫離關(guān)系,聲稱他的方法被誤用了,但分析人士認(rèn)為,該計(jì)劃的失敗是因?yàn)榘寺‥kman)的一個(gè)過時(shí)科學(xué)理論;即情緒可以通過面部的分析客觀地推斷出來。
近年來,科技公司已經(jīng)開始使用艾克曼(Ekman)的方法來訓(xùn)練從面部表情中檢測情感的算法,一些開發(fā)人員聲稱,自動(dòng)情緒檢測系統(tǒng)不僅比人類更好地通過分析面部表情洞察真實(shí)的情緒,而且這些算法也將適應(yīng)檢測我們內(nèi)心的感受,極大地改善了我們與電子設(shè)備的交互。
但是許多研究情感科學(xué)的專家擔(dān)心這些算法會(huì)再次失敗,基于錯(cuò)誤的科學(xué)對我們的生活做出高風(fēng)險(xiǎn)的決定。
01
價(jià)值200億美元的大生意
情感檢測科技需要兩種技術(shù):計(jì)算機(jī)視覺,用于精確識(shí)別面部表情。機(jī)器學(xué)習(xí)算法,用于分析和解釋這些面部特征表達(dá)的情感內(nèi)容。
行人檢測攝像頭正在工作 圖/紐約時(shí)報(bào)
第二步通常采用一種名為監(jiān)督學(xué)習(xí)的技術(shù)。通過這種技術(shù),一個(gè)算法被訓(xùn)練出來識(shí)別它曾經(jīng)見過的東西。基本的想法是,如果你在“happy”(“快樂”)這個(gè)標(biāo)簽下顯示出成千上萬張笑臉的圖像,當(dāng)它看到一張上面有笑臉的新照片時(shí),會(huì)再次把它識(shí)別為“happy”(“快樂”)。
研究生拉娜·艾爾·卡利歐比(Rana el Kaliouby)是最早開始試驗(yàn)這種方法的研究人員之一。2001年,從埃及來到劍橋大學(xué)攻讀計(jì)算機(jī)科學(xué)博士學(xué)位后,她發(fā)現(xiàn)自己花在電腦上的時(shí)間比花在與其他人相處的時(shí)間更多。她認(rèn)為,如果她能教電腦識(shí)別自己的情緒狀態(tài)并做出反應(yīng),那么沒有家人和朋友在身邊時(shí),她也不會(huì)那么孤獨(dú)了。
卡利歐比(Kaliouby)博士階段的其余研究都致力于解決這個(gè)問題。最終,她開發(fā)出了一種設(shè)備,可以幫助患有亞斯伯格綜合癥(Asperger syndrome)的兒童閱讀面部表情并做出相應(yīng)的反應(yīng)。她稱其為“情感助聽器”。
2006年,卡利歐比(Kaliouby)加入麻省理工學(xué)院的情感計(jì)算實(shí)驗(yàn)室,在那里,她與實(shí)驗(yàn)室主任羅莎琳德·皮卡德(Rosalind Picard)一起,繼續(xù)改進(jìn)和完善這項(xiàng)技術(shù)。此后,2009年,她們共同創(chuàng)辦Affectiva公司,面向市場銷售“人工情感智能”。
一開始,Affectiva將她們的情感檢測技術(shù)作為一種市場研究產(chǎn)品出售,為廣告和產(chǎn)品做出實(shí)時(shí)的情感反應(yīng),他們找到了諸如瑪氏(Mars),家樂氏(Kellogg’s)和哥倫比亞廣播公司(CBS)這樣的客戶。如今,亞馬遜、微軟和IBM也將“情感分析”作為他們的面部識(shí)別產(chǎn)品之一,許多較小的公司,如Kairos 和Eyris也已經(jīng)開始崛起,提供類似的服務(wù)。
除了市場研究以外,情感檢測技術(shù)現(xiàn)在還被用于監(jiān)控和檢測駕駛員的身體損傷,測試視頻游戲的用戶體驗(yàn),以及幫助醫(yī)療專業(yè)人士評估患者的健康狀況。
卡利歐比(Kaliouby)目睹了情感檢測從一個(gè)研究項(xiàng)目成長為一個(gè)價(jià)值200億美元的行業(yè)。她相信該行業(yè)將繼續(xù)發(fā)展壯大。卡利歐比(Kaliouby)預(yù)言,在不久的將來,這項(xiàng)技術(shù)將無處不在,并整合到我們所有的設(shè)備當(dāng)中,能夠“利用我們內(nèi)在的、潛意識(shí)的、時(shí)時(shí)刻刻的反應(yīng)”。
02
囊括87個(gè)國家750萬張人臉的數(shù)據(jù)庫
與大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用程序一樣,情感檢測的進(jìn)展取決于訪問更高質(zhì)量的數(shù)據(jù)。
展會(huì)上的面部識(shí)別軟件 圖/路透社
Affectiva公司表示,他們的情感數(shù)據(jù)存儲(chǔ)庫包含來自87個(gè)國家的750多萬張面孔,其中大部分是從收看電視或每天上下班行人的選擇性錄像中收集的。
目前,利用該技術(shù)可以將面部表情翻譯成對應(yīng)的情緒,例如,如果他們看到眉毛低垂,嘴唇緊閉,眼睛凸出的面容,就會(huì)貼上“憤怒”的標(biāo)簽。然后,這個(gè)帶有標(biāo)記的人類情緒數(shù)據(jù)集就會(huì)被用來訓(xùn)練算法,該算法會(huì)學(xué)習(xí)如何將皺眉頭的臉與憤怒、微笑的臉與幸福等等聯(lián)系起來。
這種標(biāo)注方法,在情感檢測行業(yè)中被許多人認(rèn)為是衡量情感的黃金標(biāo)準(zhǔn),它是由保羅·艾克曼(Paul Ekman)和弗里森(Wallace V Friesen)于20世紀(jì)80年代開發(fā)的一款名為“情感面部動(dòng)作編碼系統(tǒng)”(Emfacs)衍生而來。
這個(gè)系統(tǒng)的科學(xué)根源可以追溯到20世紀(jì)60年代,當(dāng)時(shí)艾克曼(Ekman)和兩位同事假設(shè)世界上存在六種普遍的情緒——憤怒、厭惡、恐懼、幸福、悲傷和驚訝——這些是我們與生俱來的情緒反應(yīng),可以通過分析面部肌肉運(yùn)動(dòng)在所有身處不同文化的人群中檢測到。
為了驗(yàn)證這一假設(shè),他們向全世界不同地區(qū)的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發(fā)現(xiàn),盡管存在巨大的文化差異,人類還是會(huì)將相同的面部表情與相同的情感匹配在一起。對于美國的銀行家和巴布亞新幾內(nèi)亞的半游牧獵人來說,眉毛低,嘴唇緊閉,眼睛凸出的臉都意味著“憤怒”。
此后的二十年里,艾克曼(Ekman)利用他的發(fā)現(xiàn)開發(fā)了一種識(shí)別面部特征并將其映射到對應(yīng)情緒的方法,潛在的前提是如果一個(gè)人的普遍情緒被觸發(fā),那么一個(gè)相關(guān)的面部動(dòng)作就會(huì)自動(dòng)地出現(xiàn)在臉上。即使那個(gè)人試圖掩飾情緒,真實(shí)的本能感覺也會(huì)“泄露”出來,因此懂得觀察的人可以捕捉到對方的情緒。
整個(gè)20世紀(jì)后半葉,這個(gè)理論被稱之為經(jīng)典情感理論,開始主宰情感科學(xué)。艾克曼(Ekman)為他的情感檢測方法申請了專利,并開始將其作為訓(xùn)練項(xiàng)目出售給CIA、FBI、海關(guān)和邊境保護(hù)局以及TSA,真實(shí)情感可讀的觀念甚至滲透到了大眾文化之中,構(gòu)成了電視劇Lie to Me的理論基礎(chǔ)。
然而,眾多研究情感本質(zhì)的科學(xué)家和心理學(xué)家對經(jīng)典理論和埃克曼(Ekman)的相關(guān)情感檢測方法提出質(zhì)疑,近年來,東北大學(xué)心理學(xué)教授麗薩·費(fèi)爾德曼·巴雷特(Lisa Feldman Barrett)提出了一個(gè)強(qiáng)烈且持久的批評。
巴雷特(Barrett)在研究生時(shí)期首先遇到了經(jīng)典理論,她需要一種客觀測量情感的方法,于是發(fā)現(xiàn)了艾克曼(Ekman)的方法。在回顧文獻(xiàn)時(shí),她開始擔(dān)心潛在的研究方法有缺陷。具體地說,她認(rèn)為通過給人們提供預(yù)選的情感標(biāo)簽來匹配照片,艾克曼(Ekman)無意中“已經(jīng)有了預(yù)設(shè)的答案”。
巴雷特(Barrett)和一組同事通過重新運(yùn)行艾克曼(Ekman)的測試來檢驗(yàn)這個(gè)假設(shè)。但他們不提供標(biāo)簽,讓測試者自由地描述自己所看到圖像中的情緒,具體面部表情和具體情緒之間的關(guān)系直線下降。
從那時(shí)起,巴雷特(Barrett)發(fā)展了自己的情感理論,在她的著作《情感是如何產(chǎn)生的:大腦的秘密生活》(How Emotions Are Made: the Secret Life of the Brain)中得以闡述,她認(rèn)為,大腦中沒有由外部刺激觸發(fā)的普遍情緒,相反,每一次情感體驗(yàn)都是由更基本的部分構(gòu)成的。
她寫道:“情感是你身體物理特性的結(jié)合,是一個(gè)靈活的大腦,可以連接到所處的任何環(huán)境中,是你的文化和教養(yǎng)提供了這種環(huán)境,情感是真實(shí)的,但在客觀意義上不是說分子或神經(jīng)元是真實(shí)的,與金錢一樣真實(shí),這不是幻覺,而是人類一致同意的產(chǎn)物。”
巴雷特解釋說,把面部表情直接映射到所有文化和環(huán)境中的情緒,這么做是沒有意義的,一個(gè)人生氣時(shí)可能會(huì)皺眉,而另一個(gè)人可能會(huì)向敵人禮貌地微笑,因此,評估情緒最好理解為一種動(dòng)態(tài)實(shí)踐,包括自動(dòng)認(rèn)知過程、人與人的互動(dòng)、具體經(jīng)驗(yàn)和文化能力。她說,“這聽起來很費(fèi)勁,但確實(shí)如此。”卡利歐比同樣認(rèn)為“情感是復(fù)雜的。”
這就是為什么她和她在情感研究所的團(tuán)隊(duì)一直努力提高數(shù)據(jù)豐富性和復(fù)雜性的原因。
除了使用視頻而不是靜止圖像來訓(xùn)練他們的算法外,他們還嘗試捕捉更多的背景數(shù)據(jù),比如聲音、步態(tài)以及人類感知之外的面部細(xì)微變化,她相信更好的數(shù)據(jù)將意味著更準(zhǔn)確的結(jié)果,一些研究甚至聲稱機(jī)器在情感檢測方面已經(jīng)優(yōu)于人類。
但據(jù)巴雷特所說,這不僅與數(shù)據(jù)有關(guān),而且與數(shù)據(jù)如何被標(biāo)記有關(guān),情感檢測公司和其他情感檢測公司用來訓(xùn)練算法的標(biāo)記過程,只能識(shí)別巴雷特所說的“情感刻板印象”,就像表情符號(hào)一樣,這些符號(hào)符合我們文化中普遍的情感主題。
紐約大學(xué)人工智能研究所的聯(lián)合主任梅雷迪思·惠特克(Meredith Whittaker)認(rèn)為,基于艾克曼過時(shí)的科學(xué)構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用程序不僅僅是一種糟糕的實(shí)踐,還會(huì)轉(zhuǎn)化為真正的社會(huì)危害。
她說:“你已經(jīng)看到招聘公司使用這些技術(shù)來衡量應(yīng)聘者是否是一個(gè)好員工,你還可以看到用于學(xué)校的實(shí)驗(yàn)性技術(shù),以觀察學(xué)生在課堂上是忙碌、無聊還是憤怒。卡利歐比表示,“這些信息可以用來阻止人們獲得工作或改變他們在學(xué)校的待遇和評估方式,如果分析并非十分準(zhǔn)確,那將會(huì)是一種傷害。”
卡利歐比也敏銳地意識(shí)到建立不同數(shù)據(jù)集的重要性。她說:“我們要確保訓(xùn)練這些算法時(shí),訓(xùn)練數(shù)據(jù)是多樣化的,我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”這就是為什么研究團(tuán)隊(duì)要從87個(gè)國家收集數(shù)據(jù)的原因。
通過這個(gè)過程,他們注意到在不同的國家,情感表達(dá)似乎呈現(xiàn)出不同的強(qiáng)度和細(xì)微差別。例如,巴西人用寬而長的微笑來表達(dá)幸福,而在日本,微笑并不表示幸福,而是表示禮貌。情感分析解釋了這種文化差異,增加了對系統(tǒng)的另一層分析,匯編了卡里歐比所說的“基于種族的基準(zhǔn)”,編纂了關(guān)于不同種族文化中如何表達(dá)情感的假設(shè)。
但正是這種基于種族等標(biāo)記的算法判斷讓惠特克(Whittaker) 擔(dān)心情緒檢測技術(shù)暗示了自動(dòng)化面相的未來。事實(shí)上,已經(jīng)有公司對某人成為犯罪分子的可能性進(jìn)行了預(yù)測。
最近幾項(xiàng)研究還表明,面部識(shí)別技術(shù)更容易產(chǎn)生傷害少數(shù)族裔群體的偏見,去年12月發(fā)表的一篇文章顯示,與白人相比,情感檢測技術(shù)顯示出黑人臉上的負(fù)面情緒更多。
卡利歐比認(rèn)為,情感系統(tǒng)確實(shí)有一個(gè)種族分類器,她承認(rèn),這項(xiàng)技術(shù)目前并非萬無一失。
-
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3846瀏覽量
64685 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46127 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
133085
原文標(biāo)題:87個(gè)國家 750萬張臉部表情 一個(gè)價(jià)值200億美金的AI大生意
文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論