谷歌通過圖靈測試的AI實測:4次成功完成任務(wù),3次靠的是人工
谷歌神操作,驚掉人下巴。
作為全球AI第一大廠,“人類希望”的寄托,谷歌,竟然干出用真人偽裝AI的勾當。
所以剛一被《紐約時報》曝光,圈里立即炸開鍋。
核心所指,就是去年亮相的那個真假難辨的打電話AI:Duplex。
實測成功4次,3次背后是人工
去年I/O大會,打電話AI Duplex一經(jīng)亮相就技驚四座、震動全球,那一聲“嗯哼”更是令人印象深刻。
其后谷歌董事長、圖靈獎得主John Hennessy也親自上陣打Call,說在電話預(yù)約領(lǐng)域,這個AI已經(jīng)通過了圖靈測試。
而今年I/O,谷歌CEO皮猜還專門披露,一年內(nèi)已在全美40多州商用。
那意思就是靜水流深,正在廣泛深入基層服務(wù)人民群眾。
然而《紐約時報》記者好奇一試,結(jié)果尷尬。
為了更好測試,他們還專門找了兩部Pixel智能手機,內(nèi)置了谷歌助理,而且在預(yù)訂餐廳服務(wù)時,如果需要電話預(yù)訂,就能啟動Duplex.
幾天之內(nèi),《紐約時報》記者使用10多次。
但成功預(yù)訂的4次中,有3次源于Duplex背后的人工。
更直白來說,75%的成功電話預(yù)訂背后,由“偽裝”成AI的人類完成。
完全由AI實現(xiàn)預(yù)訂的,只有一次。
《紐約時報》記者也說,就在這一次中,確實也能展現(xiàn)谷歌AI的實力,不僅交流流暢應(yīng)對自如,而且還有一些小停頓和語氣詞,讓交流顯得更逼真。
在被餐廳經(jīng)理問及“幾個人吃飯”、“什么時候”、“姓名”,“手機號”等信息時,谷歌AI都應(yīng)對自如,準確回答。
甚至餐廳經(jīng)理冷不防問出“有孩子嗎?”這樣的問題,谷歌AI還能隨機應(yīng)變,回答說:“我?guī)涂蛻纛A(yù)訂,所以我不太確定?!?/p>
然而遺憾的是,測試中成功預(yù)訂的4次,有且僅有這一次,是真AI。
即便測試樣本還不是足夠多,但也能說明很大問題。
而且谷歌利用人類呼叫員“偽裝”AI被發(fā)現(xiàn),最初也源自一則餐廳“舉報”。
愛爾蘭口音的谷歌“AI”
吉米陳(Jimmy Tran),泰餐廳Lao Thai Kitchen的員工,之前接到一通來自“谷歌助理”(Google Assistant)的電話。
這是一個有明顯愛爾蘭口音的男聲,希望預(yù)訂周末兩個人用餐的位置。
小陳原本挺激動,畢竟他也多少聽聞。通過谷歌撥打而來的訂座電話,不是普通的打Call,背后是逆天的谷歌AIDuplex.
但小陳很驚訝這個“AI”口音為何真得不像AI?不僅是愛爾蘭口音,而且說話的語氣語調(diào),“像個人”。
于是小陳單刀直入詢問:你是人還是AI?
對方馬上回答:哦,不,我不是機器人。然后還笑出聲來。
最后留下一臉懵逼的小陳,他決定向《紐約時報》尋求答案。
然而不問不知道。
谷歌官方:1/4電話由人類撥出
因為谷歌官方大大方方承認,打電話給泰餐小陳的,確實是谷歌呼叫中心的員工。
而且目前通過Duplex撥打的電話中,約有25%由人類完全操作,在其他非人工操作的情況下,有15%的呼叫受到了人為干預(yù)。
當然,打電話AI Duplex背后還有人類呼叫中心這件事,谷歌之前從未披露過。
甚至一直以來,谷歌展現(xiàn)的姿態(tài),都是完全AI,完全自動化,完全不需要人類。
只是之前官方博客里,有云淡風輕提到過,機器能夠自主完成大部分任務(wù),并識別自己無法處理的情況,然后讓人類來處理。
聽起來只是一種保障用戶體驗的冗余行為。
萬萬沒想到,人類不僅直接參與,而且1/4的電話都在“偽裝” 成AI。
而如果按照《紐約時報》的隨手測試,實際上3/4都是人類員工所為。
所以這就是谷歌如今的做事方式?
業(yè)務(wù)和產(chǎn)品淪為“方便面”包裝精美誘人,然后在旮旯角落留下一句“效果僅供參考”?
谷歌回應(yīng):出于對餐廳尊敬
而且谷歌的解釋和回應(yīng),也讓人困惑。
谷歌說,Duplex之所以有時依賴人工,部分原因在于,是出于對餐廳的尊重。
負責谷歌助理業(yè)務(wù)的高管尼克福克斯(Nick Fox)解釋,為保證餐廳方面的體驗,谷歌沒有在Duplex中強力去人工化。
但谷歌也在不斷隨著時間推進改進產(chǎn)品,改進自動化系統(tǒng),并逐漸減少人工干預(yù)的需要。
Duplex的產(chǎn)品經(jīng)理也表示,還有些餐廳不知道能不能電話預(yù)訂,所以這類餐廳會優(yōu)先選擇人類打電話。
也就是說,只有那些明確接受電話訂座的餐廳,谷歌系統(tǒng)才會讓AI出馬。
然而《紐約時報》馬上用實例打臉。
因為就在一個之前成功用Duplex訂座成功的餐廳,再次試圖用谷歌AI預(yù)訂時,谷歌派出的是人類。
《紐約時報》猜測,可能是Duplex系統(tǒng)的學習速度還沒那么快。
因為之前The Verge的相關(guān)報道中,還提到了另一個原因:這項技術(shù)還很年輕、使用有限。目前谷歌仍在使用人工呼叫來幫助獲取數(shù)據(jù)、訓練AI。
但無論如何,谷歌一手塑造的逆天AI,這次算是破功了。
大家習慣了“多少人工就有多少智能”的說法,但谷歌在應(yīng)用級人工智能產(chǎn)品中,玩起“人工”+“智能”的模式,依然令人震驚。
事情曝光后,也有人評論說:
難以置信,當他們在舞臺上現(xiàn)場表演時,我很驚訝。他們完全撒謊了,我真的希望有人起訴他們。那天他們在舞臺上欺騙了成千上萬的人。
不過也有谷歌鐵桿支持者認為,谷歌這樣謹慎而不激進地引入Duplex,是明智的。
不知道你是否還記得Duplex橫空出世的樣子。
這里可以幫你回顧一下:
只是Demo再炫酷,現(xiàn)在也被現(xiàn)實給了一記尷尬耳光。
你怎么看?
評論
查看更多