本周二我們在知乎平臺發起了“AI新知挑戰”活動,精選了知乎平臺四大AI經典問題與大家交流。以下是IBM對于其中一個問題:“如何向人類同伴證明自己不是一個人工智能?”的回答,在這里與大家分享。
證明自己不是一個機器人這件事兒,我們每天都在干。登錄網站時需要輸入數字驗證碼,在“我不是機器人”的條款上打勾,還有最近經常使用的“滑動驗證”,這些都是人類被懷疑是機器的時刻。
向同伴證明自己不是機器人,并不是這兩年的“新玩法”,早在68年前,人們就想讓還很笨拙的計算機騙過人類,并為此發明了復雜的方法……
圖靈的新想法:讓計算機來冒充人!
1950年,圖靈提出了最早的人機測試。在圖靈測試中,測試者(人類)可以通過打字、說話等形式向被測試者(機器)進行提問,既包括人腦無法瞬時計算的復雜數學難題,也包括比如像“今天的天氣怎樣”這樣的日常對話。當進行多次測試后,如果有超過30%的測試者在聽到回答后不能確定被測試者是人還是機器,那么這臺機器就被認為具備了人工智能。
長久以來,圖靈測試都被認為是檢驗人工智能的終極測試,直到在英國皇家學會舉行的“2014圖靈測試”大會上,“聊天男孩”尤金·古斯特曼被33%評委認定為人類,作為第一位“人工智能”通過了圖靈測試。但仔細觀察尤金與人類的對話,我們不難發現其中的破綻——在被問及常識性問題時,尤金都是通過“避而不答“這一手段來誤導人類的判斷:
計算機科學家 SCOTT AARONSON:鞋盒子與珠穆朗瑪峰,那個更大?
>> EUGENE:現在我還不確定,我得再想想。對了,我忘記問你來自哪兒了?
SCOTT AARONSON:一只千足蟲有多少條腿?
>> EUGENE:只有 2 條。但考慮到切爾諾貝利事故,它有可能增加到 5 條。我知道你在對我說腦筋急轉彎。
SCOTT AARONSON:沒有,我需要知道你不是一個聊天機器人。請直接回答這個問題:一只螞蟻有幾只腿?
>> EUGENE:2 至 4 條吧,也許,3 條?哦,這是一次多么富有成果的對話。
這項”富有成果“的對話充分揭示了圖靈測試的漏洞,只要掌握了”回避“這一手段,越來越多的機器都能輕而易舉地“欺騙”人類,但這并不意味著人工智能實質性的進步,這樣的“欺騙”也無法幫助人類實現更多價值。那么什么樣的測試才能辨別出真正智能的機器呢?
聽得懂人話,會思考
“說人話”是電腦從機器向人工智能發展的第一步,但想要邁好這一步,不僅需要高級的人工智能技術,還要讓“聽懂并組織語言”這種能力為人類的生產生活創造價值。
2011年,IBM Watson在美國最受歡迎的智力競猜電視節目《危險邊緣》(Jeopardy!)中擊敗了該節目歷史上兩位最成功的選手Ken Jennings和Brad Rutter,成為第一位在電視節目中獲得冠軍的人工智能,一舉讓人們記住了這個“聰明”的機器。
Watson在《危險邊緣》中獲勝
通過不斷的機器學習,Watson將機器的自然語義處理帶入新境界,它可以充分理解人類語言中微妙和復雜的含義、諷刺口吻、雙關語及謎語等,打破了“人類擅長”的邊界。用Jennings在賽后采訪的話來說,Watson的奪冠意味著計算機在自然語言處理方面的一次巨大飛躍——計算機已有能力理解和回應日常對話。
然而,故事遠遠沒有結束。“說人話”僅僅是人工智能發展的第一步。IBM將AI的核心能力定義為以自然語言為基礎的URLI,即理解,推理,學習和交互。這就意味著,IBM在研發AI時從輸入到輸出全方位賦予AI更高級的本領,讓AI在“觀點表達”方面也能有出色的表現。
URLI解釋示意圖
巧識邏輯破綻,犀利幽默辯駁
在智力游戲節目中,AI要學習的是冰冷冷的百科知識,而要與人類辯論,則要在短時間理解人類的政治、文化、法律甚至是情感和藝術等非理性內容,同時根據對方辯手的陳述,組織論據,陳述富有邏輯的觀點,并帶點適當的幽默來感染現場觀眾。
由IBM Research研發的AI系統Project Debater分別在2016、2018年與以色列國家辯論冠軍Noa Ovadia和以色列國際辯論協會主席Dan Zafrir進行辯論,還連續拿了辯論冠軍。
Project Debater拿到辯題后,它會迅速掃描其龐大的語料庫文檔中與主題相關的數百萬篇新聞和論文等材料,找出與辯題相關性最高的觀點,通過算法剔除多余且重復的信息,提取出一個最具說服力的觀點。同時,在人類辯手4分鐘的觀點陳述時,邊聽邊“想”,不僅準確地回應人類對手的論點,還指出了對手所犯的事實錯誤,同時不失時機地展現了一個機器人的幽默。
這意味著機器不再只是對非黑即白的問題做出正確回答,而面對沒有標準答案的問題,也能對觀點或論據進行決策,并權衡其相關性比重。如果通過機器學習讓Project Debater擁有更廣的“知識面”,那么它將在商業應用場景中,幫助人類豐富決策過程,權衡新想法和新理念的利弊。
Project Debater與人類辯論
人工智能的“獨立思考”能力不僅僅可以用于知識競賽或辯論,IBM力求讓機器思維賦能更多行業專業領域
金融顧問:AI系統可以幫助金融顧問從海量數據中找出金融事實,用以支持或反對金融分析師所思考的金融投資選擇。
律師:律師可以借助AI系統來尋找相關案件和主張,或模擬法庭辯論來分析優勢和劣勢。
公共事務決策:通過AI系統公正的優/缺點分析和對人類困境的模擬,可以就需要進行決策的問題,為決策者提供基于事實、沒有人為偏見的觀點。
學生助手:AI系統可以幫助各個年齡段的學生改進他們的批判性思維和溝通技巧,或幫助他們找出更多信息以改進報告和論文。
CEO 和高管:高層領導常常因擁有強烈的“直覺本能”而感到自豪,但是他們也必須避免所謂的“錨定偏見”。錨定偏見是指,我們在潛意識中有著兩三個會不太客觀地影響決策的事實時,就會將不適合這些觀點的有價值信息排除在外不予考慮。像Project Debater一樣的AI系統可以拓寬高層領導的思路,在關鍵決策中納入他們可能沒有考慮到的新觀點。
看完這些,是不是感覺后背微微發涼,有沒有在懷疑這篇稿子也是人工智能完成的呢?AI時代下,人與機器不該是相互懷疑、對立的存在,而是需要協同發展、不可分割的整體。是不是機器并不重要,能不能無礙交流、相輔相成,共同完成各項任務,才是我們應該討論的人機測試的關鍵。
-
計算機
+關注
關注
19文章
7536瀏覽量
88641 -
人工智能
+關注
關注
1796文章
47666瀏覽量
240288 -
機器學習
+關注
關注
66文章
8438瀏覽量
133085
原文標題:你該如何向人類同伴證明自己不是人工智能?
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論