阿里巴巴近日再爆大事件,阿里巴巴ai模型在閱讀理解領域頂級賽事SQuAD破世界紀錄引起大家的高度關注,跟隨小編一起來了解一下是什么情況,看看阿里巴巴人工智能的未來發展趨勢以及全球人工智能的未來發展趨勢是什么。
阿里巴巴ai模型破世界紀錄
日前,由斯坦福大學發起的機器閱讀理解領域頂級賽事SQuAD刷新排名,阿里巴巴憑借82.440的精準率打破了世界紀錄,并且超越了人類82.304的成績。
SQuAD負責人Pranav Rajpurkar表示,第一個模型(阿里巴巴iDST團隊提交的SLQA +)在精準度匹配上超越人類表現,下一個挑戰:模糊匹配,人類仍然領先2.5分。
據了解,SQuAD比賽構建了一個大規模的機器閱讀理解數據集(包含10萬個問題),文章來源于500多篇維基百科文章,旨在通過這套試題梳理出線索,看機器學習模型是否能夠在經過大量信息處理后給出問題的確切答案。
阿里巴巴研究院自然語言處理首席科學家司羅在一份公告中說,對于像“天為什么會下雨”這樣的客觀問題,機器給出的答案準確率會很高。公告稱,其中的技術可以逐步應用于諸如客服、博物館指南、在線解答患者醫療問題等廣泛的實際應用領域,從而以一種前所未有的方式減少人力投入的需求。
此次技術的重大突破源于阿里巴巴研究團隊提出的“基于分層融合注意力機制”的深度神經網絡模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結合篇章內容審題,帶著問題反復閱讀文章,避免閱讀中遺忘而進行相關標注等。
據了解,這項技術已經在阿里巴巴內部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規則進行咨詢。阿里小蜜團隊通過使用司羅團隊的技術,讓機器直接對規則進行閱讀,為用戶提供規則解讀服務,是最自然的交互方式。
再比如,顧客還會針對單個商品詢問大量的基礎問題,而這些問題其實在商品詳情頁都是有答案的。現在通過機器閱讀理解技術,能夠讓機器對詳情頁中的商品描述文本進行更為智能地閱讀和回答,降低服務成本的同時提高購買轉化率。
據小編了解,由司羅領導的自然語言處理團隊支撐了阿里巴巴整個生態的技術需求。由他們研發的AliNLP自然語言技術平臺每日調用1200億+次,Alitranx翻譯系統提供20個語種在線服務日調用量超過7億+次。此前曾在2016年ACM CIKM個性化電商搜索、2017年IJCNLP中文語法檢測CGED評測、2017年年美國標準計量局TAC評比英文實體分類等大賽中取得全球第一的成績。
阿里巴巴的人工智能未來發展解析
阿里在人工智能的布局主要有兩個方向:一是在電商和商家融合,二是給廠商技術支持。
阿里巴巴人工智能實驗室于2017年7月5日亮相,主要研究消費級 AI產品。第一款產品就是最近大家熟悉的智能語音終端設備“天貓精靈 X1”。
iDST(數據科學與技術研究院)被稱為是阿里巴巴最神秘的研究機構,分布在杭州、北京、西雅圖、硅谷等地,是阿里巴巴負責人工智能技術研發的核心團隊、阿里巴巴NASA計劃的人工智能大腦。
小編了解到,阿里除了人工智能實驗室、數據科學與技術研究院iDST,還擁有阿里研究院、VR實驗室,螞蟻金服也具備自己的人工智能團隊。此外,2017年3月阿里宣布推出“NASA”計劃,面向機器學習、芯片、IoT作系統、生物識別這些核心技術組建新團隊,建立新的機制和方法。
延伸閱讀:人工智能的發展趨勢
趨勢一:大公司都將從人工智能獲利
亞馬遜、谷歌、Facebook和IBM,它們將在人工智能領域引領潮流。作為大公司,他們有合適的資源來收集數據,因此有更多的數據可以使用,且看這些巨頭是如何布局的。
亞馬遜:投資人工智能20年以上,抓取了5B以上的網頁數據,超過50萬張JPEG圖像和相應的JSON元數據,用以供給亞馬遜運營中心的產品。每天抓取世界廣播、雜志和網絡新聞的數據已超過2.5億,每天抓取近100M圖像和視頻具有音頻和視覺功能并帶有注釋。亞馬遜Echo系列音箱已經占領了超過70%的語音助手市場。
Google:具有全世界最大的數據庫,專注于應用和產品開發,而不是長期的AI研究。GoogleBrain擁有超過1300名研究人員的團隊,在語音助理市場占有23.8%的用戶份額。使用TensorFlow開源平臺進行機器學習,允許任何人訪問機器學習平臺。Google地球數據庫的大小估計為3017TB或大約3PB,GoogleStreetView有大約20PB的街景照片。
谷歌很可能在應用程序和產品開發及服務的部署方面都處于最前沿,它不僅是第一家開始研究人工智能的公司,而且擁有7萬名員工。此外,谷歌擁有一個深度學習人工智能研究項目GoogleBrain,它擁有一個團隊,有自己的研究議程,研究領域涵蓋了機器學習、自然語言理解、機器學習算法和技術,以及機器人。
Facebook:每日處理2.5B的內容和500多TB的數據,FacebookArticialIntelligenceResearchers(FAIR)有大約80位研究人員和工程師,每天產生20億“贊”和3000萬照片,每30分鐘掃描大約105TB的數據建有一個62000平方英尺的數據中心,可容納500個機架。每天翻譯超過40種語言的20億用戶帖子,每天有8000萬用戶使用這些翻譯。
IBM:計劃進行為期10年、價值2.4億美元的投資來創建MIT-IBM沃森人工智能實驗室。在全球擁有2000多名AI員工,在IBM總部擁有超過600名AI員工,沃森用戶跨越六大洲和超過25個國家,IBM向沃森項目投資10億美元,其中包括1億美元的風險投資。通過沃森生態系統建立了7000多個應用。
趨勢二:算法與技術的整合
所有在人工智能領域投資的二級資本公司,比如英特爾、Salesforce和Twitter,都將追隨擁有這些數據的大公司,并使用他們的數據算法和人工智能。行業參與者之間將會發生數據交易,而且很有可能會整合算法和技術。數據的交易以及算法和技術的整合將使人工智能變得更加重要。
隨著谷歌和Facebook等規模更大的公司收購小公司,更多的算法將被整合到它們的核心平臺或解決方案中。總部位于英國倫敦的人工智能公司DeepMind,構建了通用學習算法,被谷歌收購,以獲得相對于其他科技公司的商業優勢。另一方面,Facebook收購Wit.ai來提升自己的語音識別和語音界面。該公司還收購了人工智能創業公司Ozlo,以完善其M虛擬助理服務。
趨勢三:數據眾包
所有的人工智能公司都追求巨大的數據庫,以實現他們對人工智能的雄心壯志。這些公司將開始通過眾包方式獲取大量數據。企業已經找到了一種方法來評估眾包數據的質量和真實性,不僅給企業提供了便利,還能反饋信息給消費者。
OpenDataNow.com的創始人兼編輯JoelGurin表示,“我們生活在一個眾包文化的環境中,越來越多的人愿意和有興趣通過社交媒體分享他們所知道的東西。”
谷歌通過眾包的方式,獲得了大量的圖片,并構建了成像算法。該公司還利用眾包來幫助改善服務,比如翻譯、轉錄、手寫識別和地圖應用。而亞馬遜還利用眾包的技術改善了Alexa的1.5萬項現有技能。
趨勢四:更多的并購將發生
CBInsights的統計數據顯示,AI公司的收購競爭已經開始。2018年將是我們能看到的最多的公司收購和被收購的一年,因為這些公司必須爭奪知識資本和人才才不會被淘汰。機器學習/人工智能的所有小公司都將被大公司收購。有兩個原因:
AI在沒有數據庫的幫助下沒法工作。因為大公司擁有大量的數據庫,他們將對那些小公司造成巨大的壓力。沒有數據庫的支持,算法將毫無用處。同樣如果沒有算法,數據幾乎也毫無用處。數據是算法的核心,大量的數據是至關重要的。哥倫比亞大學創意機器人實驗室的機器人工程師和總監HodLipson說,“數據是燃料,算法是引擎”。
趨勢五:開放民主化的工具將獲得市場份額
大公司將開始開放他們的算法和其他工具,以獲得市場份額。以市場為基礎的數據和算法進入壁壘將會減少,人工智能的新應用將會增加。通過開放平臺和民主化,那些無法使用人工智能工具的小公司將可以獲得大量的數據來研究人工智能算法。
正如谷歌首席執行官桑達爾·皮查伊(SundarPichai)在談到民主化的人工智能時所說的那樣,“我們所能做的最激動人心的事情之一就是讓機器學習和人工智能變得不再那么神秘。讓所有人都能接觸到這一點很重要。”此外,frameworks、SDKsandAPIs將成為所有主要廠商對消費者開放使用的標準。所有的公司都將采用SaaS&PaaS商業模式。
趨勢六:人機交互將得到改善
Siri和Alexa大概是目前最受歡迎的人機交互工具,與之類似的更多基于機器人的解決方案將是人工智能公司進入這個行業的門檻。例如,雖然機器已經被編程用于語音分析和面部識別,但機器還得做到根據你的聲音來識別你的情緒,也就是進行情緒分析。
制造自動化和非消費者焦點解決方案將是第一個要改進的解決方案/應用程序。制造自動化將主要歸功于人工成本節約,使用包括自動化、機器人和先進制造技術。非消費者解決方案的改進,例如在農業和醫藥領域執行任務的人機交互,也將在2018年流行起來。
趨勢七:人工智能將漸漸地對所有垂直領域產生影響
制造、客戶服務、保健、醫療保健和交通運輸的領域已經受到AI的影響,自動駕駛汽車預計將在2018年上市。明年,會有更多的領域受到人工智能的影響。以下是人工智能對不同行業影響的例子:
保險——AI將通過自動化改進索賠流程。
法律——NLP可以在幾分鐘內總結成千上萬頁的法律文件,從而減少查閱時間和提高效率。
PR&media——AI將幫助快速處理數據。
教育——虛擬導師的發展;人工智能幫助打分數;制定適應性學習計劃,游戲和軟件;以AI為導向的個性化教育計劃將改變學生和老師的互動。
健康——機器學習可用于創建更復雜,更準確的方法來在患者出現癥狀之前預測疾病
正如工業革命在100年前幾乎改變了一切一樣,人工智能將在未來幾年改變這個世界。
趨勢八:安全、隱私及倫理道德問題
在人工智能的保護傘下,諸如機器學習和大數據等問題,都很容易觸及到安全及隱私問題。有時基礎設施扮演著很重要的角色。與隱私問題有關的安全需求,如將銀行帳戶和健康信息保密,將會對研究的安全性有更大的要求。2018年,有關安全和隱私的問題將得到解決,這一年,也是人工智能可能出現新的發展的一年。
人工智能的倫理問題也將成為2018年的主要問題,需要解決的倫理和道德問題包括人工智能對人類有哪些好處和壞處。人們也對機器人取代人類的可能性感到擔憂,比如護士、治療師或警察,另一個需要處理的問題是自主武器。
評論
查看更多