那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中文信息處理實驗室提出工具學習新框架ToolAlpaca

中科院軟件所中文信息處理實驗室 ? 來源:中科院軟件所中文信息處 ? 2023-06-15 16:43 ? 次閱讀

如何讓小規(guī)模語言模型像 GPT-4 一樣使用任意工具是一個非常有價值的研究課題。中國科學院軟件研究所中文信息處理實驗室提出了一種語言模型的工具學習新框架,該框架利用基于大模型的多智能體模擬交互策略,可以自動生成多樣化的工具使用數(shù)據(jù)集,并使用生成的數(shù)據(jù)集對小模型進行微調。論文的實驗驗證了僅需要使用三千多個多樣化的工具調用實例,就能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

具體來說,本文的核心工作包括:

1. 提出一種基于大模型的多智能體模擬交互策略,用于生成工具使用數(shù)據(jù)集。這種方法能在最小化人工干預的前提下,生成大量且多樣化的工具使用數(shù)據(jù)集;

2. 開源了一個涵蓋超過400個工具,三千多條實例的模擬工具使用數(shù)據(jù)集,為探索通用工具使用能力奠定了基礎;

3. 通過實驗,驗證了在多樣化工具使用數(shù)據(jù)集上進行微調,能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

論文:ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

數(shù)據(jù):https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人類進化史上占據(jù)了重要的地位,對于語言模型來說,這一點同樣適用。當語言模型能夠熟練運用各種工具,它們就能突破自身的局限,獲取最新的信息,幫助用戶利用各種服務,并提升回答的精確性。 如今,OpenAI 的 GPT-4 已經(jīng)可以通過插件的形式接入和使用各種第三方工具,同時這類超大型的語言模型支持通過僅給定配置文件的情況下,以即插即用的方式使用之前模型訓練過程中未見過的工具,這一泛化性的工具使用能力大大豐富了模型調動資源解決復雜問題的手段。然而,對于較小的語言模型,例如 Moss、ToolLLaMA 等,它們使用工具的能力仍然來源于在特定工具的數(shù)據(jù)集上進行監(jiān)督學習。這使得這些模型的工具使用能力受限于在訓練過程中接觸過的工具,尚未真正獲得通用的工具使用能力。上述的對比引出了研究人員所關注的一個核心研究問題,即是否有可能讓較小規(guī)模的語言模型也具備有泛化地使用各種不同的、未見過的工具的能力,進而讓它們能夠更好地與更廣泛的工具進行交互,從而提升模型利用現(xiàn)實世界的資源解決問題的手段。

ToolAlpaca:通用工具使用能力學習新框架

受 Alpaca 通過微調讓小模型學會通用指令遵循啟發(fā),中文信息處理實驗室的研究人員探索了通過在通用工具使用數(shù)據(jù)集上微調較小規(guī)模的語言模型,讓它們獲得通用工具使用能力。實現(xiàn)上述能力的一個核心難點在于需要構建一個多樣化的工具使用數(shù)據(jù)集。然而,由于工具使用涉及復雜的多方交互,現(xiàn)今仍然缺乏公開可用的多樣化工具使用數(shù)據(jù)集。為了解決這個挑戰(zhàn),研究人員提出通過多智能體模擬交互的方式生成工具使用數(shù)據(jù)集。這種方法充分利用大模型強大的文本生成能力,在幾乎不需要任何人工干預的情況下構建一個多樣化且真實的數(shù)據(jù)集。我們從構建多樣化工具集開始,之后利用多智能體模擬生成工具使用數(shù)據(jù)集,最后基于此訓練出擁有通用工具使用能力的 ToolAlpaca 模型。

45fa0b64-0a9c-11ee-962d-dac502259ad0.png

工具集構建:我們首先從開源倉庫 public-apis 中獲取工具的名稱和簡短描述作為初始信息,之后利用大語言模型通過 prompt 的方式將其擴展成自然語言形式的文檔,描述工具提供的每一個函數(shù)及其對應的輸入。為了讓信息更為精細和結構化,我們進一步將這些自然語言文檔擴展為遵循 OpenAPI 規(guī)范的文檔,詳盡描繪了每個函數(shù)的細節(jié)。結構化文檔的使用不僅使我們的工具集更為細致和完備,同時也方便了我們的工具集與其他工具(如 ChatGPT 現(xiàn)有的 Plugin 等)進行兼容。下圖為一個名為 Public Holidays 工具的示例。

462a8c44-0a9c-11ee-962d-dac502259ad0.png

工具使用實例生成:盡管我們已經(jīng)構建了大規(guī)模且多樣化的工具集,但構建工具使用數(shù)據(jù)集仍然是一項富有挑戰(zhàn)性的任務。首先,由于工具集是由大模型生成的,要根據(jù)工具集文檔構造如此大量的真實工具,需要大量的編程和數(shù)據(jù)收集工作,幾乎不可能實現(xiàn);其次,工具集本身包含了從通用到專用的各種領域的工具,使得構造與工具相關的初始指令是困難的。為此,我們提出了一種多智能體模擬交互的策略來生成工具使用數(shù)據(jù)。我們利用大模型分別模擬用戶、AI 助手、工具執(zhí)行器這三個智能體,通過他們之間的交互來生成豐富且實用的工具使用數(shù)據(jù)。

46566a12-0a9c-11ee-962d-dac502259ad0.png

如上圖所示,用戶發(fā)起最初的指令,并通過簡單的交互提供更多必要的信息。工具執(zhí)行器則利用結構化文檔作為提示,借助大模型來模擬工具的執(zhí)行過程,從而產(chǎn)生相應的反饋。而AI助手則充當兩者之間的橋梁,它幫助用戶調用各種工具以解決問題,并最終對整個交互過程進行總結,返回給用戶最終的響應結果。通過這三個智能體的交互,我們成功構建了一套能貼近真實場景需求的工具使用數(shù)據(jù)集。

ToolAlpaca 模型訓練與測試:我們使用生成的數(shù)據(jù)集對 Vicuna 模型進行微調,以此得到最終的 ToolAlpaca 模型。在測試階段,ToolAlpaca 將擔任 AI 助手的角色,同時用戶和工具執(zhí)行器的角色仍由大模型扮演。

實驗

最終,我們利用 ChatGPT 和 GPT-3.5 構造了一個包含超過400個工具、3900多條工具使用實例的模擬數(shù)據(jù)集,數(shù)據(jù)集基本統(tǒng)計信息如下圖所示。

46864e8a-0a9c-11ee-962d-dac502259ad0.png

之后,我們在Vicuna 模型上進行微調,得到 ToolAlpaca 模型。為了評估模型的泛化性能,我們在10種未包含在訓練集中的工具上構造了含有100條數(shù)據(jù)的測試集,并通過人工評價對模型的工具調用過程和整體性能進行了評估。評測結果如下圖所示。

46d1e610-0a9c-11ee-962d-dac502259ad0.png

實驗結果表明,無論是7B還是13B的模型,經(jīng)過在 ToolAlpaca 數(shù)據(jù)集上的訓練后,其性能都有了顯著的提升。值得注意的是,ToolAlpaca 在測試集上的整體性能已經(jīng)接近于 GPT-3.5 的表現(xiàn)。這些實驗結果驗證了我們構建數(shù)據(jù)集的有效性,同時也回答了我們最開始提出的問題:通過在多樣化的工具使用數(shù)據(jù)集上微調,可以讓小模型獲得通用的工具使用能力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 框架
    +關注

    關注

    0

    文章

    403

    瀏覽量

    17541
  • 語言模型
    +關注

    關注

    0

    文章

    538

    瀏覽量

    10340
  • 數(shù)據(jù)集

    關注

    4

    文章

    1209

    瀏覽量

    24829

原文標題:3000多個實例教會小模型通用工具使用能力!中文信息處理實驗室提出工具學習新框架 ToolAlpaca

文章出處:【微信號:gh_e5b9d8c5c1d4,微信公眾號:中科院軟件所中文信息處理實驗室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    [原創(chuàng)]認證與實驗室

    認證、實驗室特寫、電磁兼容、走進實驗室、Q博士案例欄目。認證實驗室專題范圍:認證程序、工廠審查、標準理解、測試設備管理、標準的差異化等。欄目將對一次或多次不能通過認證的企業(yè)或產(chǎn)品,提出
    發(fā)表于 10-29 16:57

    NI信號處理實驗室

    在NI官網(wǎng)下載了“信號處理實驗室”,求源碼而不可得,不知道哪位有源碼?或者相關的源碼
    發(fā)表于 07-31 09:20

    實驗室整體解決方案是什么?

    三部分。中創(chuàng)盟是中國首家提出實驗室整體解決方案這一概念的公司。如需了解更多實驗室相關信息請聯(lián)系蘇州中創(chuàng)盟實驗室技術有限公司居女士 0512-
    發(fā)表于 08-11 10:34

    智慧實驗室解決方案(LoRa)

    實驗室是科技的搖籃,安全、健康、環(huán)保、節(jié)能是實驗室的基本要素;實驗室建設經(jīng)歷場地-設備-系統(tǒng)三個階段。在當今成系統(tǒng)的實驗建設理念中,實驗室
    發(fā)表于 02-25 14:09

    KGB知識圖譜引擎助力NLPIR中文信息處理

      隨著信息時代的到了,計算機在人們生產(chǎn)生活的各個方面將起到越來遠大的作用。而對于以漢語為母語的我國來說。中文信息處理技術已經(jīng)在我國信息化建設中占據(jù)了一個非常重要的地位。  漢語在世界上屬于漢藏語系
    發(fā)表于 11-09 11:39

    NLPIR大數(shù)據(jù)知識圖譜完美展現(xiàn)文本數(shù)據(jù)內容

      隨著科學技術的發(fā)展,中文信息處理已經(jīng)深入到了社會生活的各方面。廣泛的應用對中文信息處理技術也提出了較高的要求。中文信息處理中文(包括漢
    發(fā)表于 07-01 11:40

    智慧實驗室教學管理系統(tǒng)平臺開發(fā)設計案例

    `實驗室管理系統(tǒng)開發(fā)LIMS和量化管理是現(xiàn)代實驗室管理的標志,LIMS能實現(xiàn)實驗室的量化管理,能提高實驗室信息化水平,而量化管理能提高
    發(fā)表于 12-09 16:20

    系統(tǒng)控制與信息處理實驗室 精選資料分享

    廣西●河池學院廣西高校重點實驗室培訓基地系統(tǒng)控制與信息處理重點實驗室本篇博客來自河池學院: 智控無人機小組寫作時間: 2020年8月15日培訓總結培訓訓已經(jīng)結束了,這一段的學習時間也告
    發(fā)表于 07-19 08:09

    lims實驗室管理系統(tǒng)是什么?實驗室信息管理系統(tǒng)介紹!

    采用實驗室信息管理系統(tǒng)或LIMS可能是提高實驗室生產(chǎn)力的最有效方法之一。此頁面的目的是幫助目前未使用LIMS的科學家和實驗室人員分析采用LIMS的潛在好處。對于已經(jīng)使用LIMS的組織,
    發(fā)表于 11-03 11:17

    實驗室lims系統(tǒng)解決方案

    ,需要不同的設備集成、工作流程工具等,因此該類別中的許多產(chǎn)品都是專門的。為什么要使用實驗室lims系統(tǒng)?從電子表格到記錄簿,傳統(tǒng)的數(shù)據(jù)記錄方法通常不足以滿足現(xiàn)代實驗室的需求。如果沒有合適的工具
    發(fā)表于 11-04 11:18

    實驗室設計指南

    實驗室設計指南LBSALE[1000]LBSALE第一章 基礎知識主要內容:實驗室基礎知識及日常管理實驗室基本操作技術分析數(shù)據(jù)的處理石油產(chǎn)品分析儀器配置要求第一節(jié)
    發(fā)表于 11-09 15:43 ?1663次閱讀

    網(wǎng)絡虛擬實驗室及實現(xiàn)方法

    文章描述了網(wǎng)絡 虛擬實驗室 的定義、框架結構、特點以及面臨的關鍵技術,并且就當前實現(xiàn)網(wǎng)絡虛擬實驗室的幾種主流技術進行了比較和概括.
    發(fā)表于 07-04 11:11 ?16次下載
    網(wǎng)絡虛擬<b class='flag-5'>實驗室</b>及實現(xiàn)方法

    易云維?實驗室智能管理系統(tǒng)構建更適合現(xiàn)代醫(yī)療實驗室信息化管理體系

    隨著信息技術的快速發(fā)展,實驗室是教育和科研的重要場所。實驗室設備儀器豐富,實驗項目多,管理內容多,管理難度大。部分醫(yī)院在管理實驗室還是人工管
    的頭像 發(fā)表于 06-27 11:44 ?665次閱讀
    易云維?<b class='flag-5'>實驗室</b>智能管理系統(tǒng)構建更適合現(xiàn)代醫(yī)療<b class='flag-5'>實驗室</b>的<b class='flag-5'>信息</b>化管理體系

    什么是智慧實驗室綜合管理平臺?

    管理平臺 目前,我國實驗室存在紙質記錄多、信息孤島、不可追溯、安全隱患多、運行能耗高、管理難等問題;同時,國內LIMS實驗室信息系統(tǒng)專業(yè)化程度低,功能結構單一,不能滿足現(xiàn)階段
    的頭像 發(fā)表于 08-22 14:20 ?1442次閱讀
    什么是智慧<b class='flag-5'>實驗室</b>綜合管理平臺?

    實驗室信息管理系統(tǒng) LIMS 優(yōu)勢

    在當今快節(jié)奏和數(shù)據(jù)驅動的科學研究環(huán)境中,實驗室信息管理系統(tǒng)(LIMS)已成為提高實驗室效率和準確性的關鍵工具。LIMS通過集成各種實驗室操作
    的頭像 發(fā)表于 10-28 16:54 ?372次閱讀
    蒙特卡罗国际网址| 最新皇冠网止| 百家乐官网压分规律| 百家乐官网讲坛汉献| 百家乐单机版游戏下载| 网上百家乐群的微博| 台州星空棋牌下载| 免费百家乐官网在线| 百家乐娱乐城玩法| 大发888的示例| 百家乐官网娱乐城游戏| 葡京百家乐注码| 大发888有银钱的吗| 百家乐官网信誉平台开户| 澳门百家乐皇冠网| 大发888资讯网| 克拉克百家乐官网试玩| 百家乐如何稳赢| 大发888娱乐游戏可以玩吗| 赌博百家乐官网趋势把握| 澳门百家乐怎洋赢钱| 易博全讯网| 马牌百家乐官网的玩法技巧和规则 | 水果机遥控器多少钱| 百家乐官网概率计算过程| 网上赌百家乐可信吗| 娱乐城送彩金| 最好百家乐官网的玩法技巧和规则 | 百家乐官网筹码| 大发888体育| 网络百家乐官网网站| 御匾会百家乐娱乐城| 澳门百家乐官网奥秘| 大哥大百家乐的玩法技巧和规则| 百家乐官网平台开发| 百家乐不倒翁缺点| bet365最新网址| 伟博百家乐官网娱乐城| 波音娱乐城送彩金| 大众百家乐官网的玩法技巧和规则| 永利高平台|