亚洲av成人精品日韩一区,97久久久精品综合88久久,玩弄japan白嫩少妇hd,亚洲av片不卡无码久久,玩弄人妻少妇500系列

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中文信息處理實(shí)驗(yàn)室提出工具學(xué)習(xí)新框架ToolAlpaca

中科院軟件所中文信息處理實(shí)驗(yàn)室 ? 來(lái)源:中科院軟件所中文信息處 ? 2023-06-15 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如何讓小規(guī)模語(yǔ)言模型像 GPT-4 一樣使用任意工具是一個(gè)非常有價(jià)值的研究課題。中國(guó)科學(xué)院軟件研究所中文信息處理實(shí)驗(yàn)室提出了一種語(yǔ)言模型的工具學(xué)習(xí)新框架,該框架利用基于大模型的多智能體模擬交互策略,可以自動(dòng)生成多樣化的工具使用數(shù)據(jù)集,并使用生成的數(shù)據(jù)集對(duì)小模型進(jìn)行微調(diào)。論文的實(shí)驗(yàn)驗(yàn)證了僅需要使用三千多個(gè)多樣化的工具調(diào)用實(shí)例,就能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

具體來(lái)說(shuō),本文的核心工作包括:

1. 提出一種基于大模型的多智能體模擬交互策略,用于生成工具使用數(shù)據(jù)集。這種方法能在最小化人工干預(yù)的前提下,生成大量且多樣化的工具使用數(shù)據(jù)集;

2. 開(kāi)源了一個(gè)涵蓋超過(guò)400個(gè)工具,三千多條實(shí)例的模擬工具使用數(shù)據(jù)集,為探索通用工具使用能力奠定了基礎(chǔ);

3. 通過(guò)實(shí)驗(yàn),驗(yàn)證了在多樣化工具使用數(shù)據(jù)集上進(jìn)行微調(diào),能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

論文:ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

數(shù)據(jù):https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人類(lèi)進(jìn)化史上占據(jù)了重要的地位,對(duì)于語(yǔ)言模型來(lái)說(shuō),這一點(diǎn)同樣適用。當(dāng)語(yǔ)言模型能夠熟練運(yùn)用各種工具,它們就能突破自身的局限,獲取最新的信息,幫助用戶利用各種服務(wù),并提升回答的精確性。 如今,OpenAI 的 GPT-4 已經(jīng)可以通過(guò)插件的形式接入和使用各種第三方工具,同時(shí)這類(lèi)超大型的語(yǔ)言模型支持通過(guò)僅給定配置文件的情況下,以即插即用的方式使用之前模型訓(xùn)練過(guò)程中未見(jiàn)過(guò)的工具,這一泛化性的工具使用能力大大豐富了模型調(diào)動(dòng)資源解決復(fù)雜問(wèn)題的手段。然而,對(duì)于較小的語(yǔ)言模型,例如 Moss、ToolLLaMA 等,它們使用工具的能力仍然來(lái)源于在特定工具的數(shù)據(jù)集上進(jìn)行監(jiān)督學(xué)習(xí)。這使得這些模型的工具使用能力受限于在訓(xùn)練過(guò)程中接觸過(guò)的工具,尚未真正獲得通用的工具使用能力。上述的對(duì)比引出了研究人員所關(guān)注的一個(gè)核心研究問(wèn)題,即是否有可能讓較小規(guī)模的語(yǔ)言模型也具備有泛化地使用各種不同的、未見(jiàn)過(guò)的工具的能力,進(jìn)而讓它們能夠更好地與更廣泛的工具進(jìn)行交互,從而提升模型利用現(xiàn)實(shí)世界的資源解決問(wèn)題的手段。

ToolAlpaca:通用工具使用能力學(xué)習(xí)新框架

受 Alpaca 通過(guò)微調(diào)讓小模型學(xué)會(huì)通用指令遵循啟發(fā),中文信息處理實(shí)驗(yàn)室的研究人員探索了通過(guò)在通用工具使用數(shù)據(jù)集上微調(diào)較小規(guī)模的語(yǔ)言模型,讓它們獲得通用工具使用能力。實(shí)現(xiàn)上述能力的一個(gè)核心難點(diǎn)在于需要構(gòu)建一個(gè)多樣化的工具使用數(shù)據(jù)集。然而,由于工具使用涉及復(fù)雜的多方交互,現(xiàn)今仍然缺乏公開(kāi)可用的多樣化工具使用數(shù)據(jù)集。為了解決這個(gè)挑戰(zhàn),研究人員提出通過(guò)多智能體模擬交互的方式生成工具使用數(shù)據(jù)集。這種方法充分利用大模型強(qiáng)大的文本生成能力,在幾乎不需要任何人工干預(yù)的情況下構(gòu)建一個(gè)多樣化且真實(shí)的數(shù)據(jù)集。我們從構(gòu)建多樣化工具集開(kāi)始,之后利用多智能體模擬生成工具使用數(shù)據(jù)集,最后基于此訓(xùn)練出擁有通用工具使用能力的 ToolAlpaca 模型。

45fa0b64-0a9c-11ee-962d-dac502259ad0.png

工具集構(gòu)建:我們首先從開(kāi)源倉(cāng)庫(kù) public-apis 中獲取工具的名稱(chēng)和簡(jiǎn)短描述作為初始信息,之后利用大語(yǔ)言模型通過(guò) prompt 的方式將其擴(kuò)展成自然語(yǔ)言形式的文檔,描述工具提供的每一個(gè)函數(shù)及其對(duì)應(yīng)的輸入。為了讓信息更為精細(xì)和結(jié)構(gòu)化,我們進(jìn)一步將這些自然語(yǔ)言文檔擴(kuò)展為遵循 OpenAPI 規(guī)范的文檔,詳盡描繪了每個(gè)函數(shù)的細(xì)節(jié)。結(jié)構(gòu)化文檔的使用不僅使我們的工具集更為細(xì)致和完備,同時(shí)也方便了我們的工具集與其他工具(如 ChatGPT 現(xiàn)有的 Plugin 等)進(jìn)行兼容。下圖為一個(gè)名為 Public Holidays 工具的示例。

462a8c44-0a9c-11ee-962d-dac502259ad0.png

工具使用實(shí)例生成:盡管我們已經(jīng)構(gòu)建了大規(guī)模且多樣化的工具集,但構(gòu)建工具使用數(shù)據(jù)集仍然是一項(xiàng)富有挑戰(zhàn)性的任務(wù)。首先,由于工具集是由大模型生成的,要根據(jù)工具集文檔構(gòu)造如此大量的真實(shí)工具,需要大量的編程和數(shù)據(jù)收集工作,幾乎不可能實(shí)現(xiàn);其次,工具集本身包含了從通用到專(zhuān)用的各種領(lǐng)域的工具,使得構(gòu)造與工具相關(guān)的初始指令是困難的。為此,我們提出了一種多智能體模擬交互的策略來(lái)生成工具使用數(shù)據(jù)。我們利用大模型分別模擬用戶、AI 助手、工具執(zhí)行器這三個(gè)智能體,通過(guò)他們之間的交互來(lái)生成豐富且實(shí)用的工具使用數(shù)據(jù)。

46566a12-0a9c-11ee-962d-dac502259ad0.png

如上圖所示,用戶發(fā)起最初的指令,并通過(guò)簡(jiǎn)單的交互提供更多必要的信息。工具執(zhí)行器則利用結(jié)構(gòu)化文檔作為提示,借助大模型來(lái)模擬工具的執(zhí)行過(guò)程,從而產(chǎn)生相應(yīng)的反饋。而AI助手則充當(dāng)兩者之間的橋梁,它幫助用戶調(diào)用各種工具以解決問(wèn)題,并最終對(duì)整個(gè)交互過(guò)程進(jìn)行總結(jié),返回給用戶最終的響應(yīng)結(jié)果。通過(guò)這三個(gè)智能體的交互,我們成功構(gòu)建了一套能貼近真實(shí)場(chǎng)景需求的工具使用數(shù)據(jù)集。

ToolAlpaca 模型訓(xùn)練與測(cè)試:我們使用生成的數(shù)據(jù)集對(duì) Vicuna 模型進(jìn)行微調(diào),以此得到最終的 ToolAlpaca 模型。在測(cè)試階段,ToolAlpaca 將擔(dān)任 AI 助手的角色,同時(shí)用戶和工具執(zhí)行器的角色仍由大模型扮演。

實(shí)驗(yàn)

最終,我們利用 ChatGPT 和 GPT-3.5 構(gòu)造了一個(gè)包含超過(guò)400個(gè)工具、3900多條工具使用實(shí)例的模擬數(shù)據(jù)集,數(shù)據(jù)集基本統(tǒng)計(jì)信息如下圖所示。

46864e8a-0a9c-11ee-962d-dac502259ad0.png

之后,我們?cè)赩icuna 模型上進(jìn)行微調(diào),得到 ToolAlpaca 模型。為了評(píng)估模型的泛化性能,我們?cè)?0種未包含在訓(xùn)練集中的工具上構(gòu)造了含有100條數(shù)據(jù)的測(cè)試集,并通過(guò)人工評(píng)價(jià)對(duì)模型的工具調(diào)用過(guò)程和整體性能進(jìn)行了評(píng)估。評(píng)測(cè)結(jié)果如下圖所示。

46d1e610-0a9c-11ee-962d-dac502259ad0.png

實(shí)驗(yàn)結(jié)果表明,無(wú)論是7B還是13B的模型,經(jīng)過(guò)在 ToolAlpaca 數(shù)據(jù)集上的訓(xùn)練后,其性能都有了顯著的提升。值得注意的是,ToolAlpaca 在測(cè)試集上的整體性能已經(jīng)接近于 GPT-3.5 的表現(xiàn)。這些實(shí)驗(yàn)結(jié)果驗(yàn)證了我們構(gòu)建數(shù)據(jù)集的有效性,同時(shí)也回答了我們最開(kāi)始提出的問(wèn)題:通過(guò)在多樣化的工具使用數(shù)據(jù)集上微調(diào),可以讓小模型獲得通用的工具使用能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    404

    瀏覽量

    17892
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10787
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25445

原文標(biāo)題:3000多個(gè)實(shí)例教會(huì)小模型通用工具使用能力!中文信息處理實(shí)驗(yàn)室提出工具學(xué)習(xí)新框架 ToolAlpaca

文章出處:【微信號(hào):gh_e5b9d8c5c1d4,微信公眾號(hào):中科院軟件所中文信息處理實(shí)驗(yàn)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    [原創(chuàng)]認(rèn)證與實(shí)驗(yàn)室

    認(rèn)證、實(shí)驗(yàn)室特寫(xiě)、電磁兼容、走進(jìn)實(shí)驗(yàn)室、Q博士案例欄目。認(rèn)證實(shí)驗(yàn)室專(zhuān)題范圍:認(rèn)證程序、工廠審查、標(biāo)準(zhǔn)理解、測(cè)試設(shè)備管理、標(biāo)準(zhǔn)的差異化等。欄目將對(duì)一次或多次不能通過(guò)認(rèn)證的企業(yè)或產(chǎn)品,提出
    發(fā)表于 10-29 16:57

    NI信號(hào)處理實(shí)驗(yàn)室

    在NI官網(wǎng)下載了“信號(hào)處理實(shí)驗(yàn)室”,求源碼而不可得,不知道哪位有源碼?或者相關(guān)的源碼
    發(fā)表于 07-31 09:20

    實(shí)驗(yàn)室整體解決方案是什么?

    三部分。中創(chuàng)盟是中國(guó)首家提出實(shí)驗(yàn)室整體解決方案這一概念的公司。如需了解更多實(shí)驗(yàn)室相關(guān)信息請(qǐng)聯(lián)系蘇州中創(chuàng)盟實(shí)驗(yàn)室技術(shù)有限公司居女士 0512-
    發(fā)表于 08-11 10:34

    智慧實(shí)驗(yàn)室解決方案(LoRa)

    實(shí)驗(yàn)室是科技的搖籃,安全、健康、環(huán)保、節(jié)能是實(shí)驗(yàn)室的基本要素;實(shí)驗(yàn)室建設(shè)經(jīng)歷場(chǎng)地-設(shè)備-系統(tǒng)三個(gè)階段。在當(dāng)今成系統(tǒng)的實(shí)驗(yàn)建設(shè)理念中,實(shí)驗(yàn)室
    發(fā)表于 02-25 14:09

    KGB知識(shí)圖譜引擎助力NLPIR中文信息處理

      隨著信息時(shí)代的到了,計(jì)算機(jī)在人們生產(chǎn)生活的各個(gè)方面將起到越來(lái)遠(yuǎn)大的作用。而對(duì)于以漢語(yǔ)為母語(yǔ)的我國(guó)來(lái)說(shuō)。中文信息處理技術(shù)已經(jīng)在我國(guó)信息化建設(shè)中占據(jù)了一個(gè)非常重要的地位?! h語(yǔ)在世界上屬于漢藏語(yǔ)系
    發(fā)表于 11-09 11:39

    NLPIR大數(shù)據(jù)知識(shí)圖譜完美展現(xiàn)文本數(shù)據(jù)內(nèi)容

      隨著科學(xué)技術(shù)的發(fā)展,中文信息處理已經(jīng)深入到了社會(huì)生活的各方面。廣泛的應(yīng)用對(duì)中文信息處理技術(shù)也提出了較高的要求。中文信息處理中文(包括漢
    發(fā)表于 07-01 11:40

    智慧實(shí)驗(yàn)室教學(xué)管理系統(tǒng)平臺(tái)開(kāi)發(fā)設(shè)計(jì)案例

    `實(shí)驗(yàn)室管理系統(tǒng)開(kāi)發(fā)LIMS和量化管理是現(xiàn)代實(shí)驗(yàn)室管理的標(biāo)志,LIMS能實(shí)現(xiàn)實(shí)驗(yàn)室的量化管理,能提高實(shí)驗(yàn)室信息化水平,而量化管理能提高
    發(fā)表于 12-09 16:20

    系統(tǒng)控制與信息處理實(shí)驗(yàn)室 精選資料分享

    廣西●河池學(xué)院廣西高校重點(diǎn)實(shí)驗(yàn)室培訓(xùn)基地系統(tǒng)控制與信息處理重點(diǎn)實(shí)驗(yàn)室本篇博客來(lái)自河池學(xué)院: 智控?zé)o人機(jī)小組寫(xiě)作時(shí)間: 2020年8月15日培訓(xùn)總結(jié)培訓(xùn)訓(xùn)已經(jīng)結(jié)束了,這一段的學(xué)習(xí)時(shí)間也告
    發(fā)表于 07-19 08:09

    lims實(shí)驗(yàn)室管理系統(tǒng)是什么?實(shí)驗(yàn)室信息管理系統(tǒng)介紹!

    采用實(shí)驗(yàn)室信息管理系統(tǒng)或LIMS可能是提高實(shí)驗(yàn)室生產(chǎn)力的最有效方法之一。此頁(yè)面的目的是幫助目前未使用LIMS的科學(xué)家和實(shí)驗(yàn)室人員分析采用LIMS的潛在好處。對(duì)于已經(jīng)使用LIMS的組織,
    發(fā)表于 11-03 11:17

    實(shí)驗(yàn)室lims系統(tǒng)解決方案

    ,需要不同的設(shè)備集成、工作流程工具等,因此該類(lèi)別中的許多產(chǎn)品都是專(zhuān)門(mén)的。為什么要使用實(shí)驗(yàn)室lims系統(tǒng)?從電子表格到記錄簿,傳統(tǒng)的數(shù)據(jù)記錄方法通常不足以滿足現(xiàn)代實(shí)驗(yàn)室的需求。如果沒(méi)有合適的工具
    發(fā)表于 11-04 11:18

    實(shí)驗(yàn)室設(shè)計(jì)指南

    實(shí)驗(yàn)室設(shè)計(jì)指南LBSALE[1000]LBSALE第一章 基礎(chǔ)知識(shí)主要內(nèi)容:實(shí)驗(yàn)室基礎(chǔ)知識(shí)及日常管理實(shí)驗(yàn)室基本操作技術(shù)分析數(shù)據(jù)的處理石油產(chǎn)品分析儀器配置要求第一節(jié)
    發(fā)表于 11-09 15:43 ?1720次閱讀

    網(wǎng)絡(luò)虛擬實(shí)驗(yàn)室及實(shí)現(xiàn)方法

    文章描述了網(wǎng)絡(luò) 虛擬實(shí)驗(yàn)室 的定義、框架結(jié)構(gòu)、特點(diǎn)以及面臨的關(guān)鍵技術(shù),并且就當(dāng)前實(shí)現(xiàn)網(wǎng)絡(luò)虛擬實(shí)驗(yàn)室的幾種主流技術(shù)進(jìn)行了比較和概括.
    發(fā)表于 07-04 11:11 ?16次下載
    網(wǎng)絡(luò)虛擬<b class='flag-5'>實(shí)驗(yàn)室</b>及實(shí)現(xiàn)方法

    易云維?實(shí)驗(yàn)室智能管理系統(tǒng)構(gòu)建更適合現(xiàn)代醫(yī)療實(shí)驗(yàn)室信息化管理體系

    隨著信息技術(shù)的快速發(fā)展,實(shí)驗(yàn)室是教育和科研的重要場(chǎng)所。實(shí)驗(yàn)室設(shè)備儀器豐富,實(shí)驗(yàn)項(xiàng)目多,管理內(nèi)容多,管理難度大。部分醫(yī)院在管理實(shí)驗(yàn)室還是人工管
    的頭像 發(fā)表于 06-27 11:44 ?895次閱讀
    易云維?<b class='flag-5'>實(shí)驗(yàn)室</b>智能管理系統(tǒng)構(gòu)建更適合現(xiàn)代醫(yī)療<b class='flag-5'>實(shí)驗(yàn)室</b>的<b class='flag-5'>信息</b>化管理體系

    什么是智慧實(shí)驗(yàn)室綜合管理平臺(tái)?

    管理平臺(tái) 目前,我國(guó)實(shí)驗(yàn)室存在紙質(zhì)記錄多、信息孤島、不可追溯、安全隱患多、運(yùn)行能耗高、管理難等問(wèn)題;同時(shí),國(guó)內(nèi)LIMS實(shí)驗(yàn)室信息系統(tǒng)專(zhuān)業(yè)化程度低,功能結(jié)構(gòu)單一,不能滿足現(xiàn)階段
    的頭像 發(fā)表于 08-22 14:20 ?1710次閱讀
    什么是智慧<b class='flag-5'>實(shí)驗(yàn)室</b>綜合管理平臺(tái)?

    實(shí)驗(yàn)室信息管理系統(tǒng) LIMS 優(yōu)勢(shì)

    在當(dāng)今快節(jié)奏和數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究環(huán)境中,實(shí)驗(yàn)室信息管理系統(tǒng)(LIMS)已成為提高實(shí)驗(yàn)室效率和準(zhǔn)確性的關(guān)鍵工具。LIMS通過(guò)集成各種實(shí)驗(yàn)室操作
    的頭像 發(fā)表于 10-28 16:54 ?918次閱讀