关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11393人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这本日杂搭配超有国际范儿,太适合30+岁女生啦!

日系志Yumi 浏览 13606

邱淑贞女儿沈月回应,称这辈子都没买过热搜,很欣赏张凌赫与沈月

扒虾侃娱 浏览 668

美驻华大使称解决巴以冲突的责任仍在美肩上 中方回应

外交部网站 浏览 74573

奔驰不放弃内燃机,因为要造最强插混,燃油版也会更平顺?

路咖汽车 浏览 10841

服务国家战略和实体经济 迈向高质量发展新时代

中国基金报 浏览 19309

《公诉》收视率狂跌,热巴转型失败真实演技"露馅"

甜小娱儿 浏览 16654

菲大使借用别人的核弹,对中国发出核战警告

浏览 10579

霍尊前女友涉嫌敲诈勒索案新进展:已移交检察院

家庭小医师 浏览 16829

38岁的陈伟霆急了!和何穗续缘后疑是好事将近

娱乐白名单 浏览 12755

品牌旗下首款纯电SUV Jeep Wagoneer S先行版发布

网易汽车 浏览 11307

尹锡悦看守所内收超6.5亿韩元代管金 系总统年薪2.5倍

鲁中晨报 浏览 5364

首款星闪音频耳机!华为FreeBuds Pro 5悦彰耳机开售:1499元 母带级无损音质

快科技 浏览 392

43岁叶璇疑官宣结婚!穿婚纱牵手男士 文案似表白

盖饭娱乐官方号 浏览 15348

赵樱子回应与张康乐绯闻:我提过人一个名字吗?

韩小娱 浏览 723

神射手!基根-穆雷半场10中7&三分6中5轰下两队最高的19分

直播吧 浏览 12881

认真生活的18个锦囊妙计:

黎贝卡的异想世界 浏览 2087

张家界荒野求生比赛还剩15人 男子靠"续命三件套"出圈

极目新闻 浏览 6058

波音787客机存在新缺陷,或推迟交付

界面新闻 浏览 16213

可恶!蔡明的这节目早知道留着春晚看了!

时尚COSMO 浏览 11502

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 1037

关晓彤马尔代夫度假,满屏大长腿超抢镜

扒虾侃娱 浏览 950
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1