关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11402人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

干皮人请进,你的上妆卡粉和卸妆起皮有救了!

时尚COSMO 浏览 13225

诺和诺德市值超越特斯拉,明星减重药年内有望在中国获批

第一财经资讯 浏览 12197

初秋氛围感穿搭真的绝!

巧百搭 浏览 15198

加码中国“确定性”

国际金融报 浏览 999

北极恐将夏季无冰,更多的城市将被海水淹没

趣看热点 浏览 25682

环球:董军在"香会"最后一天演讲 主办方安排有深意

环球网资讯 浏览 67347

一年前“掐点”成立 多只基金无缘“翻倍基”

证券时报 浏览 1441

女人不管年纪多大 穿裙子牢记“2要2不要”

猫姐品衣有道 浏览 19709

马斯克扎克伯格“笼斗”升级“角斗”?意大利文化部辟谣

上游新闻 浏览 15349

谢霆锋小儿子现身超市,眼神犀利全力保护张柏芝

素素娱乐 浏览 19315

关晓彤穿白衬衫亮相巴黎时装周

王鱼鱼爱扒娱乐 浏览 19525

频繁被曝与吴奇隆离婚 刘诗诗:不喜欢曝光私生活

深剖娱乐圈 浏览 13035

科贝:本轮西甲对阿隆索的未来至关重要,若战绩不佳可能下课

懂球帝 浏览 102

避险情绪弥漫 比特币12月开局闪崩

北京商报 浏览 271

独行侠官推为欧文全明星拉票:过去7场场均34分&两次40+

直播吧 浏览 12375

妻子在家中失踪 深井边的菜让丈夫顿感不妙

环球网资讯 浏览 30546

理想i6不搞虚的,9月26日上市/第二天开始交付

星星car 浏览 1611

世界卫生组织研究发现水貂和猫等动物对新冠病毒高度易感

趣看热点 浏览 1080054

娃哈哈饮用水公司从宏胜系手中拿回桶装水销售权

澎湃新闻 浏览 1065

郭晶晶晒合照为霍启刚庆生 豪宅客厅曝光满地衣服

娱絮 浏览 15807

曼联晒照祝贺利马与埃里克森劳伦斯获奖:笑一个吧!

直播吧 浏览 18702
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1