关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11402人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

干皮人请进，你的上妆卡粉和卸妆起皮有救了！

时尚COSMO 浏览 13225

诺和诺德市值超越特斯拉，明星减重药年内有望在中国获批

第一财经资讯浏览 12197

初秋氛围感穿搭真的绝！

巧百搭浏览 15198

加码中国“确定性”

国际金融报浏览 999

北极恐将夏季无冰，更多的城市将被海水淹没

趣看热点浏览 25682

环球：董军在＂香会＂最后一天演讲主办方安排有深意

环球网资讯浏览 67347

一年前“掐点”成立多只基金无缘“翻倍基”

证券时报浏览 1441

女人不管年纪多大穿裙子牢记“2要2不要”

猫姐品衣有道浏览 19709

马斯克扎克伯格“笼斗”升级“角斗”？意大利文化部辟谣

上游新闻浏览 15349

谢霆锋小儿子现身超市，眼神犀利全力保护张柏芝

素素娱乐浏览 19315

关晓彤穿白衬衫亮相巴黎时装周

王鱼鱼爱扒娱乐浏览 19525

频繁被曝与吴奇隆离婚刘诗诗：不喜欢曝光私生活

深剖娱乐圈浏览 13035

科贝：本轮西甲对阿隆索的未来至关重要，若战绩不佳可能下课

懂球帝浏览 102

避险情绪弥漫比特币12月开局闪崩

北京商报浏览 271

独行侠官推为欧文全明星拉票：过去7场场均34分&两次40+

直播吧浏览 12375

妻子在家中失踪深井边的菜让丈夫顿感不妙

环球网资讯浏览 30546

理想i6不搞虚的，9月26日上市/第二天开始交付

星星car 浏览 1611

世界卫生组织研究发现水貂和猫等动物对新冠病毒高度易感

趣看热点浏览 1080054

娃哈哈饮用水公司从宏胜系手中拿回桶装水销售权

澎湃新闻浏览 1065

郭晶晶晒合照为霍启刚庆生豪宅客厅曝光满地衣服

娱絮浏览 15807

曼联晒照祝贺利马与埃里克森劳伦斯获奖：笑一个吧！

直播吧浏览 18702

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

看了这些日系...

“耳环风波”...

特朗普突然＂...

世界卫生组织...

郭碧婷自曝和...

适合夏天的穿...

太阳近18战15胜升至联盟第二 "保罗定律"再现神奇

吉利11月销量破31万辆连续9个月同环比双增长再刷历史新高

马斯克暗示 SpaceX明年IPO？

干皮人请进，你的上妆卡粉和卸妆起皮有救了！

诺和诺德市值超越特斯拉，明星减重药年内有望在中国获批

初秋氛围感穿搭真的绝！

加码中国“确定性”

北极恐将夏季无冰，更多的城市将被海水淹没

环球：董军在＂香会＂最后一天演讲主办方安排有深意

一年前“掐点”成立多只基金无缘“翻倍基”

女人不管年纪多大穿裙子牢记“2要2不要”

马斯克扎克伯格“笼斗”升级“角斗”？意大利文化部辟谣

谢霆锋小儿子现身超市，眼神犀利全力保护张柏芝

关晓彤穿白衬衫亮相巴黎时装周

频繁被曝与吴奇隆离婚刘诗诗：不喜欢曝光私生活

科贝：本轮西甲对阿隆索的未来至关重要，若战绩不佳可能下课

避险情绪弥漫比特币12月开局闪崩

独行侠官推为欧文全明星拉票：过去7场场均34分&两次40+

妻子在家中失踪深井边的菜让丈夫顿感不妙

理想i6不搞虚的，9月26日上市/第二天开始交付

世界卫生组织研究发现水貂和猫等动物对新冠病毒高度易感

娃哈哈饮用水公司从宏胜系手中拿回桶装水销售权

郭晶晶晒合照为霍启刚庆生豪宅客厅曝光满地衣服

曼联晒照祝贺利马与埃里克森劳伦斯获奖：笑一个吧！

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

看了这些日系...

“耳环风波”...

特朗普突然＂...

世界卫生组织...

郭碧婷自曝和...

适合夏天的穿...

太阳近18战15胜升至联盟第二 "保罗定律"再现神奇

吉利11月销量破31万辆 连续9个月同环比双增长 再刷历史新高

马斯克暗示 SpaceX明年IPO？

干皮人请进，你的上妆卡粉和卸妆起皮有救了！

诺和诺德市值超越特斯拉，明星减重药年内有望在中国获批

初秋氛围感穿搭真的绝！

加码中国“确定性”

北极恐将夏季无冰，更多的城市将被海水淹没

环球：董军在＂香会＂最后一天演讲 主办方安排有深意

一年前“掐点”成立 多只基金无缘“翻倍基”

女人不管年纪多大 穿裙子牢记“2要2不要”

马斯克扎克伯格“笼斗”升级“角斗”？意大利文化部辟谣

谢霆锋小儿子现身超市，眼神犀利全力保护张柏芝

关晓彤穿白衬衫亮相巴黎时装周

频繁被曝与吴奇隆离婚 刘诗诗：不喜欢曝光私生活

科贝：本轮西甲对阿隆索的未来至关重要，若战绩不佳可能下课

避险情绪弥漫 比特币12月开局闪崩

独行侠官推为欧文全明星拉票：过去7场场均34分&两次40+

妻子在家中失踪 深井边的菜让丈夫顿感不妙

理想i6不搞虚的，9月26日上市/第二天开始交付

世界卫生组织研究发现水貂和猫等动物对新冠病毒高度易感

娃哈哈饮用水公司从宏胜系手中拿回桶装水销售权

郭晶晶晒合照为霍启刚庆生 豪宅客厅曝光满地衣服

曼联晒照祝贺利马与埃里克森劳伦斯获奖：笑一个吧！

吉利11月销量破31万辆连续9个月同环比双增长再刷历史新高

环球：董军在＂香会＂最后一天演讲主办方安排有深意

一年前“掐点”成立多只基金无缘“翻倍基”

女人不管年纪多大穿裙子牢记“2要2不要”

频繁被曝与吴奇隆离婚刘诗诗：不喜欢曝光私生活

避险情绪弥漫比特币12月开局闪崩

妻子在家中失踪深井边的菜让丈夫顿感不妙

郭晶晶晒合照为霍启刚庆生豪宅客厅曝光满地衣服