关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1681人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

亚马逊美股盘前涨幅扩大至5%

证券时报 浏览 711

朝鲜试射1枚中远程固体燃料弹道导弹

央视新闻客户端 浏览 12694

1-0!中超爆冷,成都83分钟遭绝杀,国足门将黄油手,保级队首胜

环太平洋老正太 浏览 12006

8000万年薪!沙特媒体:吉达联合正争分夺秒说服萨拉赫加盟

直播吧 浏览 14312

空中客车:任命王璀担任全球高级副总裁及空客中国民用飞机商务负责人

经济观察网 浏览 1535

iQOO 15 / Neo11 手机全版本标配 2K 屏,自带 AR 增透消反保护膜

IT之家 浏览 1077

印花税“小作文”疯传!近期下调可能性大吗?历次调整效果如何?

界面新闻 浏览 14856

乌军趁乱反攻无果 原因是俄军密集布置的地雷阵

枢密院十号 浏览 15829

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 584

罗马尼亚要求俄罗斯使馆51名工作人员30日内离境

界面新闻 浏览 16288

狗仔曝黄景瑜和热巴年初还在恋爱,两人同游欧洲

不八卦会死星人 浏览 15924

56岁陈红颜值回春,参加路演不惧高清镜头,她满脸皱纹依旧美丽

温柔娱公子 浏览 1043

我国发射首颗6G试验卫星,下一代通信技术距离我们还有多远?

趣看热点 浏览 25498

也门胡塞武装称美英空袭荷台达省港口

界面新闻 浏览 12191

巴铁用中国武器击落阵风后,印度信心崩溃

浏览 5030

周杰伦瘦了!演唱会上与刘畊宏跳《本草纲目》

笑猫说说 浏览 15704

这顶古董冠冕太壕了

珠宝匠 浏览 13341

当35岁李沁遇上28岁陈哲远,CP感是门玄学

陈意小可爱 浏览 1042

知情人:美防长本周访问中东将宣布红海护航行动

央视新闻客户端 浏览 13402

疯狂的共享按摩椅:代理赔数百万,新淘金者不断涌入

Tech星球 浏览 15736

韦唯学霸长子晒清华大学硕士毕业照 和女友超甜

娱絮 浏览 15662
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1