关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5218人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

影视大佬吴敦离世,贾静雯林志颖发文悼念

素素娱乐 浏览 3336

广东3配角齐爆太惊喜!杜润旺陈家政三分即插即用,焦泊乔终暴走

篮球资讯达人 浏览 3570

法国展示“凯撒”自行榴弹炮 承诺继续向乌交付

环球网资讯 浏览 4526

60岁的刘嘉玲、章小蕙太美了!港女的魅力从不是少女感

LinkFashion 浏览 3374

布翁焦尔诺谈主场欧冠首秀:听见欧冠主题曲时我感到无比激动

懂球帝 浏览 4313

湖人126-114勇士,库詹东缺阵,里夫斯21分伤退,波杰23+5+8

懂球帝 浏览 4585

这个冬天《鬼怪》“解冻”得有些早

时尚COSMO 浏览 4193

突发!特斯拉美国要求禁用中国产零部件;离谱!曝多益网络创始人有300个孩子,公司回应;苹果CEO库克被曝或于明年卸任丨雷峰早报

雷峰网 浏览 4276

不管人情世故那一套!东风日产法务贴脸开大,直接点了友商的名

小李车评李建红 浏览 4004

小号普拉多 丰田兰德酷路泽FJ全球首发亮相

车质网 浏览 3765

出行场景升级/还支持餐厅排队 方程豹钛7推送第二次OTA

网易汽车 浏览 3583

韩国市场:中国产电动车占比飙升至 34%!

郑谊 浏览 3001

最强充电宝国标将至,英集芯推出蓝牙智能方案引领行业升级

时代周报 浏览 3974

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 3543

父子在亲戚公司上班遇爆炸全身烧伤花费百万 亲戚回应

潇湘晨报 浏览 4580

奔驰兜里还有多少牌?

禾颜阅车 浏览 766

售价40.28万元 2026款丰田GR YARIS上市

网易汽车 浏览 1990

卡位AI算力基建狂潮,鸿辉光通加快实现向光器件隐形龙头的蜕变

第一财经资讯 浏览 5158

金球奖红毯:小李子越老越有味

娱乐圈笔娱君 浏览 3578

乌军方称对俄铁路发起特别作战行动

国际在线 浏览 5196

股权质押是否会影响控股权?零食龙头万辰集团遭证监会双重问询

国际金融报 浏览 102
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1