关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5222人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

科瓦奇谈客战拜仁:在安联球场一味退守通常不能得到好结果

懂球帝 浏览 4874

美政府"停摆"破纪录 英伟达市值一夜蒸发1.4万亿元

每日经济新闻 浏览 9500

A股突发!刚刚,释放三大信号!

券商中国 浏览 4629

董子健带女儿现身公园玩 父女俩一见面就乐开花儿

翰林涛涛 浏览 4632

大型文化纪实纪录片《因为长江》定档10月27日

安徽博物院 浏览 4664

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 4416

算法工程师想在女友面前秀技术“养龙虾”,结果文件夹被全删 周鸿祎称“龙虾”更像个实习生

红星新闻 浏览 2649

安东尼奥:难以置信的比赛,球员们真是不可思议

懂球帝 浏览 3482

定位中型轿车 比亚迪海豹07 EV官图发布

车质网 浏览 2822

"太子集团"头目被指曾遭手下"黑吃黑" 后者已申请破产

红星新闻 浏览 9549

芬兰总统谈俄乌停火:美国“有利可图”

上观新闻 浏览 3955

林心如揭秘:霍建华宠女无度,对自己超抠?

科学发掘 浏览 3939

德国Mindfactory平台数据:AMD处理器周销量是英特尔10倍多

IT之家 浏览 4152

热力公司入户测温佩戴的记录仪上印着警徽 住户报警

大风新闻 浏览 32987

致敬球队传奇,多特官方商城为球迷免费印11号罗伊斯

懂球帝 浏览 3868

特斯拉前全球销售主管爆猛料

电动知家 浏览 3908

星华新材再落子 收购天宽科技补齐AI算力“下一块拼图”

财闻 浏览 3309

做企业,是一场反人性的修炼

创业家 浏览 4436

iCAR超级V23暗影极客版上市 售价16.08万元

车质网 浏览 643

缅甸军方两次爆破KK园区:用了无人机 浓烟弥漫数分钟

每日经济新闻 浏览 10009

北溪爆炸案一嫌犯身份曝光 案发时为乌军现役士兵

财联社 浏览 3866
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1