关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5224人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蔚来又一车型爆单!

电动知家 浏览 3542

旅行焕新价8.39万起 BJ30旅行家正式上市 新增7座布局

网易汽车 浏览 5114

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 3444

纯电续航345km 小鹏X9增程版将于四季度上市

车质网 浏览 4473

新能源购置税“末班车”,上还是不上?

浙江车网 浏览 4283

支付宝下架首页AQ广告,回应“内斗”传闻,网友:感觉就是一场营销

红星资本局 浏览 4541

牛津VGG团队突破:单一网络实现视频动态3D重建

科技行者 浏览 3494

梅西:作为朋友我当然希望内马尔踢世界杯,但我无法客观评价

懂球帝 浏览 1219

可折叠iPhone来了却可能买不到?分析师预警发布初期将严重缺货

环球网资讯 浏览 3874

最强“卖铲人” 寒武纪靠AI芯片疯狂掘金

21世纪经济报道 浏览 5146

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 2990

女子花费2000多元认养老虎 结果虎园隐瞒老虎死讯数月

大风新闻 浏览 32229

深圳00后600多万在港抄底买房 内地客十年砸下8000亿

南方都市报 浏览 16883

胜率大降!若特朗普“对等关税”被推翻,市场会如何反应?

华尔街见闻官方 浏览 4147

独家|接盘露笑弃子藏暗雷?美克家居豪赌AI算力,标的实控人控股企业被曝欠税4205万元

时代周报 浏览 3568

上海男子出门频频裸露臀部太辣眼睛 女邻居崩溃了

看看新闻Knews 浏览 35830

主打运动与智能 零跑Lafa5内饰首发亮相

网易汽车 浏览 4627

冬天,“大衣”是中年女人的穿搭刚需,这样搭配时髦提气质

静儿时尚达人 浏览 3694

普京:俄罗斯将在战场解放故土 欧洲"猪猡"将下台

参考消息 浏览 3855

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势 浏览 3401

曝保时捷正在重新设计718 EV跑车,“反向”适配燃油动力

IT之家 浏览 3953
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1