关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3495人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子残忍杀害未婚妻被判死缓 监狱管理局否认其将出狱

红星新闻 浏览 8860

三季报丰收伴管理层大换血,洛阳钼业高光背后为何求变

华夏时报 浏览 4354

贝克汉姆夫妇受打击:布鲁克林拿自家事当段子

万国明信片 浏览 104

柬泰签署停火联合声明 中方回应

北京日报 浏览 3765

吴速玲曝儿子Joe是恋爱脑

韩小娱 浏览 3575

闫学晶风波终于落幕,6个男人惨遭牵连

青橘罐头 浏览 3341

芯迈半导体二度递表,专利超300项!获国家级资本加持|港E声

时代周报 浏览 3691

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 2857

配备3C快充 埃安AION i60预售11.98万起

网易汽车 浏览 4308

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 3469

媒体:菲载300多人客船倾覆 中国没法救的原因很简单

新民周刊 浏览 7877

假期重磅!委内瑞拉局势影响多大?AI、商业航天、智能驾驶都有大利好

看财经show 浏览 3667

中国最会化妆的男富豪,一把套现15亿!什么信号?

深蓝财经 浏览 2795

小米雷军回应被贴“营销大师”标签:营销不是坏事,但产品是基础

IT之家 浏览 3508

大量iPhone 17系列新机无法激活 苹果客服回应

界面新闻 浏览 9455

斯图里奇:阿森纳踢得非常老练,他们传球精准&决策出色

懂球帝 浏览 3879

特朗普"朋友"1.3亿美元捐款到账 还不够美军发1天工资

红星新闻 浏览 8988

窦骁何超莲不忍了合体发文,公开回应婚变

一娱三分地 浏览 4319

退出春晚、被综艺开除,贾玲的下场竟然如此?

阅识 浏览 4291

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 3768

已婚已育三年,朴信惠真的老了好多

娱人细品 浏览 3402
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1