关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4530人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2026北京两会|对话市政协委员刘亮:机器人技术迭代提速,北京打通产学研转化链路

北京商报 浏览 3318

赖清德求特朗普让中国大陆放弃对台用武 朱立伦怒批

海峡导报社 浏览 20163

一汽夏利、华晨自主、众泰等8家老牌车企被工信部移出车企名录

IT之家 浏览 115

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 4472

江汽集团董事长项兴初拜访华为任正非,进一步拓宽合作领域

财闻 浏览 3847

豪华大六座SUV/最新鸿蒙座舱 岚图泰山将于11月18日上市

网易汽车 浏览 4272

端侧AI赋能千行百业 2025 Ceva技术研讨会助力产业升级

爱集微 浏览 4234

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 4269

掌舵第二年扭亏!天齐锂业蒋安琪:重心放国内,优质锂资源开发刻不容缓

时代周报 浏览 2024

京东再出重拳!联手长安设计开发新能源无人智能化车型以及城市智慧物流

封面新闻 浏览 4622

《新闻女王2》首播爆开!开局高能剧情紧凑,黄宗泽演技拖后腿

萌神木木 浏览 4287

清华大学等多所顶尖院校联手揭秘智能数据准备革命

科技行者 浏览 3374

广发证券:本轮港股春季躁动会缺席吗?

智通财经 浏览 3951

电车失控在市区以超100km/h时速连撞15车 阿维塔回应

极目新闻 浏览 9458

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻 浏览 3315

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 9912

博尔达拉斯:巧妇难为无米之炊,我不该承受这赛季所遭受的一切

懂球帝 浏览 3529

横琴人寿去年净亏3.27亿,保险业务收入同比下滑23%

密探财经 浏览 3329

外媒:中法元首会谈议题十分广泛 似乎找到更多共识

环球网资讯 浏览 37220

向太曝古天乐曾坐过牢:初次见面头都不敢抬

科学发掘 浏览 723

町田外援埃里克:期待2026年世界杯能成为属于内马尔的舞台

懂球帝 浏览 700
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1