关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4526人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗伊斯兰革命卫队:战争的结束由伊朗决定

界面新闻 浏览 2616

【英超】枪手迎蓝月,大中锋对决,瓜塔师徒再较高下

体坛周报 浏览 4436

货车司机在高速服务区猝死 妻子:跑车4个月只回家2次

红星新闻 浏览 10434

“1元买壳”10个月后,北大医药新老板徐晰人突遭刑拘!

野马财经 浏览 4489

纳瓦斯:得知转会曼联失败我十分冷静,这激励了我的皇马生涯

懂球帝 浏览 2778

加盟米兰至今只替补出场1次,斯基拉:奥多古可能在冬窗离队

懂球帝 浏览 4364

委内瑞拉外长会见美外交使团团长

环球网资讯 浏览 3333

杭州一区拟推出“养龙虾”十条!支持OpenClaw&OPC-STC发展

都市快报橙柿互动 浏览 2741

广安爱众0元收购一新能源发电公司90%股权

红星资本局 浏览 5242

美陆军部长抵达阿联酋首都 与俄“秘密会谈”

环球网资讯 浏览 4123

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 3581

肖战主演电影《得闲谨制》,有点东西!

不八卦会死星人 浏览 3801

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 4469

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 4539

董璇张维依三亚带娃,这才是家庭最舒服的样子

吴霶爱体育 浏览 2974

卖了3199万元 德信集团董事长杭州豪宅被拍卖抵债

红星新闻 浏览 13166

宁德时代与易控智驾签署战略协议

证券时报 浏览 3687

欧盟调整“禁燃”,堵死自己的路

汽车公社 浏览 3883

普通人穿衣真的很简单!单品选对、搭配合理,大方舒适又得体

静儿时尚达人 浏览 2879

大厂边缘的中年人:融不进去,逃不出来

她刊 浏览 734

主打新潮科技 smart精灵#6内饰官图发布

车质网 浏览 2045
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1