关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4427人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿莫林将执教曼联3年!卡拉格开炮:没人相信拉爵,这么说太过火

奥拜尔 浏览 4624

贴广告的ChatGPT,一夜之间让全球网友破了防

机器之心Pro 浏览 3472

多只宠物中毒死亡11人提起刑附民诉讼 投毒者获刑4年

红星新闻 浏览 8871

上海校园餐背后的供应商,越挖越让人心惊!

功夫财经 浏览 5463

牛弹琴:白宫突然发了张图 伤害性不大侮辱性极强

现代快报 浏览 39455

"斩首"行动细节揭秘:美以战机同地起飞 直扑哈梅内伊

中国新闻周刊 浏览 43261

佟丽娅最新古装近照曝光!比李沁还漂亮,42岁第一次演仙侠剧

温柔娱公子 浏览 3671

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 3570

奇瑞QQ3纯电版要来了 轴距2700mm

网易汽车 浏览 3649

琉球群岛地位未定中方在联合国亮明态度 日媒破防

头条爆料007 浏览 35441

特朗普证实:已授权中情局行动

澎湃新闻 浏览 4616

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 4628

“恐怖电影成真” 美国男子盗窃人骨公开售卖

澎湃新闻 浏览 8843

一口气直接炫完两部,这部看似普通的短剧《一品布衣》也太燃了!

肆季娱乐 浏览 3517

俄总统助理:普京和特朗普会晤意愿依旧存在

每日经济新闻 浏览 4480

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 4029

广发证券:本轮港股春季躁动会缺席吗?

智通财经 浏览 3946

被问是否会刺杀伊朗新领袖 特朗普突然"共情"了

极目新闻 浏览 34024

倍耐力官方:下赛季取消C6;所有车队将在12月9日测试新胎

懂球帝 浏览 4114

北京男篮有戏!麦基经纪公司否认签波多黎各联赛 CBA+欧冠二选一

醉卧浮生 浏览 3517

微信AI团队,悄悄干了件大事,算力消耗暴降44%!

智东西 浏览 4284
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1