关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4435人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

清华团队破解:大模型训练崩溃之谜

科技行者 浏览 4336

央视披露:"哪吒"造车3年亏183亿 多地国资投资难追回

新京报政事儿 浏览 33965

拜仁欧冠战巴黎大名单:凯恩领衔,诺伊尔、卡尔在列

懂球帝 浏览 4479

怒砸15亿,全明星阵容,年底压轴大片来了

独立鱼 浏览 3077

中东局势冲击能源市场,影响多大?外资资管最新研判!

券商中国 浏览 2635

CounterPoint称2025Q4印度手机市场联发科斩获48%份额

IT之家 浏览 2590

标配激光雷达 新款领克07EM-P限时13.98万起

网易汽车 浏览 5205

鲁本-迪亚斯:经验告诉我们,如果不在最佳状态就无法夺冠

懂球帝 浏览 3811

租客死亡4年后房东以"房屋贬值"把中介告了 法院判了

封面新闻 浏览 10200

京东将造“廉价版蔚来”?可充可换电,价格将很感人

明镜pro 浏览 4652

特朗普命令2028年登月 在月球部署核反应堆

财联社 浏览 14545

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 8214

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 4406

俄大使披露:美军控制马杜罗时 没打算让任何人活下来

扬子晚报 浏览 7993

欧洲各国在格陵兰岛凑出一个排兵力 丹麦驻军大幅增加

上游新闻 浏览 13076

郝蕾暗讽辛芷蕾,内娱回到十年前了?

大龄女一晓彤 浏览 4139

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 4055

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 4426

黄仁勋与李飞飞,让AI不止于“动嘴”

首席商业评论 浏览 3613

萨莫拉诺:巴萨必须引导好亚马尔,从没听过梅西说皇马偷窃

懂球帝 浏览 4227

马杜罗纽约"首秀"神态轻松 比"V字剪刀手"遭多方解读

红星新闻 浏览 9385
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1