关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4428人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国家,给人工智能定了新调子

米筐投资 浏览 4203

佩斯科夫:"海燕"巡航导弹试验不应影响俄美互动

国际在线 浏览 4448

微软CEO纳德拉:能源成本将决定哪些国家能在人工智能竞赛中胜出

IT之家 浏览 3446

上汽大众首款“9系旗舰” ID. ERA 9X实车曝光

网易汽车 浏览 3542

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 100848

未来四个月,汽车市场的目标增速-11.82%?

DearAuto 浏览 5398

莫斯科大学突破:普通照片实现房间结构与物品识别

科技行者 浏览 4611

小米车主第1天提车在交付中心撞人 小米内部人士回应

澎湃新闻 浏览 20189

华境S配置公布 全系标配华为乾崑智驾与鸿蒙座舱

网易汽车 浏览 1436

媒体:美航母编队一重要舰种 已经少于中国055大驱

新民周刊 浏览 38153

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 3512

泰军方:已初步控制泰柬边境一处关键高地

上观新闻 浏览 3723

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 4821

日本首次正式参演美菲“肩并肩”军演

极目新闻 浏览 1663

新人中东度蜜月突遇战争爆发 新娘在领空关闭前幸运离境

极目新闻 浏览 2892

抄底时刻已至?新荣记、胡晓明联手入股西贝

首席商业评论 浏览 3389

迅雷再次起诉前CEO陈磊 知情人:追索金额达2亿元

红星新闻 浏览 14940

新年资金入市!超450亿公募资金到位,“万亿活水”在路上

券商中国 浏览 3534

华盛顿大学与耶鲁大学联手:医疗数据库为何让顶尖AI模型"抓狂"

科技行者 浏览 3570

大哥承诺每月给1万养家费 小弟把事扛了入狱发现被耍

方圆 浏览 9678

窦靖童帮帮唱,亲妈亲爸继父四选一你选谁?

TVB的四小花 浏览 593
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1