爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

PPIO姚欣...

2025年“...

三亚五星酒店...

＂订婚强奸案...

因“阴阳合同...

司晓迪扯出内...

美媒承认：乌重镇即将被攻克

李施嬅困局：被有毒关系猎杀的富家女

男子家中冰箱门关不上灵机一动求助AI 差点花了冤枉钱

牛弹琴：印度耍流氓太不地道难怪巴基斯坦要发飙

委内瑞拉外长：伊朗提出＂全方位＂合作共同应对美威胁

果壳直击CES：具身智能下班时刻

伊朗媒体：伊朗南部一港口多艘船只起火

哥伦比亚总统：反对对古巴进行任何形式的军事干预

北京正探索AI赋能教育，不同学段精细化考虑！市教委详解

无法打破曼城百分记录，阿森纳英超两连平，本赛季最多拿98分

深圳自动驾驶安全实验室揭牌成立，将重点攻坚十大方向

原来他们是夫妻，恩爱27年无绯闻.现是影协主席

宗馥莉几乎搞砸了一切

第二场“部长通道”回应热点问题：锚定产业发展聚力实体经济释放强劲动能

搭载雷神AI电混2.0技术吉利银河星耀7申报信息发布

泽连斯基让步欧洲宣布组建一支“志愿联盟”援乌部队

特拉维夫多处建筑遭袭相关区域实施严格管制

特朗普急于将爱泼斯坦案翻篇仍有250万页文件未公布

初秋“不露腿”也能穿得美：裤选长、裙及踝，优雅得体又应季

BBC两高管宣布辞职特朗普：他们试图＂介入总统选举＂

售16.59万元起改款奥迪A3家族正式上市

加速推进！机器人板块传出大消息！

俄总统新闻秘书：目前俄乌间没有正式沟通渠道

伊能静没有代表作