关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者3642人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

尹锡悦宣布戒严当晚 金建希与其争吵:因为你全搞砸了

每日经济新闻 浏览 19731

登贝莱:踢什么位置教练说了算,我很喜欢中锋位置

懂球帝 浏览 5254

悬了!仅剩80天!“西北酒王”进入倒计时

壹只灰鸽子 浏览 4622

净利腰斩 “非洲之王”传音失速

北京商报 浏览 3378

“玻璃大王”曹德旺提前退休,儿子曹晖接班后福耀帝国走向何方?

尺度商业 浏览 4649

TA:世界杯赛场是姆巴佩的福地,他将成为世界杯史上最佳球员

懂球帝 浏览 107

S妈现身大S雕像揭幕仪式,S家人穿黑衣现身,纪念碑刻着“S”字样

素素娱乐 浏览 3458

深耕全民阅读落地,咪咕以数智服务拓宽书香边界

环球网资讯 浏览 1726

「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声

新智元 浏览 4529

消失在官方记录中的定制传奇:法拉利FX

老爷车 浏览 4406

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 3585

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 4602

小黑靴不流行了?今年冬天最火的靴子竟然是它

LinkFashion 浏览 3715

姐妹俩遭妹妹男友行凶致一死一重伤 家属起诉警方失职

红星新闻 浏览 12340

大湾区晚会太混乱!跑调抢拍忘词破音全占了,合唱几乎都翻车

萌神木木 浏览 4173

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 4157

71岁奶奶获健美比赛冠军:把健身当上班 被儿媳夸偶像

环球网资讯 浏览 9002

马斯克宣布X Money四月公测

财闻 浏览 2705

“老登股”列传I:海天味业,匆匆忙忙跌跌撞撞这五年

锦缎研究院 浏览 4599

纯电续航超400km ID.ERA 9X将于4月正式上市

车质网 浏览 3365

俄美乌三方首轮会谈细节披露

环球网资讯 浏览 3428
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1