关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3603人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

人类遗忘的难题解法,被GPT-5重新找出来了

量子位 浏览 4586

格陵兰岛"任何情况下都不接受美接管"

新京报 浏览 3545

业主84万元新房被粪水环绕 管道一天直排粪水10余次

潇湘晨报 浏览 7535

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技 浏览 3541

梓渝:慢下来,也很好

时尚COSMO 浏览 587

比亚迪王朝“饭票”曝光,可吃四菜一汤

IT之家 浏览 3869

夏天的白裙,可以像赫本那样穿

Yuki女人故事 浏览 1316

穿搭不跟风、素颜不p图,她展示了40岁穿搭的另一种可能

黎贝卡的异想世界 浏览 3778

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 2953

湖南银行董事会成员调整,11位董事候选人简历公布

湘财Plus 浏览 596

男子深夜抢走绍兴金店150多克黄金饰品 逃了5分钟落网

都市快报橙柿互动 浏览 5556

苹果iOS、谷歌 Android 系统将面临英国更严格反垄断审查

IT之家 浏览 4609

格林伍德2025年联赛打进22球法甲最多,为2018年后马赛首人

懂球帝 浏览 3887

马斯克宣布X Money四月公测

财闻 浏览 2701

媒体:日本拥有核武器 只差一把"螺丝刀"

北京日报客户端-长安街知事 浏览 13166

破亿品牌数增长,3万品牌成交翻倍,今年双11的商业变革悄然开始

一点财经 浏览 4411

这个「疯批」星二代,撕碎了娱乐圈的滤镜

独立鱼 浏览 3426

18岁松岛握拳怒吼!2连冠后豪言洛奥成主力 张本一哥席位摇摇欲坠

颜小白的篮球梦 浏览 3472

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 4312

3年剑指10万店,小咖咖啡将拿出6亿资金赋能门店增长

斑马消费 浏览 683

天空体育:热刺高层在考虑所有选项,尚未决定弗兰克的去留

懂球帝 浏览 3493
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1