关闭广告

中科大团队实现AI图表数学逻辑理解

科技行者4336人阅读


这项由中国科学技术大学多媒体计算与通信实验室的乐卓等研究者领导的突破性研究,联合北京航空航天大学、上海交通大学、上海人工智能实验室、Hugging Face、新加坡国立大学、字节跳动和香港大学等多个机构,于2025年10月发表在计算机视觉顶级会议上。这项研究首次系统性地解决了AI在生成和编辑结构化图像时"看起来很美实际不准"的核心问题,让人工智能真正具备了理解图表、公式、图形背后数学逻辑的能力。

想象一下,你让AI画一个饼图显示公司各部门的销售占比,AI可能会画出一个看起来很专业的彩色饼图,但仔细一看,所有扇形加起来的角度根本不是360度,或者标注的百分比数字完全对不上扇形的实际大小。这就像是一个只会模仿画家笔触却不懂数学的学生,虽然画得有模有样,但内容完全经不起推敲。

现在的AI图像生成技术确实已经能创造出令人惊叹的自然图像,比如逼真的风景照片或者艺术作品,但当涉及到需要精确计算和逻辑推理的结构化图像时,就像是让一个从未学过数学的人去画函数图像一样困难。这些结构化图像包括数学公式、统计图表、几何图形、科学示意图等,它们不仅要求视觉上的美观,更重要的是内容的准确性和逻辑的严密性。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 4263

唱吧等39款APP被通报

第一财经资讯 浏览 4268

版博会观察:冰箱贴凭啥成文创顶流?AI+版权如何焕新意?

南方都市报 浏览 4530

闫学晶奢侈风波升级!官媒出手锐评

网络易不易 浏览 3629

伊朗被指愿作出让步:将最高丰度浓缩铀的一半送至国外

环球网资讯 浏览 39100

美驱逐舰拦截一艘驶往伊朗港口油轮

财联社 浏览 1477

票房从57.7亿跌到1.28亿,我感慨:这块金字招牌算是砸了

靠谱电影君 浏览 4047

全球限量25台 Bertone Runabout量产版发布

车质网 浏览 3451

美联储主席鲍威尔回应遭刑事调查:将继续履行职责

国际金融报 浏览 3532

港中深突破:AI推理模型实现自我纠错能力

科技行者 浏览 4646

媒体:日本情报体系迎来根本性重构 威胁的不止东亚

环球网资讯 浏览 22941

今年集中上市 旅行车的春天可能真要来了

网易汽车 浏览 3462

女子用"AI流浪汉"照片整蛊丈夫引来警察 网友表示不解

央视网 浏览 11620

明年下线 特斯拉Cybercab不会提供方向盘

车质网 浏览 4375

通航城市超260个 我国四大世界级机场群建设初具规模

央视财经 浏览 4630

规模扩大、体验升级 2025“我与地坛”北京书市亮点纷呈

中国商报 浏览 5308

友人追忆杨振宁:他其实还有一个遗憾

大象新闻 浏览 4618

巴基斯坦总理在联大敲桌子强调"自卫权"

北京日报 浏览 3756

淘宝去复杂,抖音延周期,2025双11平台直降抢客?

蓝鲸新闻 浏览 4630

"柴怼怼"被逮捕:因"打假"走红后售假 有人消费近10万

澎湃新闻 浏览 9164

晚点独家丨千问 app,阿里要怎么做中国的 “ChatGPT”

晚点LatePost 浏览 4238
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1