“数学奥林匹克”现新竞争者:谷歌AI几何才气超东说念主类

“数学奥林匹克”现新竞争者:谷歌AI几何才气超东说念主类

谷歌的第二代东说念主工智能数学系统将话语模子与标识引擎相联结,不错比国外数学奥林匹克(IMO)金牌得主更好地处置复杂的几何问题。

考虑东说念主员建造了一种东说念主工智能(AI)数学系统,不错在国外几何比赛中打败东说念主类金牌得主。

该系统名为“AlphaGeometry2”(AG2),是一个先进的东说念主工智能框架,大概处置国外数学奥林匹克竞赛(IMO)中84%的几何问题。而国外数学奥林匹克东说念主类金牌得主平均只处置了81.8%的奥林匹克问题。

科学家们暗示,它由Google DeepMind联想,不仅不错参与模式匹配,还不错参与创造性的问题处置。他们在2月7日上传到预印本arXiv数据库的一项考虑中笼统了他们的发现。

一个月前,微软发布了我方的高等东说念主工智能数学推理系统“rStar-Math”,该系统使用袖珍话语模子(SML)来处置复杂的方程。这两家公司皆寻求在东说念主工智能数学领域占据主导地位,因为科学家们暗示,处置数学问题才气强的系统可能会充分师法其他形状的东说念主类推理。AG2与微软的rStar-Math的不同之处在于,它专注于用羼杂推理模子处置高等问题,而rStar使用较小的话语模子来处置更平方的问题。

科学家在考虑中暗示,谷歌于2024年1月发布了AlphaGeometry的原始版块,其最新版块的性能比之前的版块进步了30%。AG2的纠正主要会聚在对几何的掌抓上,与微积分和代数不同,几何需要羼杂视觉推理和逻辑来处置复杂的问题。

干系词,行家们劝诫说,不要将这一里程碑视为已毕东说念主工通用智能(AGI) —— 无论放哨数据若何,东说念主工智能系统在多个学科中皆比东说念主类更精明,而不单是是在一个学科中成为超东说念主。

东说念主工智能公司SER Group首席本质官、剑桥大学揣度机科学博士约翰·贝茨暗示:“AlphaGeometry2代表了一种智能,但东说念主类的智能远远不啻于此 —— 咱们会发明,而不是浮浅地愚弄学问或创造念念维幻觉。”

东说念主工智能若何处置最难的数学问题

DeepMind的打破是神经话语模子和标识引擎(基于逻辑的系统,旨在使用标识和参数处置问题)的得手联结。话语模子提倡几何结构,而标识引擎对其进行测试。这种匹配使系统大概将东说念主类在几何问题中看到的日常话语转机为标识引擎不错意会和测试的“扶持结构”。

然后,淌若之前的结构不起作用,系统就会协同使命,提倡新的结构。这种对处置有策动的搜索是并行进行的,将信息从系统的一端传递到另一端,直到找到处置有策动。

AG2比第一个版块更好,这要归功于一个在更大、更各样化的数据集上放哨的神经话语模子,以及一个更快的标识引擎,以考据更多的几何结构。该系统还具有私有的搜索和查找几何证据的算法。

DeepMind的考虑东说念主员指出,AG2的过失在于它的处理本领较长,何况它不行处理3D几何、非线性方程、变量点(在几何问题中调动位置的点)和/或无穷点(具有无穷序列的点和无穷多个处置有策动的问题)中最具挑战性的IMO几何问题。终末,该系统无法解释它是若何用东说念主类大概意会的任何话语得出其处置有策动的。

DeepMind对其AG2系统的期许领域仍然是改善数学推理。干系词,科学家们说,这一领域的跨越不错愚弄于几个学科,包括工程联想、自动化系统考据、机器东说念主、制药考虑和基因组考虑。

科学家们补充说,野心是让AG2提供齐全自动化的几何问题处置,莫得任何不实。在改日的版块中,他们但愿扩张其对更多几何见地的因循,并将问题剖判为子组。他们还野心加速推理历程和系统可靠性。






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图