跳到主要內容
OpenAI 的模型推翻了幾何學中一個沿用已久的核心猜想 | OpenAI

2026 年 5 月 20 日

研究里程碑

OpenAI 的模型推翻了幾何學中一個沿用已久的核心猜想

聆聽本文
9:23

近 80 年來,數學家一直在想一個聽起來很簡單、其實超難的問題:如果你在一張紙(平面)上擺 nn 個點,那麼最多會有幾「對」點,彼此之間的距離剛剛好等於 11

這就是所謂的「平面單位距離問題」,最早是數學家保羅・艾狄胥(Paul Erdős)在 1946 年提出的。它在組合幾何這個領域裡名氣很大——問題本身一句話就能說完,可是想真正解開卻難得不得了。2005 年有一本書 Research Problems in Discrete Geometry(作者是 Brass、Moser 和 Pach)就說,它「大概是組合幾何裡最有名(也最好解釋)的問題」。普林斯頓大學的頂尖學者 Noga Alon 則形容,這是「艾狄胥最愛的問題之一」。艾狄胥當年甚至自掏腰包,懸賞給能解開它的人。

今天,我們要分享在這個問題上的一大突破。打從艾狄胥當年提出它以來,大家普遍相信:用「正方形格子」這種排法(下面會看到圖)來盡量製造「距離剛好是 1 的點對」,差不多就是極限了。但 OpenAI 的一個內部模型推翻了這個流傳已久的猜想——它找出了一整族(無窮多個)例子,把數量提升到一個明顯更高的水準。這份證明已經由一群外部數學家檢查過,他們還另外寫了一篇論文,把整個推理過程講清楚,並補充了更多背景,說明這個結果為什麼重要。

這個結果還有一個很特別的地方,就是它「是怎麼被找出來的」。寫出這份證明的,是一個全新的「通用型」推理模型——它不是專門為數學打造的,沒有被特別調教去搜尋證明的方法,也不是針對這個問題量身設計的。當時我們正在做一項更大的嘗試:想看看先進的模型能不能幫上前沿研究的忙,於是丟了一批艾狄胥的難題給它。結果在這一題上,它真的寫出了一份能解開這個老問題的證明。

對數學界和 AI 圈來說,這份證明都是一個重要的里程碑。這是頭一次,有一個數學子領域裡最核心的知名難題,被 AI「靠自己」解開。它也讓我們看到,這些系統現在的推理能力已經有多深。數學其實是檢驗推理能力很好的考場:題目定義得很精確、寫出來的證明可以被一步步檢查,而且一段很長的論證,必須從頭到尾每一步都站得住腳才算數。另外,它解題的「方法」也很值得一提——這份證明把代數數論裡一些意想不到、又相當高深的點子,用到了一個看起來很基礎的幾何問題上。

費爾茲獎(被視為數學界的最高榮譽之一)得主 Tim Gowers,在那篇同行論文裡稱這個成果是「AI 數學的一座里程碑」。頂尖數論學家 Arul Shankar 也說:「在我看來,這篇論文證明了,現在的 AI 模型已經不只是人類數學家的小幫手——它們有能力想出原創又巧妙的點子,還能一路把它做到底、開花結果。」

數學家怎麼看這個成果

第 1 則,共 4 則
這一直是艾狄胥最愛的問題之一,我自己就好幾次親耳聽他在演講裡提到它。我想這樣講應該不誇張:每一個做組合幾何的數學家都想過這題,連很多做其他領域的人,也或多或少花過時間琢磨它……在我看來,OpenAI 這個內部模型解開它,是一項了不起的成就,替一個懸了好久的難題畫下句點。最讓人意外的是,正確答案竟然不是 n1+o(1)n^{1+o(1)} 這個大家一直猜的形式;而且它建構例子、做分析的方式,把代數數論裡相當高深的工具用得既漂亮又聰明。

完整證明可以在 這裡(會開新視窗) 看到。由頂尖外部數學家撰寫的那篇同行論文,可以在 這裡(會開新視窗) 看到。如果你想看模型「思考過程」的精簡版,也可以在 這裡(會開新視窗).

Dense black network graph with interconnected nodes forming a square pattern.

先前大家已知的排法:把正方形格子適度縮放,就能製造出大量「距離為 1」的點對。

「單位距離問題」是什麼

我們把 u(n)u(n) 定義成:在平面上擺 nn 個點時,「距離剛好是 1 的點對」最多能有幾對。想做出「數量隨點數呈直線成長」的例子很簡單:把 nn 個點排成一直線,就會有 n1n-1 對;排成正方形格子,大約會有 2n2n 對。而先前公認最好的排法,是把正方形格子適度縮放,結果它給出的數量還更多一點,大約是:n1+C/loglog(n)n^{1 + C / \log \log(n)}(這裡的 CC 是一個常數)。由於 loglog(n)\log \log(n) 會隨著 nn 越來越大而趨近無限大,所以指數上多出來的那一項,會慢慢趨近 00,也就是說,這些排法雖然比直線成長快一點點,但也只快了一點點。幾十年來,大家普遍相信這個速度差不多就是極限了,沒有哪種排法能明顯超越正方形格子。用比較專業的話來講,艾狄胥猜這個數量的上限是 n1+o(1)n^{1+o(1)},這裡多出來的 o(1)o(1) 代表一個會趨近於 00 的量,它的大小取決於 nn.

我們的新結果,推翻了這個猜想。講得更精確一點:對於無窮多種
nn 的取值,這份證明都能造出由 nn 個點組成、而且至少有 n1+δn^{1+\delta} 對「距離為 1」點對的排法,其中那個固定的指數 δ>0\delta > 0。(最初 AI 給的證明,沒有寫出明確的 δ\delta 到底是多少;不過普林斯頓數學教授 Will Sawin 接下來會發表一個更精細的版本,證明可以做到 δ=0.014\delta=0.014。)

回頭看看這個問題的歷史,就更能體會這個結果有多讓人意外。下限那一邊,自從艾狄胥 1946 年最初的排法之後,幾乎就沒再進步過。上限那一邊是
O(n4/3)O(n^{4/3}),這個結果出自 Spencer、Szemerédi 和 Trotter 在 1984 年的研究;後來雖然有 Székely,Katz 和 Silier,還有 Pach、Raz、Solymosi 等人陸續做了改良和相關研究,但這個上限基本上一直沒變過。為了替這個猜想找佐證,Matoušek 以及 Alon–Bucić–Sauermann 還研究了「改用非歐幾里得距離」的版本,並證明在某種意義下,「大多數」這類距離都乖乖符合猜想。

讓人意外的是,這個建構最關鍵的材料,竟然來自數學裡一個完全不同的分支——代數數論。這門學問研究的,是像「在比整數更大的數系裡,要怎麼做質因數分解」這類問題,而這些擴大後的數系,就叫做「代數數體」。

艾狄胥單位距離問題:投入越多運算時的答對率
log (test-time-compute)00.10.20.30.40.5pass@1 accuracy

確認最初那份證明沒問題之後,我們又做了個實驗:給模型不同程度的「思考時間」(也就是運算資源),看它解開這題的成功率有多高。結果就如下圖所示。

數論帶來的全新招數

大方向上,這份證明是先從一個大家很熟悉的幾何想法出發,再把它推往一個誰也沒想到的方向。

艾狄胥當年的下限,可以用「高斯整數」來理解。所謂高斯整數,就是長成 a+bia+bi 這種樣子的數,其中 aabb 都是整數,而 ii 的平方等於 1-1。高斯整數可以想成是普通整數的「擴充版」,而且它跟普通整數一樣,也有「質因數分解唯一」這種好性質。像這樣把普通整數或分數往外擴充得到的數系,就叫做「代數數體」。新證明做的事,就是把高斯整數換成代數數論裡更複雜的版本——它們有更豐富的「對稱性」,因此能造出多更多「距離剛好是 1」的差。

更精確地說,這個證明用上了像「無窮類域塔」(infinite class field towers)和 Golod–Shafarevich 理論這類工具,來確認它需要的那些數體真的存在。這些東西對研究代數數論的人來說早就不陌生,但讓大家大吃一驚的是:它們居然能跟歐幾里得平面上的幾何問題扯上關係。

這對數學界意味著什麼

這個結果,在 AI 與數學的互動史上是一個重要時刻:一個 AI 系統,靠自己解開了一個活躍領域中最核心的長年難題。它也讓我們提前瞥見:AI 和人類數學家之間,未來可能會發展出一種全新的合作方式。在這個例子裡,外部數學家補寫的那篇論文,把整件事描繪得比原本那份解答本身豐富太多了。

正如 Thomas Bloom 在他的同行評述裡寫的:

每次要評估一份 AI 寫出來的證明有多重要、影響有多大,我都會問自己一個問題:它有沒有讓我們對這個問題多懂了一點?我們現在對離散幾何的理解,是不是真的更深了?我覺得答案是「算有,但要保留一點」:它讓我們看到,數論的這些建構手法,對這類問題能說的話,遠比我們原本以為的多很多;而且,需要動用的數論可以非常非常深。我敢說,接下來幾個月,會有不少代數數論學家,開始仔細研究離散幾何裡其他還沒解開的問題。

這個解答揭開了一個誰也沒料到的連結——代數數論居然跟離散幾何有關,這正是它特別的地方。它不只是解掉某一個猜想而已,更可能替數學家搭起一座橋,讓大家能順著它,去探索更多相關的問題。

Bloom 還指出了一個更大的可能性:

知識的邊界其實長得坑坑疤疤、到處有突起;接下來的幾個月、幾年,數學的其他很多領域,肯定也會出現類似的好消息——AI 找出意想不到的連結、把現有的工具用到極致,從而解開那些懸了很久的難題。AI 正在幫我們,更徹底地探索這座我們花了好幾百年才蓋起來的「數學大教堂」;還有哪些沒被看見的奇景,正在角落等著我們發現呢?

這個結果是一個很有希望的例子:AI 帶來的不只是一個答案,而是一項數學發現——而且它的意義,會隨著後來人類慢慢理解它,變得越來越清楚、越來越豐富。

為什麼這件事很重要

這件事的意義,其實比這個結果本身還要大。當 AI 的數學推理能力變強,它就能成為更得力的研究夥伴:它能扛住一長串複雜的推理而不亂掉、能把相隔很遠的不同領域連起來、能挖出一些連專家都沒想到要先試的有潛力方向,還能幫研究者在那些原本太複雜、太花時間而根本不想碰的問題上往前推進。

這些能力,可不只在數學裡有用。如果一個模型能讓複雜的論證一路保持連貫、能把相隔很遠的領域連起來、又能做出經得起專家檢驗的成果,那它在生物、物理、材料科學、工程、醫學等領域同樣派得上用場。這些也是我們邁向「更自動化的研究」這條長路上的一部分:打造出能幫科學家和工程師嘗試更多想法、挑戰更難問題的系統。

AI 即將在研究中那些最需要創意的環節,扮演非常吃重的角色——而其中最關鍵的,就是「AI 研究本身」。雖然會走到這一步並不讓人意外,但它讓我們更加意識到一件事的急迫性:我們必須去搞懂 AI 發展的下一個階段、想清楚怎麼讓這些超級聰明的系統「對齊」人類的目標,以及未來人類和 AI 該怎麼合作。

不過,那樣的未來,仍然離不開人的判斷。專業能力會變得更值錢,而不是更不值錢。AI 可以幫忙搜尋、給建議、做查證;但要由人來決定哪些問題真正重要、來解讀結果,並決定接下來要追問什麼。

作者

OpenAI