近 80 年來,數學家一直在想一個聽起來很簡單、其實超難的問題:如果你在一張紙(平面)上擺 個點,那麼最多會有幾「對」點,彼此之間的距離剛剛好等於 ?
這就是所謂的「平面單位距離問題」,最早是數學家保羅・艾狄胥(Paul Erdős)在 1946 年提出的。它在組合幾何這個領域裡名氣很大——問題本身一句話就能說完,可是想真正解開卻難得不得了。2005 年有一本書 Research Problems in Discrete Geometry(作者是 Brass、Moser 和 Pach)就說,它「大概是組合幾何裡最有名(也最好解釋)的問題」。普林斯頓大學的頂尖學者 Noga Alon 則形容,這是「艾狄胥最愛的問題之一」。艾狄胥當年甚至自掏腰包,懸賞給能解開它的人。
今天,我們要分享在這個問題上的一大突破。打從艾狄胥當年提出它以來,大家普遍相信:用「正方形格子」這種排法(下面會看到圖)來盡量製造「距離剛好是 1 的點對」,差不多就是極限了。但 OpenAI 的一個內部模型推翻了這個流傳已久的猜想——它找出了一整族(無窮多個)例子,把數量提升到一個明顯更高的水準。這份證明已經由一群外部數學家檢查過,他們還另外寫了一篇論文,把整個推理過程講清楚,並補充了更多背景,說明這個結果為什麼重要。
這個結果還有一個很特別的地方,就是它「是怎麼被找出來的」。寫出這份證明的,是一個全新的「通用型」推理模型——它不是專門為數學打造的,沒有被特別調教去搜尋證明的方法,也不是針對這個問題量身設計的。當時我們正在做一項更大的嘗試:想看看先進的模型能不能幫上前沿研究的忙,於是丟了一批艾狄胥的難題給它。結果在這一題上,它真的寫出了一份能解開這個老問題的證明。
對數學界和 AI 圈來說,這份證明都是一個重要的里程碑。這是頭一次,有一個數學子領域裡最核心的知名難題,被 AI「靠自己」解開。它也讓我們看到,這些系統現在的推理能力已經有多深。數學其實是檢驗推理能力很好的考場:題目定義得很精確、寫出來的證明可以被一步步檢查,而且一段很長的論證,必須從頭到尾每一步都站得住腳才算數。另外,它解題的「方法」也很值得一提——這份證明把代數數論裡一些意想不到、又相當高深的點子,用到了一個看起來很基礎的幾何問題上。
費爾茲獎(被視為數學界的最高榮譽之一)得主 Tim Gowers,在那篇同行論文裡稱這個成果是「AI 數學的一座里程碑」。頂尖數論學家 Arul Shankar 也說:「在我看來,這篇論文證明了,現在的 AI 模型已經不只是人類數學家的小幫手——它們有能力想出原創又巧妙的點子,還能一路把它做到底、開花結果。」
完整證明可以在 這裡(會開新視窗) 看到。由頂尖外部數學家撰寫的那篇同行論文,可以在 這裡(會開新視窗) 看到。如果你想看模型「思考過程」的精簡版,也可以在 這裡(會開新視窗).
先前大家已知的排法:把正方形格子適度縮放,就能製造出大量「距離為 1」的點對。
我們把 定義成:在平面上擺 個點時,「距離剛好是 1 的點對」最多能有幾對。想做出「數量隨點數呈直線成長」的例子很簡單:把 個點排成一直線,就會有 對;排成正方形格子,大約會有 對。而先前公認最好的排法,是把正方形格子適度縮放,結果它給出的數量還更多一點,大約是:(這裡的 是一個常數)。由於 會隨著 越來越大而趨近無限大,所以指數上多出來的那一項,會慢慢趨近 ,也就是說,這些排法雖然比直線成長快一點點,但也只快了一點點。幾十年來,大家普遍相信這個速度差不多就是極限了,沒有哪種排法能明顯超越正方形格子。用比較專業的話來講,艾狄胥猜這個數量的上限是 ,這裡多出來的 代表一個會趨近於 的量,它的大小取決於 .
我們的新結果,推翻了這個猜想。講得更精確一點:對於無窮多種 的取值,這份證明都能造出由 個點組成、而且至少有 對「距離為 1」點對的排法,其中那個固定的指數 。(最初 AI 給的證明,沒有寫出明確的 到底是多少;不過普林斯頓數學教授 Will Sawin 接下來會發表一個更精細的版本,證明可以做到 。)
回頭看看這個問題的歷史,就更能體會這個結果有多讓人意外。下限那一邊,自從艾狄胥 1946 年最初的排法之後,幾乎就沒再進步過。上限那一邊是 ,這個結果出自 Spencer、Szemerédi 和 Trotter 在 1984 年的研究;後來雖然有 Székely,Katz 和 Silier,還有 Pach、Raz、Solymosi 等人陸續做了改良和相關研究,但這個上限基本上一直沒變過。為了替這個猜想找佐證,Matoušek 以及 Alon–Bucić–Sauermann 還研究了「改用非歐幾里得距離」的版本,並證明在某種意義下,「大多數」這類距離都乖乖符合猜想。
讓人意外的是,這個建構最關鍵的材料,竟然來自數學裡一個完全不同的分支——代數數論。這門學問研究的,是像「在比整數更大的數系裡,要怎麼做質因數分解」這類問題,而這些擴大後的數系,就叫做「代數數體」。
確認最初那份證明沒問題之後,我們又做了個實驗:給模型不同程度的「思考時間」(也就是運算資源),看它解開這題的成功率有多高。結果就如下圖所示。
大方向上,這份證明是先從一個大家很熟悉的幾何想法出發,再把它推往一個誰也沒想到的方向。
艾狄胥當年的下限,可以用「高斯整數」來理解。所謂高斯整數,就是長成 這種樣子的數,其中 和 都是整數,而 的平方等於 。高斯整數可以想成是普通整數的「擴充版」,而且它跟普通整數一樣,也有「質因數分解唯一」這種好性質。像這樣把普通整數或分數往外擴充得到的數系,就叫做「代數數體」。新證明做的事,就是把高斯整數換成代數數論裡更複雜的版本——它們有更豐富的「對稱性」,因此能造出多更多「距離剛好是 1」的差。
更精確地說,這個證明用上了像「無窮類域塔」(infinite class field towers)和 Golod–Shafarevich 理論這類工具,來確認它需要的那些數體真的存在。這些東西對研究代數數論的人來說早就不陌生,但讓大家大吃一驚的是:它們居然能跟歐幾里得平面上的幾何問題扯上關係。
這個結果,在 AI 與數學的互動史上是一個重要時刻:一個 AI 系統,靠自己解開了一個活躍領域中最核心的長年難題。它也讓我們提前瞥見:AI 和人類數學家之間,未來可能會發展出一種全新的合作方式。在這個例子裡,外部數學家補寫的那篇論文,把整件事描繪得比原本那份解答本身豐富太多了。
正如 Thomas Bloom 在他的同行評述裡寫的:
“每次要評估一份 AI 寫出來的證明有多重要、影響有多大,我都會問自己一個問題:它有沒有讓我們對這個問題多懂了一點?我們現在對離散幾何的理解,是不是真的更深了?我覺得答案是「算有,但要保留一點」:它讓我們看到,數論的這些建構手法,對這類問題能說的話,遠比我們原本以為的多很多;而且,需要動用的數論可以非常非常深。我敢說,接下來幾個月,會有不少代數數論學家,開始仔細研究離散幾何裡其他還沒解開的問題。”
這個解答揭開了一個誰也沒料到的連結——代數數論居然跟離散幾何有關,這正是它特別的地方。它不只是解掉某一個猜想而已,更可能替數學家搭起一座橋,讓大家能順著它,去探索更多相關的問題。
Bloom 還指出了一個更大的可能性:
“知識的邊界其實長得坑坑疤疤、到處有突起;接下來的幾個月、幾年,數學的其他很多領域,肯定也會出現類似的好消息——AI 找出意想不到的連結、把現有的工具用到極致,從而解開那些懸了很久的難題。AI 正在幫我們,更徹底地探索這座我們花了好幾百年才蓋起來的「數學大教堂」;還有哪些沒被看見的奇景,正在角落等著我們發現呢?”
這個結果是一個很有希望的例子:AI 帶來的不只是一個答案,而是一項數學發現——而且它的意義,會隨著後來人類慢慢理解它,變得越來越清楚、越來越豐富。
這件事的意義,其實比這個結果本身還要大。當 AI 的數學推理能力變強,它就能成為更得力的研究夥伴:它能扛住一長串複雜的推理而不亂掉、能把相隔很遠的不同領域連起來、能挖出一些連專家都沒想到要先試的有潛力方向,還能幫研究者在那些原本太複雜、太花時間而根本不想碰的問題上往前推進。
這些能力,可不只在數學裡有用。如果一個模型能讓複雜的論證一路保持連貫、能把相隔很遠的領域連起來、又能做出經得起專家檢驗的成果,那它在生物、物理、材料科學、工程、醫學等領域同樣派得上用場。這些也是我們邁向「更自動化的研究」這條長路上的一部分:打造出能幫科學家和工程師嘗試更多想法、挑戰更難問題的系統。
AI 即將在研究中那些最需要創意的環節,扮演非常吃重的角色——而其中最關鍵的,就是「AI 研究本身」。雖然會走到這一步並不讓人意外,但它讓我們更加意識到一件事的急迫性:我們必須去搞懂 AI 發展的下一個階段、想清楚怎麼讓這些超級聰明的系統「對齊」人類的目標,以及未來人類和 AI 該怎麼合作。
不過,那樣的未來,仍然離不開人的判斷。專業能力會變得更值錢,而不是更不值錢。AI 可以幫忙搜尋、給建議、做查證;但要由人來決定哪些問題真正重要、來解讀結果,並決定接下來要追問什麼。


