GPT-5.4 Pro 解 60 年 Erdős 猜想 #1196

鏈新聞abmedia

根據 OpenAI 4 月 28 日的官方公告與 Scientific American 4 月 24 日的深度報導,一道懸宕 60 年的 Erdős 數學猜想(編號 #1196)在 ChatGPT 旗艦推理模型 GPT-5.4 Pro 協助下被解開。OpenAI 同日透過官方 Podcast 由研究員 Sébastien Bubeck 與 Ernest Ryu 與主持人 Andrew Mayne 對談,正式對外說明事件細節與意義。

事件主角:23 歲業餘者 Liam Price

解題者 Liam Price 23 歲,無進階數學訓練,平時偶爾與劍橋大學數學系二年級學生 Kevin Barreto 合作研究。Price 自述:「我並不知道這道題是什麼—我就是有時會把 Erdős 問題丟給 AI,看看它會跑出什麼。」

過程:

Price 在 2026 年 4 月某個週一下午把 Erdős #1196 輸入 GPT-5.4 Pro

模型約 80 分鐘推理後給出證明思路

另花約 30 分鐘整理為 LaTeX 論文

Price 將解答貼上 erdosproblems.com 論壇 #1196 thread,提交社群審閱

Scientific American 報導刊出時間為 2026 年 4 月 24 日;OpenAI 4 月 28 日 Podcast 揭露算是事後一週的官方版說明。

數學突破:Markov 過程連結整數結構,Tao 評「人類前人第一步就走錯」

Erdős #1196 屬「primitive sets」(原始集合)研究範疇—指一群整數,其中任一個都不能被另一個整除。Erdős 的猜想為:當這類集合的元素趨近無限時,「Erdős sum 分數」的最大值會降至剛好 1。

GPT-5.4 Pro 的證明採取「人類數學家此前未嘗試過」的路線:把整數結構(anatomy of integers)與 Markov 過程理論做出連結。這個跨領域的橋接此前不在任何人的研究路徑上。

Fields 獎得主、知名數學家 Terence Tao 對此事件評論兩句被廣泛引用:

「這道題與其他不同—人類確實看過,但集體在第一步就走錯了。」(”This one is a bit different because people did look at it, and the humans that looked at it just collectively made a slight wrong turn at move one.”)

「這項貢獻對整數結構研究的意義,遠超過解開這道特定 Erdős 問題本身。」(”That would be a meaningful contribution to the anatomy of integers that goes well beyond the solution of this particular Erdos problem.”)

另一位史丹佛大學的數學家 Jared Duker Lichtman 則表示,AI 採取的路徑驗證了他長期的直覺:這類問題之間存在「某種共通的統一感」。

OpenAI 4/28 揭露:Podcast 對談與後續驗證

OpenAI 在 4 月 28 日的 Podcast 中正式邀請 OpenAI 研究員 Sébastien Bubeck 與 Ernest Ryu 與主持人 Andrew Mayne 對談「AI 在數學研究中的角色」。OpenAI 推文原話:「Earlier this month, an Erdős problem that had been open for 60 years was solved with help from GPT-5.4 Pro. What happens now that AI is getting good at math?」

截至本文截稿,Price 提交的證明在 erdosproblems.com 論壇仍處於社群驗證階段,尚未通過正式同行評審;TheDecoder 4 月 15 日報導指出「formal verification 仍在進行」。OpenAI 今日 Podcast 揭露屬於對外溝通層級,不等於完整數學證明驗證已通過—讀者欲追蹤後續可關注 Erdős Problems 論壇 thread #1196。

這篇文章 GPT-5.4 Pro 解 60 年 Erdős 猜想 #1196 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

螞蟻集團 Ling-2.6-flash 模型開源:1040 億參數、啟用 74 億參數,達成多項最新最先進(SOTA)基準

Gate 新聞訊息,4 月 29 日——螞蟻集團的 Ling-2.6-flash 模型權重現已開源釋出;此前該模型的權重僅可透過 API 使用。該模型具備 1040 億(104 billion)總參數,每次推論啟用 74 億(7.4 billion)參數,並提供 256K 上下文視窗,且採用 MIT 授權。HuggingFace 與 ModelScope 提供 BF16、FP8 與 INT4 精度版本。

GateNews1分鐘前

Sam Altman 發布 Codex 雙模式截圖,辦公與編程功能正式分流

OpenAI 執行長 Sam Altman 於 4 月 29 日在 X 平台發布的截圖及聲明,Codex 正在推出新版引導介面,用戶首次進入時須從兩種模式中選擇,分別為 Excelmogging 和 Codemaxxing。Codex 目前的周活躍用戶已超過 400 萬,使用場景已從代碼生成延伸至非技術用途。

Market Whisper13分鐘前

OpenAI 的 Codex 推出雙模式介面:用於辦公工作的 Excelmogging,以及用於程式設計的 Codemaxxing

Gate 新聞訊息,4 月 29 日——OpenAI 執行長 Sam Altman 今天在 X 上宣布重新設計的 Codex 介面,並為使用者推出兩種截然不同的模式。"Excelmogging" 面向日常辦公任務,採用更精簡的介面,並配有口號「同樣的工具,更簡潔的介面」,包含例如建立試算表等示例任務。

GateNews1小時前

美媒:白宮行政命令草案允許 Anthropic Mythos 模型進入政府

根據 Axios 於 4 月 28 日引述知情人士的報道,白宮正在制定指引,允許各聯邦機構繞過 Anthropic 的供應鏈風險認定(SCRD),並引入包括 Anthropic 旗下 Mythos 模型在內的新模型供政府使用。就此,白宮發表官方聲明稱,任何政策聲明都將直接由總統發布,其他任何說法都純屬猜測。

Market Whisper1小時前

泰勒絲申請聲音及圖像商標,防範 AI 仿冒內容傳播

根據 BBC 於 4 月 28 日的報道,美國流行歌手泰勒絲(Taylor Swift)已在美國提交三項商標申請,涵蓋聲音音頻片段及舞台圖像,目的是保護其聲音與外觀免受 AI 仿冒;商標律師 Josh Gerben 首先在其部落格上披露了上述申請細節。

Market Whisper1小時前

白宮起草指引以允許使用 Anthropic,並豁免供應鏈風險認定

Gate News 消息,4 月 29 日——據知情人士透露,白宮正在起草行政指引,將允許政府機構在涉及 Anthropic 的供應鏈風險認定方面予以豁免,並引入包含 Mythos 在內的新 AI 模型。該提議的行政措施可能能夠為緩和白宮與 Anthropic 之間的緊張局勢提供一條途徑,其中一位消息人士將這項努力描述為一種「在把他們帶回來的同時,給彼此留面子」。

GateNews1小時前
留言
0/400
暫無留言