Google IMO金牌級Gemini 3上線!OpenAI更難反擊?

GoogleDeepMind 終於端出 IMO 最強金牌模型——Gemini 3 Deep Think。而 Gemini 2.5 Deep Think 今夏已分別在 IMO、ICPC 國際賽中,拿下了金牌的戰績。
憑藉「平行思考」能力,Gemini 3 Deep Think 可以搞定超高難度的數學、科學難題!
據「新智元」,在基準測試中,Deep Think 全面碾壓 Gemini 3 Pro,尤其是在 HLE 上,未用工具拿下了 41% 高分。同時在 ARC-AGI-2 上,以 45.1% 成績領先全球。
同一指令,讓 Gemini 3 Pro 和 Deep Think 版基於一張博物館展館屋頂的草圖,創造一個精確的互動式 3D 場景。後者在還原度上,與原圖幾乎是 1:1 復刻,並在互動上,光影變化符合物理邏輯。
Gemini 3 Deep Think 今日已在 Gemini App 上線,所有 Ultra 用戶即可體驗。其正式開啟了「深度思考」新紀元,讓智慧的邊界再次拓展。基於上一代 Gemini 2.5 Deep Think 迭代而來,在推理能力上實現了質的飛躍。它專門用來攻克那些連當今最頂尖模型,都感到棘手的複雜數學、科學和邏輯難題。
在多項基準測試中,Gemini 3 Deep Think 都拿下了業界領先成績。在 Humanity"s Last Exam(無工具輔助)上刷爆 41%,並在 ARC-AGI-2(配合代碼執行),創下 45.1% 新紀錄。在 ARC-AGI-1 和 ARC-AGI-2 上,Gemini 3 Deep Think 實力堪稱無「模」能敵。
之所以這麼強,是因為 Deep Think 採用了「平行推理」來同時思考,能夠同時探索多種假設。在 GoogleDeepMind 所放出的更多 demo 中,可以看出 Gemini 3 Deep Think 強大之處。例如,讓它打造一款 3D 版骨牌遊戲。在關卡設定中,Deep Think 兼具創意與驚喜,也模擬出了真實的碰撞物理效果。
同日,GoogleDeepMind 宣布將在新加坡組建一支全新精英團隊。它將由華人科學家 Yi Tay 率隊,專攻高級推理、LLM/RL,以及推進 Gemini、Gemini Deep Think 等最前沿 SOTA 模型的發展。Yi Tay 將向位於山景城由 Quoc Le(GoogleFellow 級大佬)領導的團隊報告。恰好,這隊正是 Gemini Deep Think 在國際競賽中獲得金牌的核心力量之一,同時也在 Gemini 上取得重要進展。
關鍵是,這個團隊還能與 AI 領域傳奇大神聯動研究,其中就包括「推理之王」Denny Zhou、「香蕉」背後的男人 Mostafa Dehghani、AI 界的「GOAT」Noam Shazeer。同時,還有許多「神仙隊友」一起加入研究,包括生成式檢索的發明人 Vinh Q. Tran、IMO 金牌計畫總負責人 Thang Luong、思維鏈開創者 Xuezhi、日本頂尖 AI 大神 Shane Gu 等人。
過去幾個月,GoogleDeepMind 便開始秘密招募全球頂尖人才。這項計畫得到了 Demis Hassabis、Jeff Dean 等內部高層的大力支持。
Gemini 3 爆衝 15% 流量
隨著 Gemini 3 Pro 強勢發布,其網頁端的市佔率再創新高,突破 15% 大關。同時,Grok 也憑藉著 4.1 版本的發布持續成長。ChatGPT 在流量上依然斷崖式領先,但市佔卻持續下降。
Gemini 延續成長勢頭,訪問量達到 13.51 億次,較 10 月增長 14.3%。ChatGPT 跌破 60 億次大關,網站流量降至 58.44 億次。這是繼 7 月之後,ChatGPT 在 2025 年出現的第二次季減。
儘管在 11 月 18 日(Cloudflare 當機當天),ChatGPT 創下單日 2.33 億次訪問的歷史紀錄,但這並未扭轉整體流量的跌勢。
此外,Grok 網站流量達 2.344 億次,創下歷史新高,較 10 月成長 14.7%。這也是該網站自啟用目前網域以來,首次實現連續兩個月的流量成長。