Google AI模型升級…功力大增 OpenAI也發布新產品

AI示意圖。路透

Google母公司字母(Alphabet)發佈了旗下AI模型Gemini Deep Think的重大升級,在頂尖程式競賽平臺Codeforces的Elo評分系統中,拿下3,455的高分,全球僅不到十人比它高。同日,OpenAI發佈首款由半導體新創Cerebras Systems晶片運作的AI模型,拓展輝達之外的晶片供應來源。

這個名爲Gemini 3 Deep Think的模型,在人類的最後考試(Humanity's Last Exam)取得48.4%的答對率,在ARC-AGI-2測試中達到84.6%。Google提到,Gemini 3 Deep Think在數學與物理相關競賽級基準上都達到金牌水準。

Gemini 3 Deep Think使用Google的搜尋,避免進行研究時資訊不精確或錯誤引用,在數學和科學研究擁有更佳表現,能幫助科學家將理論化爲實際應用。

另一方面,OpenAI 12日推出GPT-5.3-Codex精簡版:GPT-5.3-Codex-Spark,能讓軟體工程師快速完成編輯特定程式碼區塊並執行測試。使用者可以隨時中斷作業,或要求模型處理其他程式碼相關工作,無需枯等跑完運算。

這個AI模型是在Cerebras的硬體上運行,以提升AI模型的反應速度。

OpenAI發言人12日重申,該公司和輝達的合作伙伴關係是「核心基礎」,OpenAI最強大的AI模型是雙方「多年來在硬體和軟體工程領域並肩合作」的成果,「這就是爲什麼我們以輝達做爲訓練和推論架構的核心,同時透過與Cerebras、超微和博通的合作,刻意擴大其周邊的生態系」。

另外,據彭博報導,OpenAI已向美國國會議員發出警告,指控中國大陸競爭對手DeepSeek利用不公平且日益精細的手段,從美國領先的AI模型中擷取結果,訓練R1聊天機器人。