今日,首次實現思考OpenAI新款AI模型o3、圖像o4-mini重磅發(fā)布,重磅這是發(fā)布OpenAI迄今最強、最智能的首次實現思考模型。
據了解,圖像OpenAI o3/o4-mini首次具備真正的重磅視覺推理能力,看圖識圖已經是發(fā)布小菜一碟了,現在還會看圖思考。首次實現思考
OpenAI o3/o4-mini能同時處理文本、重磅圖像和音頻,發(fā)布并且能作為Agent智能體自動調用網絡搜索、首次實現思考圖像生成、圖像代碼解析等工具以及深度思考模式。重磅
通過強化學習,OpenAI訓練了o3/o4-mini如何使用工具,不僅知道如何用、何時用,還能以正確格式快速生成可靠答案。
測試結果顯示,o3和o4-mini(無工具版本)在AIME 2024數學競賽題目中的準確率分別達91.6%和93.4%,遠超前代o1的74.3%。
在AIME 2025題目中,兩者準確率分別達88.9%和92.7%,在Codeforces編程競賽評分中,支持終端工具的o3和o4-mini分別取得了2706和2719的ELO分數,領先o1的1891和o3-mini的2073。
即日起,ChatGPT的Plus、Pro會員以及Team用戶可直接體驗o3、o4-mini和o4-mini-high。