【財新網】全球大模型仍在競速跑。當地時間7月9日晚,馬斯克旗下AI公司xAI發布最新一代大模型Grok 4和Grok 4 Heavy,其中Grok 4為單智能體版,消費者可花30美元/月訂閱體驗;Grok 4 Heavy為多智能體版,訂閱費用高達300美元/月。
馬斯克以“人類最后的測試”(Humanity’s Last Exam)為標準,發現在不使用工具的情況下,Grok 4的分值為25.4%,高于谷歌最先進的Gemini 2.5 Pro(21.6%),也高于OpenAI的o3大模型(21%)。如果讓大模型調用工具,Grok 4的分值達34.6%,Grok 4 Heavy的分值達44.4%。“人類最后的測試”難度很高,包括了2500個極其困難的學術問題,涉及一百多個學科。



















京公網安備 11010502034662號 