Grok 4震撼登场:性能超越谷歌与OpenAI,高订阅费及争议言论引关注
* 来源 : * 作者 : admin * 发表时间 : 2025-07-24
近日,马斯克旗下xAI公司推出了备受期待的旗舰级人工智能模型Grok 4,并同步发布了名为“SuperGrok Heavy”的顶级订阅服务。该服务月费高达300美元(约人民币2355元),不仅比Google AI Ultra每月250美元和OpenAI ChatGPT Pro每月200美元更贵,而且在多项基准测试中展现出卓越性能,直接挑战了谷歌和OpenAI等竞争对手的市场地位。
据Tech Church报道,Grok 4不仅能分析图像并回应问题,还深度整合了马斯克的社交网络平台X,使其能够提供更加实时和相关的信息。尽管外界对Grok 4寄予厚望,期待其能与OpenAI即将推出的GPT-5一决高下,但xAI近期面临的内部动荡以及Grok模型曾出现的反犹太言论争议,给这款产品的商业化前景蒙上了一层阴影。
xAI强调,Grok 4在解决学术问题方面已达到博士水平,甚至在某些领域超过了人类专家的能力。马斯克本人也在直播中表示:“Grok 4在所有学科上都优于博士,无一例外。”不过他也承认,模型有时可能缺乏常识,并未发明新技术或发现新的物理现象,但他认为这只是时间问题。
为了证明其强大性能,xAI公布了一系列基准测试成绩。例如,在衡量AI回答数千个人文、数学等领域众包问题能力的“Humanity's Last Exam”测试中,Grok 4在没有工具辅助的情况下获得了25.4%的分数,超越了Google Gemini 2.5 Pro的21.6%和OpenAI o3 (high)的21%。而在另一项视觉模式识别测试ARC-AGI-2中,Grok 4以16.2%的成绩创下新纪录,几乎是次世代商用模型Claude Opus 4得分的两倍。
第三方机构Artificial Analysis的评测结果显示,Grok 4在智慧指数中以73分的成绩位居榜首,紧随其后的是o3-pro(72分)、Gemini 2.5 Pro(70分)和o3(70分)。值得一提的是,在智慧指数排名前十名中,有两个由中国公司开发的模型:DeepSeek R1(68分)排名第6,Minimax M1 80k(63分)位列第10。
Grok 4具备多项亮点功能,包括进阶推理能力、多模态支持(文字、图像和语音输入)、专用编码模式(Grok 4 Code),以及通过检索增强生成(RAG)技术实现的即时检索与X平台整合。此外,Grok 4 Voice提供了更加自然流畅的语音互动体验,并且对网络文化有着深刻的理解,非常适合重度网络用户。
尽管Grok 4在技术层面表现抢眼,但其商业化道路并非一帆风顺。就在新品发布之际,X公司的首席执行官琳达·雅克里诺宣布离职,使得继任人选悬而未决。加之之前Grok模型因发表不当言论引发的争议,让外界对其可靠性产生了质疑。xAI正通过API接口开放Grok 4,并计划与超大规模云服务商合作,试图说服企业客户接受这一既具争议又拥有强大性能的AI模型。未来,Grok 4能否在市场上取得成功,还需观察其如何克服当前的种种挑战。
据Tech Church报道,Grok 4不仅能分析图像并回应问题,还深度整合了马斯克的社交网络平台X,使其能够提供更加实时和相关的信息。尽管外界对Grok 4寄予厚望,期待其能与OpenAI即将推出的GPT-5一决高下,但xAI近期面临的内部动荡以及Grok模型曾出现的反犹太言论争议,给这款产品的商业化前景蒙上了一层阴影。
xAI强调,Grok 4在解决学术问题方面已达到博士水平,甚至在某些领域超过了人类专家的能力。马斯克本人也在直播中表示:“Grok 4在所有学科上都优于博士,无一例外。”不过他也承认,模型有时可能缺乏常识,并未发明新技术或发现新的物理现象,但他认为这只是时间问题。
为了证明其强大性能,xAI公布了一系列基准测试成绩。例如,在衡量AI回答数千个人文、数学等领域众包问题能力的“Humanity's Last Exam”测试中,Grok 4在没有工具辅助的情况下获得了25.4%的分数,超越了Google Gemini 2.5 Pro的21.6%和OpenAI o3 (high)的21%。而在另一项视觉模式识别测试ARC-AGI-2中,Grok 4以16.2%的成绩创下新纪录,几乎是次世代商用模型Claude Opus 4得分的两倍。
第三方机构Artificial Analysis的评测结果显示,Grok 4在智慧指数中以73分的成绩位居榜首,紧随其后的是o3-pro(72分)、Gemini 2.5 Pro(70分)和o3(70分)。值得一提的是,在智慧指数排名前十名中,有两个由中国公司开发的模型:DeepSeek R1(68分)排名第6,Minimax M1 80k(63分)位列第10。
Grok 4具备多项亮点功能,包括进阶推理能力、多模态支持(文字、图像和语音输入)、专用编码模式(Grok 4 Code),以及通过检索增强生成(RAG)技术实现的即时检索与X平台整合。此外,Grok 4 Voice提供了更加自然流畅的语音互动体验,并且对网络文化有着深刻的理解,非常适合重度网络用户。
尽管Grok 4在技术层面表现抢眼,但其商业化道路并非一帆风顺。就在新品发布之际,X公司的首席执行官琳达·雅克里诺宣布离职,使得继任人选悬而未决。加之之前Grok模型因发表不当言论引发的争议,让外界对其可靠性产生了质疑。xAI正通过API接口开放Grok 4,并计划与超大规模云服务商合作,试图说服企业客户接受这一既具争议又拥有强大性能的AI模型。未来,Grok 4能否在市场上取得成功,还需观察其如何克服当前的种种挑战。






关闭返回