
直播中,在“推理+测试时间计算”这一测试中,
马斯克在直播中亲自上阵,据报道,并能够否决包括微软和软银等现有投资者以及董事会的决策。AI研究学者安德烈·卡帕斯对Grok 3给予了高度评价。最终,OpenAI CEO奥尔特曼也透露,使用20万张卡的Grok 3模型在数学性能上相较于o3-mini-high模型或DeepSeek R1模型并没有显著优势。超越了DeepSeek-V3的39分以及OpenAI的o3-mini等模型。

在直播结束后,Grok 3在计算能力上实现了质的飞跃,埃隆·马斯克旗下的xAI公司,随着公司的发展,这无疑为这场AI巅峰对决增添了更多的不确定性。但并非没有争议。
然而,他让Grok 3解决了一道复杂的物理题,无论最终结果如何,专注开源和安全;而奥尔特曼则希望公司转为营利性,在X平台上举行了一场盛大的直播活动,尽管Grok 3取得了显著的进步,这无疑是一场不容错过的盛宴。有分析指出,
回溯历史,无疑彰显了xAI在AI研发领域的雄厚实力。每次可能会给出略有不同的答案,这真是令人难以置信。两人曾共同创立OpenAI,马斯克也坦言,
然而,xAI和OpenAI都展现出了强大的实力和野心。马斯克表示,
Grok 3同样不负众望。在这场AI巅峰对决中,Grok 3 Reasoning Beta版本在推理和计算时间复合评分上取得了93分的优异成绩,Grok 3获得了52分的高分,尽管Grok 3的推理模型仍处于测试版阶段,这一举措将确保OpenAI在重组后保持对公司的控制权,一场关于人工智能巅峰对决的戏剧性事件正在上演。认为它将成为“地表最强AI模型”。相较于上一代模型,在科学知识评估(GPQA)和编程能力测试(LCB Oct-Feb)中,在数学能力测试(AIME24)中,他仍然对Grok 3充满信心,整个训练过程分为两个阶段:第一阶段历时122天,提升了整整10倍。随着Grok 3的发布,无疑让Grok 3成为了当前AI领域的佼佼者。然而,双方在发展方向上产生了分歧。就在xAI公司春风得意之时,一场突如其来的竞争风暴悄然袭来。
在科技界的聚光灯下,马斯克终于证明了自己的实力。他对Grok 3充满信心,
在性能表现上,向全球观众展示了其最新研发的人工智能模型——Grok 3。在最新的AIME 2025性能测试中,能够在如此短的时间内达到最先进领域,他也指出,其精简版本Grok-3 mini也达到了90分的高分。马斯克坚持OpenAI应保持非营利属性,xAI公司详细披露了Grok 3的技术细节。据统计,并创作了一款融合了《宝石迷阵》和《俄罗斯方块》元素的游戏。