xAI 是一家由埃隆·马斯克 (Elon Musk) 领导的初创公司,去年 12 月筹集了 60 亿美元,该公司拥有一种新的 AI 模型,据称该模型比 DeepSeek 和 ChatGPT 制造商 OpenAI 创建的 AI 更好。
在周一 X 的直播活动中,马斯克和三名 xAI 工程师展示了这家初创公司最新的 AI 模型 Grok 3。截至撰写本文时,该直播活动的观看次数已超过 600 万次。他们声称 Grok 3 在数学、科学和编码基准测试中的得分高于OpenAI 的 GPT-4o、DeepSeek 的 V3 和谷歌的 Gemini AI。
他们还表示,Grok 3 的强大性能比 xAI 8 月份发布的上一代 Grok 2 更高。最新版本的计算能力是 Grok 2 的 10 倍以上,准确率更高,并且具有更大的大型数据集容量。
马斯克在直播中说:“Grok 这个词的意思是充分而深刻地理解某件事。”他指出,这个词来自美国作家罗伯特·海因莱因 1961 年的小说《异乡异客》。他在直播中补充说:“如果你使用 Grok 3,你可能会注意到几乎每天都有改进,因为我们正在不断改进模型。”
xAI 工程师演示了如何使用 Grok 3 为航天器发射的动画 3D 图创建代码,该航天器从地球出发,降落在火星,然后返回地球。
工程师们还要求 Grok 将两款游戏《俄罗斯方块》和《宝石迷阵》合并成一款游戏。工程师们在直播中玩的这款游戏与《俄罗斯方块》类似,方块在屏幕上缓慢移动,但规则与《宝石迷阵》相似,方块颜色多样,如果三块方块连成一线就会消失。
马斯克表示,任何人工智能都可以在网上找到俄罗斯方块或宝石迷阵的例子并复制它们,但 Grok 3 更进一步。
“有趣的是,Grok 3 实现了一个创造性的解决方案,将两款游戏结合在一起,这确实是一款好游戏,”马斯克指出。“我们看到了创造力的开端。”
研究人员表示,他们只在数学问题和竞争性编码问题上训练了 Grok 3 的推理能力,但他们观察到 Grok 3 可以将所学到的知识应用到各种用例中,包括通过制作游戏进行推理。
xAI 并不是今年唯一一家发布先进 AI 的大型 AI 初创公司。上个月,OpenAI 发布了o3-mini,这是其迄今为止最具成本效益但功能最强大的模型,而DeepSeek 则推出了 R1,这是一款具有尖端性能的颠覆性 AI 模型,预算不到 600 万美元。
Grok 3目前可供Premium+ X 用户使用,每月支付 22 美元。