博士级 AI?马斯克 xAI 推出 Grok 4:多代理推理、预测市场功能一次看

马斯克领军的人工智慧公司 xAI 几个小时前正式发表最新一代 AI 模型 Grok 4,号称为「地表最聪明 AI」。该模型结合前所未有的推理能力、博士级学术水准与多工具使用的整合,并在多项基准测试中打破纪录。他预期 Grok 4 将在一年内带来实质性的技术发明或学术意义。

两版本:Grok 4 与 Grok 4 Heavy

首先,Grok 4 分为单纯的单代理版本 (Single-Agent Version) 的 Grok 4、以及多代理版本 (Multi-Agent Version) 的 Grok 4 Heavy。

  • Grok 4:基础版本,以单一 AI agent 处理问题。
  • Grok 4 Heavy:采用多代理协作模式 (multi-agent collaboration),让多个代理先各自解决问题,再如同「学习小组」般互相分享解决方案并比较彼此成果,再得出最终答案。

目前,该公司也推出了至今最昂贵的订阅计划「SuperGrok Heavy」,每月 300 美元。计划订阅者能抢先体验 Grok 4 Heavy 服务,以及未来所推出功能的优先使用权。

博士等级智慧:从 SAT 满分到全领域天才

再来,xAI 声称 Grok 4 具有超越人类的学术与逻辑能力,成为现阶段最接近通用人工智慧 (AGI) 的模型之一。他能在美国 SAT、GRE等高等考试中获得近乎满分的成绩,并在所有学科表现出博士以上等级的知识涵养。

另外,Grok 4 在多项指标性基准测试中创下新高,展现前所未见的能力边界。具体包括:

  • 在困难研究生问题 (GPQA)、美国数学考试 (AIME 2025)、美国数学奥林匹克竞赛 (USAMO) 等高难度数理逻辑挑战均在现有 AI 模型中排名第一。
  • 在 Vending-Bench 自动贩卖机商业营运模拟测试中,成功让资产收入翻倍,展现出稳定且贯彻始终的策略制定能力。

  • 生物医学研究中心 ARC Institute 以 Grok 4 协助自动化其研究流程,高效率推动实验进行。

其他还有医疗影像检查、金融策略制定与游戏开发等领域皆已存在实际应用。

同时,在人类终极测验 (Humanity’s Last Exam, HLE) 中,Grok 4 能在无辅助情况下解出 25.4% 题目,Grok 4 Heavy 版本则能够解出 44.4% 的题目,在现有 AI 模型中排名第一。

用 Colossus 超级电脑训练 Grok 4,运算效率大提升

xAI 透露,Grok 4 的问世背后,是来自硬体与训练策略的双重飞跃:「Grok 4 的训练量是 Grok 2 的 100 倍。」

借由我们的 Colossus 超级电脑约 20 万颗 H100 GPU,从预训练到强化学习 (RLHF),Grok 4 强化了模型对推理任务的专注与精确度。

团队强调,随著人类编写的考题难度已「无法有效训练」Grok 4,现实世界将成为最终的测试场所,像是能否真正创造有用的发明或技术,借以判断它们是否实际有效

工具整合与现实互动:Grok 4 迈向可操作性 AI

同时,Grok 4 也不只是会思考,更将学会如何动手解决真实世界问题。xAI 表明,不同于其他模型,Grok 4 将工具使用能力纳入训练流程,提升实作与应变能力:

未来几个月内,Grok 4 将接入特斯拉和 SpaceX 使用的工程分析工具,进入更精密的工程环境。我们更计划在今年底前向各大公司提供强大的企业级工具与高度精确的物理模拟器。

团队补充,「当前目标是让 Grok 能操纵人形机器人 Optimus,并在物理世界中验证其逻辑与创意的真实与有效性。」

(辉达黄仁勋:华为晶片已追上 NVIDIA H20,马斯克 Optimus 机器人开启兆元商机)

超越人类的推理能力:Grok 4 能创造新发明?

再来是 xAI 最引以为傲的推理功能,Grok 4 不仅能从训练资料中提取知识,更具备经强化训练所培养的的逻辑思考能力,能在未知情境中自行构建问题解法,并进行多代理的集体思辨验证,最终跟人类科学家一样推导出自己的结论:

Grok 4 被设计为从「第一性原理」出发的思考方式,能自行发现问题、建构逻辑并完成复杂的演绎,这是其他与以往 AI 难以触及的推理场域。

xAI 预期,Grok 4 将在最早今年前、最晚明年发明出真正实用的新技术,并于未来两年内可能发现目前人类还未知的科学原理。

(专访马斯克:AI 超级智慧将爆发、创业者应追求「有用」而非「伟大」的人生)

从市场预测到游戏创作:Grok 4 应用层面再次扩大

最后,xAI 也展示了 Grok 4 横跨语音互动与金融商业等多领域的实际应用潜力。以事件趋势判读为例,Grok 4 Heavy 能够查看预测市场 Polymarket、运用统计计算与推理能力,仅用几分钟便预测出道奇队在世界大赛的胜率为 21.6%,展现出超越传统量化分析工具的即时运算实力。

Grok 4 透过 Polymarket 数据推估道奇队在 MLB 世界大赛的胜率

(X 宣布与 Polymarket 合作,作为官方预测市场伙伴)

Grok 的未来愿景也令人惊艳,xAI 表示,未来版本将加入影片理解与游戏互动能力,能够游玩游戏并判断所谓「乐趣」,甚至整合游戏引擎自行创造互动与艺术内容。包括电视节目、电影作品与电玩游戏等。

语音方面,Grok 4 的表现也有重大升级。新版模型引入多种声音风格与口音,使对话更加自然且流畅。发布会上还刻意与 GPT 做比较,凸显 Grok 4 不仅不会打断使用者,也大大缩短了思考与回应的延迟时间,成为其介面的一大亮点。

Grok 4 不只是工具,更成人类文明推进器

Grok 4 的诞生,不仅代表 AI 迈入更深入的思考与应用阶段,据马斯克所述,更有望引发一场横跨教育、科学、商业与创意产业的智慧革命,而 Grok 将真正参与其中,而非仅是从旁协助的语言模型或辅助工具。

xAI 开发团队的未来愿景宏大而激进,他们强调:「AI 如今已不再只是帮我们思考,而是与我们共同创造世界。」

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

川普媒体 Truth Social 于 7/10 宣布一项名为「爱国者方案」(Patriot Package) 的全新订阅制电视串流服务,正式开放公测,同时还提供免费试用连结,给用户抢先体验。

Patriot Package 提供哪些功能?

这个「爱国者方案」主打「超快速串流」、「非觉醒」(Non-Woke) 的新闻频道与更多影片内容,同时与 Truth Social 深度整合。目前这项服务开放公测中,用户也可免费使用,而爱国者方案付费用户可享有以下几项服务:

  • 可观看高画质、超低延迟的「非觉醒」新闻频道

  • 获得更多高品质随机影片与动态内容

  • 享有在 Truth Social 上留言,能加强曝光的功能

  • 帐号会显示红色勾勾

  • 拿到专属的 Truth+ 认证徽章

「宝石代币」功能即将推出

根据 Trump Media 官方表示,未来将会依照用户在 Truth Social 和 Truth+ 上的互动程度,让爱国者方案订阅户能累积「宝石」(Gems) 点数。这些宝石预计将进一步与平台专属的「功能型代币」挂钩,成为在 Truth 生态系中可用的数位资产。

目前官方也公开征求社群意见,鼓励用户参与投票,选出自己最喜欢的宝石设计图案。

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

日前风投机构 ArkStream Capital 共同创办人 Ye Su 在推特上控诉,该公司两年前投了一个专案,去年上线币安。但该专案却在上币前一周,以生态补贴的名义偷偷增发 60%。直到今年快解锁了,才告诉投资人: 他们投的是增发前的 FDV,不是增发 60% 后的 FDV。随著知情人士补充更多细节,该专案的背景也逐渐浮出台面,各种证据都指向去中心化算力专案 io.net。

风投机构泪诉:入行八年第一次遇到不守信用的专案

ArkStream Capital 共同创办人 Ye Su 在推特上控诉,该公司两年前投了一个专案,去年上线币安。但该专案却在上币前一周,以生态补贴的名义偷偷增发 60%。直到今年快解锁了,才告诉投资人: 他们投的是增发前的 FDV,不是增发 60% 后的 FDV。他表示自己投了 8 年的加密货币专案,第一次遇到这种操作。

他联络了十几家共同参投的投资人,发现大家都很不满意,但大家都在等领投方表达意见。听到这,他已经被气笑了,因为这个专案就是领投方孵化。他说现在只有他们公司还在追进度、每周和专案方沟通、要说法。他认为加密货币产业走到今天,专案方互相比烂,这事该有人破窗。

KOL 补充细节:该专案卖算力丶一众豪华机构抬轿丶创办团队有币安员工

KOL 加密无畏进一步指出:这垃圾专案去年 TGE 前增发 60%,你们 VC 不说话。上线前被骇客攻击了,你们 VC 不出声。TGE 前,前台的 CEO 被换了,你们全力支持。空投时反撸了那么多用户,骂声铺天盖地,你们 VC 装没听到。上线后专案方一直在 OTC 出货,有些机构还在帮忙卖额度。你们那么用力的背书,用上币安的预期做行销,专案方卖算力就从散户这里募了几千万 U。

一个几乎满足了所有失败因素的专案,就因为有一众豪华的机构抬轿子,共同创办人里面还有 2 个 Binance 的前员工,就这样几十亿美元 FDV 上了各大所。现在高点跌了快 90%,轮到 VC 解锁了,专案方开始不认了,伤害到你们利益了,你们才公开发声著急了。

众多线索指向 io.net 就是该争议协议

留言区马上就有人点名 DePin 专案 io.net:

  • 去年登陆 Binance:2024 年 6 月 11 号作为第 55 个 Launchpool 专案上线。
  • TGE 前 CEO 被换: 2024 年 6 月 9 号,创办人 Ahmad Shadid 请辞,COO Tory Green 接任。
  • 团队含前 Binance 成员:官方团队页列出多位「Previously @ Binance」成员 (笔者补充:包含执行长 Gaurav Sharma丶产品长 Raj Karan 皆来自币安。
  • 卖算力/DePIN 模式:官方定位 Decentralized GPU Cloud for AI (面向人工智慧的去中心化 GPU 云)。
  • VC 背书豪华:包含 Multicoin、Delphi、Animoca 等。
  • 解锁前后 FDV 争议:公开 Tokenomics 后私募及团队占比高,引发 FDV 争议。
  • 价格高点回落超过 80%:首日高点 $4.5 ,目前$0.68,跌幅约 85 %。

值得注意的是,Ye Su 表示该专案是由领投方孵化。io.net 的领投方 Hack VC,也正是先前 KOL Mosi 点名,拉高出货的投机者。

(SOON单日暴跌40%!背后影子创办人浮出台面,疑似为连续创业惯犯)

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

马斯克旗下社群平台 X 执行长 Linda Yaccarino 于今晨 7/10 宣布辞职, 随后 xAI 与特斯拉 (Tesla) 的技术高层也接连请辞,这波高层离职潮是否与马斯克近期的政治风波有关,引发外界关注。

Yaccarino 接手残局,屡次为马斯克与X激进言论辩护

Yaccarino 是在推特改名为 X、内部动荡时接手,当时马斯克裁掉约 75% 员工,又因当时许多广告商担心品牌内容会受到平台上的仇恨言论、暴力内容影响。而 Yaccarino 的主要任务,就是要稳住广告生意,重建企业信任。

不过这场「广告危机」仍未解决。据报导,X 在 2023 年的广告营收暴跌 50%,同年马斯克又转发「反犹太言论」,让多家品牌业者暂停与 X 合作,马斯克甚至还在一场活动对广告商呛声:

「去你妈的,不下广告就拉倒!」

尽管如此,Yaccarino 在任职期间仍屡次为马斯克与 X 辩护,包括回应外界对 X 上的暴力内容、反犹言论与假讯息增加的批评。马斯克反犹太言论爆出后,Yaccarino 当时仍写信向内部员工喊话:

「我们坚持的价值不能被标价,永远不会妥协。」

xAI 并吞 X 与 Grok 爆粗口问题不断,Yaccarino 早有去意

马斯克今年 3 月宣布旗下的 AI 新创 xAI 正式并吞 X,合并估值为 330 亿美元。

尽管 Yaccarino 名义上仍是 X 执行长,但实际上并未参与母公司「xAI Holdings」的整体营运,表示她权力已被削弱。

Grok 爆出多起言论争议,Yaccarino 早有去意

就在她宣布辞职的同一周,xAI 的 AI 聊天机器人 Grok 连续爆出多起不当言论,包括针对犹太人与波兰政界人物的粗俗评论。土耳其政府甚至警告可能封锁该平台,波兰也呼吁欧盟介入调查。据了解,Yaccarino 早在这波 Grok 言论风波前就有辞职打算,与此事件无直接关联。

马斯克政治风波不断,xAI 与特斯拉高层也接连请辞

就在 Yaccarino 宣布请辞后的一小时,美国投资公司执行长 Azoria Partners 也爆出 Tesla 软体工程副总裁与 xAI 基础设施工程主管也请辞。

对此,Partners 表示马斯克的「创党」行动已明显影响外界对于特斯拉的未来信心,更呼吁董事会立刻召开会议,要求马斯克说明创党计划是否仍与执行长职位相容。同时警告马斯克:

「如果无法专心投入特斯拉业务,就要考虑交棒!」

图为 Yaccarino 宣布辞职后一小时,特斯拉与 xAI 也惊爆高层离职

马斯克科技帝国是否摇摇欲坠,仍有待观察

自从马斯克年初在美国总统大选支持川普后,担任政府效率部 (DOGE) 削减开支,紧接著又因《大而美》减税法案和川普反目成仇,随后又宣布创立「美国党」以制衡两党权力。一连串政治动作让内部高层感觉到马斯克已开始「失焦」,无法兼顾企业营运,因而纷纷出走。马斯克的科技帝国是否正摇摇欲坠,仍有待观察。

(马斯克宣布成立「美国党」!瞄准国会关键席次挑战两党政治)

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论