马斯克旗下的人工智慧新创公司 xAI 持续为 Grok 注入新功能。马斯克亲自在社群平台 X 上介绍 Grok 的最新功能,透过相机进行即时影像解析,只要将镜头对准任何物体,询问 Grok「这是什么?」,Grok 就能立即分析画面内容,给出详细说明,甚至进一步进行推理与延伸解读。
Grok 最初以「敢讲真话、带点幽默感」作为定位,被视为马斯克对抗主流 AI 产品的重要布局,与其他大型语言模型不同,Grok 强调即时性与与 X 平台和 Chatbot 聊天机器人的深度整合,能即时参考平台上的公开资讯与热门讨论。过去媒体曾形容 Grok 是一款更贴近社群脉动、回应风格更直接的 AI 助手。

Grok 推出拍照立即解析功能
Grok 的拍照立即解析功能,让 Grok 正式跨入多模态 AI 的应用场景。根据马斯克的介绍,用户可以扫描笔记、地点、绘画、文件,甚至是外语文字,Grok 都能进行辨识、分析与翻译。不论是在学习、工作、旅行、烹饪,或只是出于好奇想了解眼前的事物,这项功能都能即时派上用场。

实测 Grok 拍照与分析功能
实际测试中,笔者使用手机拍摄一个日常水壶,询问 Grok「这是什么?」。令人意外的是,大约五秒时间,Grok 不仅成功判断这是一个可重复使用的塑胶饮用水瓶,还进一步推测其品牌来源。即使瓶身上并未标示品牌 Logo,Grok 仍分析指出该水壶为日本百元商店连锁品牌大创(Daiso)所贩售的商品,容量约在 400 至 500 毫升之间。
Grok 聊天机器人跟你分享「它」的延伸回馈
更有趣的是,Grok 并未止步于物品辨识,而是对瓶身设计与文字进行延伸解读。瓶身上印有「earthiness」字样,并搭配一句英文标语 Life is only once. Live a wonderful life.(人生只有一次,活出精彩人生)。Grok 指出这类略显直白、甚至带点生硬的英文格言,在日本生活用品设计中相当常见,常被用来营造正向、励志的生活氛围。Grok 甚至尝试将这段文字与「日式生活美学」连结,做出带有推理成分的评论。
在产品使用细节描述上,Grok 也提到水壶采用旋盖式设计,结合翻盖式吸嘴,顶部附有提把或挂环,方便使用者外出携带或挂在背包上。这类结构常见于通勤、运动或轻度户外活动的水壶产品,符合百元商店强调实用与性价比的定位。
从这次实测可以看出 Grok 的影像理解能力已不仅停留在「看图说故事」,而是尝试结合物件特征、文化背景与语意推理,提供更完整的解释,这也呼应马斯克一贯的主张:AI 不该只是冷冰冰的工具,而应该能像人类一样观察、思考,甚至对细节产生评论。
随著 Grok 持续进化,外界也在观察,Grok 结合社群即时资讯与多模态能力的聊天机器人,是否能在竞争激烈的人工智慧赛道中,走出一条属于自己的路线。对一般用户来说,拿起手机、对准世界,直接用语音询问「我看到的是什么?」或许正是 AI 真正融入日常生活的开始。
这篇文章 AI 实测:Grok 拍照分析新功能登场,一键看懂眼前世界 最早出现于 链新闻 ABMedia。






