Anthropic 推出全新 Claude AI 模型和“计算机控制”

avatar
AI News
2 天前
本文为机器翻译
展示原文

Anthropic宣布升级其AI产品组合,包括增强的Claude 3.5 Sonnet模型和新推出的Claude 3.5 Haiku,以及公开测试版的"计算机控制"功能。

升级后的Claude 3.5 Sonnet在所有指标上都有显著改善,尤其是在编码能力方面取得了显著进步。该模型在SWE-bench Verified基准测试中获得了49.0%的成绩,超过了所有公开可用的模型,包括OpenAI的产品和专门的编码系统。

作为一项开创性的发展,Anthropic引入了计算机使用功能,使Claude能够像人类一样与计算机进行交互:查看屏幕、控制光标、点击和键入。这一功能目前处于公开测试阶段,标志着Claude 3.5 Sonnet成为首个提供此类功能的前沿AI模型。

几家主要科技公司已经开始实施这些新功能。

"升级后的Claude 3.5 Sonnet代表了AI编码的重大飞跃,"GitLab报告称,在不增加延迟的情况下,该模型在各种用例中的推理能力提高了高达10%。

新的Claude 3.5 Haiku模型计划于本月晚些时候发布,其性能与之前的Claude 3 Opus相匹配,同时保持了成本效益和速度。它在SWE-bench Verified基准测试中达到了40.6%,超过了许多竞争对手模型,包括原始的Claude 3.5 Sonnet和GPT-4o。

Model benchmarks comparing new Claude AI models from Anthropic.
(Credit: Anthropic)

关于计算机控制功能,Anthropic采取了谨慎的方法,承认了当前的局限性,同时也强调了潜在的可能性。在评估计算机界面导航的OSWorld基准测试中,Claude 3.5 Sonnet在仅使用截图的测试中达到了14.9%,明显优于下一个最佳系统的7.8%。

这些发展已经经过了严格的安全评估,在部署前与美国和英国AI安全研究所进行了合作测试。Anthropic表示,其负责任的扩展政策中详述的ASL-2标准仍然适用于这些模型。

(图片来源:Anthropic)

另见:IBM发布Granite 3.0 AI模型并承诺开源

想了解更多来自行业领导者的AI和大数据信息吗?请查看在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个全面的活动与其他领先的活动如Intelligent Automation ConferenceBlockXDigital Transformation WeekCyber Security & Cloud Expo同时举办。

您可以在这里探索由TechForge提供的其他即将到来的企业技术活动和网络研讨会here

本文最初发表于AI News

相关赛道:
来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论