[Tweet dài] Ngành công nghiệp AI năm 2025 quá ồn ào; tôi chỉ trích dẫn 10 câu này làm bản tóm tắt cuối năm của mình.

Bài viết này được dịch máy
Xem bản gốc

Tóm tắt Chainfeeds:

Thung lũng Silicon đang nỗ lực phát triển trí tuệ nhân tạo thành một "tác nhân biết suy luận", trong khi sự trỗi dậy của các lực lượng mã nguồn mở ở Trung Quốc đang phá vỡ thế độc quyền trong quá trình phát triển công nghệ này.

Nguồn bài viết:

https://x.com/nake13/status/2006027328766501223

Tác giả bài viết:

Chí Hùng Bàn


Quan điểm ​​:

Zhixiong Pan: 1) Karpathy: Tổng kết năm học Thạc sĩ Luật 2025. Chúng ta không phải là "động vật tiến hóa/sinh sản", mà là "triệu hồi ma". 2) Google DeepMind: Bảo mật của Trí tuệ Nhân tạo Phân tán (ADI). AGI không phải là một thực thể, mà là một "trạng thái": một nền kinh tế tác nhân thông minh phi tập trung tập trung, trưởng thành , trong đó nhân vật chính của con người là điều phối và xác minh. 3) OpenAI: Khoa học Tiên phong: Đánh giá khả năng của AI trong việc thực hiện nhiệm vụ khoa học cấp chuyên gia. Nhìn chung, chúng tôi nhận thấy rằng các hệ thống AI tiên phong đang có những tiến bộ nhanh chóng trong việc giải quyết các vấn đề suy luận cấp chuyên gia, đặc biệt là trong các bài toán Olympic độc lập; tuy nhiên, chúng vẫn còn xa mới đạt đến mức bão hòa trong nhiệm vụ nghiên cứu. 4) OpenAI: Tình trạng AI doanh nghiệp năm 2025. Sự chuyển dịch từ "yêu cầu đầu ra từ mô hình" sang "ủy thác các quy trình làm việc phức tạp, nhiều bước cho mô hình". 5) OpenRouter & a16z : Tình trạng của AI: Một nghiên cứu thực nghiệm về một nghìn tỷ token dựa trên OpenRouter. Trọng tâm của lĩnh vực này đang chuyển từ việc tạo ra mẫu lần hướng sang suy đoán luận đa bước có chủ đích. 6) Anthropic: AI đang thay đổi cách thức hoạt động của Anthropic như thế nào. Claude là một cộng tác viên liên tục, nhưng việc sử dụng nó thường yêu cầu sự giám sát và xác minh tích cực, đặc biệt là trong nhiệm vụ có rủi ro cao; thay vì chỉ đơn giản là giao nhiệm vụ mà không cần bất kỳ sự xác minh nào. 7) DeepSeek-V3.2: Dẫn đầu các mô hình ngôn ngữ lớn mã nguồn mở . DeepSeek-V3.2 có hiệu suất tương đương với GPT-5. 8) UC Berkeley / Stanford / IBM Research: Đánh giá tác nhân trong hoàn cảnh sản xuất. Độ tin cậy vẫn là thách thức phát triển quan trọng nhất, xuất phát từ khó khăn trong việc đảm bảo và đánh giá tính đúng đắn của hành vi tác nhân. 9) Anthropic: Tác nhân AI phát hiện ra lỗ hổng hợp đồng thông minh blockchain trị giá 4,6 triệu đô la. Việc khai thác lỗ hổng tự động có lợi nhuận trong thế giới thực là khả thi về mặt kỹ thuật. 10) DeepSeek-OCR: Nén quang học theo ngữ cảnh. Chúng tôi khám phá một giải pháp tiềm năng: sử dụng các phương thức hình ảnh như một phương tiện nén hiệu quả cho thông tin văn bản.

Nguồn nội dung

https://chainfeeds.substack.com

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận