Đồng sáng lập của OpenAI, Ilya Sutskever, đã chỉ ra tại Hội nghị Hệ thống Xử lý Thần kinh (NeurIPS) ở Vancouver, Canada vào ngày 15/12 rằng sự phát triển của Trí tuệ Nhân tạo (AI) đã đến một điểm chuyển tiếp quan trọng, với công nghệ tiền huấn luyện đang dần đạt đến giới hạn, và sẽ hướng tới Trí tuệ Nhân tạo Siêu việt (Artificial Super Intelligence, ASI) trong tương lai.
Mục lục
ToggleDữ liệu tiền huấn luyện AI gặp "trần" và sự chuyển đổi là tất yếu
Sutskever cho biết trong hội nghị rằng kỷ nguyên tiền huấn luyện AI sắp kết thúc. Ông cho rằng lượng dữ liệu trên internet đã gần đạt đến giới hạn, và trong tương lai sẽ cần có các công nghệ mới để tiếp tục thúc đẩy AI tiến tới giai đoạn tiếp theo, cuối cùng là phát triển Trí tuệ Nhân tạo Siêu việt (ASI).
Sutskever chỉ ra rằng, mặc dù năng lực tính toán của AI đã được cải thiện đáng kể nhờ sự tiến bộ của phần cứng, phần mềm và thuật toán, nhưng lượng dữ liệu để huấn luyện AI lại không thể tăng vô hạn. Sutskever ví dữ liệu như "nhiên liệu hóa thạch" của AI, và nói rằng: "Dữ liệu không thể tăng trưởng vô tận, vì internet chỉ có một. Dữ liệu giống như nhiên liệu hóa thạch của AI, hiện đã gần cạn kiệt, vì vậy trong tương lai chúng ta phải tìm cách tận dụng tối đa lượng dữ liệu hiện có."
(Lưu ý: Mô hình tiền huấn luyện là những mô hình đã học được các kiến thức cơ bản, không cần phải bắt đầu từ đầu.)
Ba công nghệ then chốt thúc đẩy sự phát triển của AI
Mặc dù Sutskever đã chỉ ra những vấn đề mà AI đang gặp phải, nhưng ông cũng đề xuất ba công nghệ then chốt có thể ảnh hưởng đến sự tiến hóa của AI thành Trí tuệ Nhân tạo Siêu việt (ASI) trong tương lai:
- AI tự chủ (Agentic AI): Có thể tự đưa ra quyết định và thực hiện nhiệm vụ mà không cần sự can thiệp của con người, có thể điều chỉnh hành vi dựa trên mục tiêu và môi trường. Khác với AI Agent chủ yếu là thụ động hoặc hành động theo logic cố định, cần nhiều can thiệp của con người hơn.
- Dữ liệu tổng hợp (Synthetic Data): Sử dụng AI để tự động tạo ra dữ liệu mô phỏng chất lượng cao, giải quyết vấn đề thiếu dữ liệu. Ví dụ: để huấn luyện một mô hình AI nhận dạng các phương tiện đang lưu thông, nhưng dữ liệu giao thông thực tế không đủ, chúng ta có thể sử dụng kỹ thuật tổng hợp để "tạo ra" nhiều phương tiện và cảnh huống mô phỏng.
- Tính toán thời gian suy luận (Inference Time Computing): Nâng cao năng lực tính toán của các mô hình AI, giúp AI có thể giải quyết các vấn đề phức tạp nhanh hơn.
Sutskever tin rằng ba công nghệ này có thể thúc đẩy AI hiện tại tiến hóa thành "Trí tuệ Nhân tạo Siêu việt" (ASI).
Cơn sốt AI lan tràn thị trường blockchain và LLM
Khái niệm về AI Agent không chỉ được quan tâm trong lĩnh vực công nghệ, mà nhiều đồng tiền meme và mô hình ngôn ngữ lớn (LLMs) cũng bắt đầu tích hợp công nghệ AI, như AI Agent Truth Terminal tự quảng bá đồng tiền meme GOAT trên các nền tảng truyền thông xã hội, khiến giá trị vốn hóa thị trường đã tăng lên 600 triệu USD, thậm chí Marc Andreessen - nhà sáng lập quỹ đầu tư nổi tiếng a16z, cũng bày tỏ sự ngạc nhiên trước Truth Terminal.
Trường hợp nổi tiếng gần đây về việc kết hợp AI Agent với mô hình ngôn ngữ lớn là Gemini 2.0 do Google DeepMind giới thiệu. Theo thông báo chính thức của Google, Gemini 2.0 có thể trực tiếp tạo ra hình ảnh, văn bản, thậm chí chuyển đổi văn bản thành giọng nói với các hiệu ứng âm thanh khác nhau, đồng thời có thể trực tiếp sử dụng Google Search, chạy mã nguồn, và kết hợp với các công cụ bên thứ ba do người dùng tùy chỉnh.
Ưu thế của AI tự chủ, giải quyết vấn đề "ảo giác AI"
Sutskever chỉ ra rằng AI tự chủ và tính toán thời gian suy luận có thể giúp giải quyết vấn đề "ảo giác" (AI Hallucinations) trong quá trình huấn luyện AI. "Ảo giác AI" là khi do thiếu dữ liệu huấn luyện, mô hình AI có thể tạo ra thông tin sai lệch hoặc không chính xác. Khi các mô hình AI mới vẫn phụ thuộc vào dữ liệu từ các mô hình cũ, vấn đề này sẽ ngày càng trở nên nghiêm trọng.
Sutskever cho biết, để giải quyết vấn đề "ảo giác", AI tự chủ có thể tăng cường khả năng suy luận và tính toán thời gian thực để hiệu quả phân biệt dữ liệu chính xác và không chính xác, từ đó nâng cao độ tin cậy và hiệu suất của AI.
Trước vấn đề "ảo giác AI" do giới hạn dữ liệu huấn luyện, quan điểm của Sutskever không hoàn toàn giống với CEO Nvidia, Jensen Huang. Trước đó, Huang cũng đã chỉ ra vấn đề này trong một cuộc phỏng vấn, và đề xuất ba giai đoạn quan trọng để cải thiện "ảo giác" trong tương lai:
Huấn luyện sơ bộ:
- Đây là giai đoạn cơ bản của AI, thông qua việc hấp thụ lượng lớn dữ liệu từ thế giới thực, AI sẽ "học hỏi" và "khám phá" các loại kiến thức, nhưng đây chỉ là bước khởi đầu, chưa đủ sâu sắc.
Huấn luyện nâng cao:
- Đây là giai đoạn tăng cường khả năng của AI, thông qua phản hồi từ con người, như đánh giá điểm số, cũng như phản hồi từ chính AI và sử dụng dữ liệu tổng hợp để mô phỏng thêm các tình huống. Lúc này sẽ áp dụng các kỹ thuật như học tăng cường, học đa nhánh, giúp AI tập trung cải thiện các kỹ năng cụ thể và hiểu rõ hơn cách giải quyết vấn đề.
Thời gian kiểm tra mở rộng (Test Time Scaling):
- Giai đoạn này có thể được hiểu là khi AI bắt đầu "suy nghĩ". Khi gặp phải vấn đề phức tạp, AI sẽ phân tích vấn đề từng bước, mô phỏng lại nhiều giải pháp khác nhau, sau đó liên tục điều chỉnh để tìm ra câu trả lời tối ưu nhất. Huang Renhun cho rằng, nếu cung cấp cho AI thêm "thời gian suy nghĩ", câu trả lời của nó có thể chính xác hơn hoặc chất lượng cao hơn.
Cảnh báo rủi ro
Đầu tư vào tiền điện tử có rủi ro cao, giá của chúng có thể biến động mạnh, bạn có thể mất toàn bộ số vốn đầu tư. Vui lòng đánh giá rủi ro một cách cẩn trọng.