Tổ chức: mới
Tại CES 2025 khai mạc sáng nay, người sáng lập kiêm Giám đốc điều hành NVIDIA Jensen Huang đã có bài phát biểu quan trọng mang tính bước ngoặt, tiết lộ tương lai của AI và điện toán. Từ khái niệm mã thông báo cốt lõi về việc tạo ra AI, đến việc phát hành GPU kiến trúc Blackwell mới, đến tương lai kỹ thuật số do AI thúc đẩy, bài phát biểu này sẽ ảnh hưởng sâu sắc đến toàn bộ ngành từ góc độ đa miền.
1) Từ AI sáng tạo đến AI tác nhân: sự khởi đầu của một kỷ nguyên mới
Sự ra đời của mã thông báo: Là động lực cốt lõi để tạo ra AI, mã thông báo biến văn bản thành kiến thức, truyền sức sống vào hình ảnh và mở ra một cách thể hiện kỹ thuật số mới.
Con đường tiến hóa AI: Từ AI nhận thức và AI tổng quát đến AI tác nhân có khả năng suy luận, lập kế hoạch và hành động, công nghệ AI tiếp tục đạt đến những tầm cao mới.
Cuộc cách mạng máy biến áp: Kể từ khi ra mắt vào năm 2018, công nghệ này đã định nghĩa lại điện toán và Sự lật đổ hoàn toàn nền tảng công nghệ truyền thống.
2) GPU Blackwell: Vượt qua giới hạn hiệu suất
Sê-Ri GeForce RTX 50 thế hệ mới : Dựa trên kiến trúc Blackwell, nó có 92 tỷ bóng bán dẫn, hiệu suất 4000 TOPS AI và tỷ lệ băm 4 PetaFLOPS, gấp ba lần hiệu suất của thế hệ trước.
Tích hợp AI và đồ họa: Lần đầu tiên, các bộ đổ bóng có thể lập trình và mạng lưới thần kinh được kết hợp, đồng thời giới thiệu công nghệ nén kết cấu thần kinh và tạo bóng vật liệu để mang lại hiệu ứng kết xuất ấn tượng.
Hiệu suất cao toàn diện: Máy tính xách tay RTX 5070 đạt được hiệu suất RTX 4090 ở mức giá 1.299 USD, thúc đẩy sự phổ biến của điện toán hiệu năng cao.
3) Mở rộng đa lĩnh vực ứng dụng AI
Tác nhân AI cấp doanh nghiệp: NVIDIA cung cấp các công cụ như Nemo và Llama Nemotron để giúp các doanh nghiệp xây dựng các nhân viên kỹ thuật số có khả năng suy luận tự chủ và đạt được các dịch vụ và quản lý thông minh.
AI vật lý: Thông qua nền tảng Omniverse và Cosmos , AI được tích hợp vào các lĩnh vực công nghiệp, lái xe tự động và robot, xác định lại hoạt động sản xuất và hậu cần toàn cầu.
Kịch bản điện toán trong tương lai: NVIDIA đang đưa AI từ đám mây đến các thiết bị cá nhân và bên trong doanh nghiệp, đáp ứng mọi nhu cầu điện toán từ nhà phát triển đến người dùng thông thường.
Sau đây là nội dung chính trong lần của Huang Renxun:
Đây là nơi khai sinh ra trí tuệ, một nhà máy hoàn toàn mới - một máy phát điện tạo ra token. Nó là mô-đun xây dựng của AI, mở ra một lĩnh vực mới và là bước đầu tiên bước vào một thế giới phi thường. Mã thông báo biến từ ngữ thành kiến thức và thổi sức sống vào hình ảnh; chúng biến ý tưởng thành video và giúp chúng ta điều hướng an toàn trong mọi hoàn cảnh; chúng dạy robot di chuyển như những bậc thầy và truyền cảm hứng cho chúng ta ăn mừng chiến thắng theo những cách mới. Token cũng có thể mang lại sự yên tâm khi chúng ta cần nó nhất. Chúng mang lại ý nghĩa cho các con số và giúp chúng ta hiểu rõ hơn về thế giới, dự đoán những mối nguy hiểm tiềm ẩn và tìm ra phương pháp chữa trị cho những mối đe dọa vốn có bên trong chúng. Nó có thể biến viễn cảnh mong đợi của chúng ta thành hiện thực và sửa chữa những gì chúng ta đã mất.
Tất cả những điều này trong AI bắt đầu vào năm 1993, khi NVIDIA tung ra sản phẩm đầu tiên, NV1. Chúng tôi muốn tạo ra những chiếc máy tính có thể làm được những việc mà máy tính bình thường không thể làm được, điều này giúp có thể có một máy chơi game bên trong PC. Sau đó, vào năm 1999, NVIDIA đã phát minh ra GPU có thể lập trình, mở ra hơn 20 năm tiến bộ công nghệ giúp tạo ra đồ họa máy tính hiện đại. Sáu năm sau, chúng tôi ra mắt CUDA để thể hiện khả năng lập trình GPU thông qua các thuật toán phong phú. Công nghệ này ban đầu khó lý giải nhưng đến năm 2012, sự thành công của AlexNet đã khẳng định tiềm năng của CUDA và thúc đẩy sự phát triển đột phá của AI.
Kể từ đó, AI đã phát triển với tốc độ đáng kinh ngạc. Từ AI nhận thức đến AI sáng tạo, đến AI tác nhân có thể nhận thức, suy luận, lập kế hoạch và hành động, khả năng của AI không ngừng được cải thiện. Năm 2018, Google ra mắt Transformer và thế giới AI thực sự cất cánh. Transformer không chỉ cách mạng hóa bối cảnh AI mà còn định nghĩa lại toàn bộ lĩnh vực điện toán. Chúng tôi nhận thấy rằng học máy không chỉ là một ứng dụng hay cơ hội kinh doanh mới mà còn là một sự đổi mới cơ bản trong điện toán. Từ việc viết hướng dẫn theo cách thủ công đến tối ưu hóa mạng lưới thần kinh bằng máy học, mọi lớp của nền tảng công nghệ đều đã thay đổi đáng kể.
Ngày nay, ứng dụng AI có ở khắp mọi nơi. Cho dù đó là hiểu văn bản, hình ảnh, âm thanh hay dịch axit amin và vật lý, nó đều có thể hoàn thành được. Hầu hết tất cả các ứng dụng AI có thể tóm tắt thành ba câu hỏi: Nó học những phương thức thông tin nào? Chế độ thông tin nào được dịch? Thông tin phương thức nào được tạo ra? Khái niệm cơ bản này thúc đẩy mọi ứng dụng dựa trên AI.
Tất cả những thành tựu này sẽ không thể đạt được nếu không có sự hỗ trợ của GeForce. GeForce đã đưa AI đến với đại chúng và giờ đây, AI đang quay trở lại GeForce. Với công nghệ dò tia thời gian thực, chúng tôi có thể kết xuất đồ họa với những hiệu ứng ấn tượng. Thông qua DLSS, AI thậm chí có thể vượt qua việc tạo khung hình và dự đoán hình ảnh trong tương lai. Chỉ có 2 triệu trong số 33 triệu pixel được tính toán và phần còn lại được tạo ra bởi dự đoán AI. Công nghệ kỳ diệu này thể hiện khả năng mạnh mẽ của AI, giúp tính toán hiệu quả hơn và cho phép chúng ta nhìn thấy những khả năng vô hạn trong tương lai.
Đây là lý do tại sao có rất nhiều điều tuyệt vời đang xảy ra ngay bây giờ. Chúng tôi đã vượt qua các ranh giới của AI bằng GeForce và giờ đây, AI đang cách mạng hóa GeForce. Hôm nay, chúng tôi xin công bố thế hệ sản phẩm tiếp theo – dòng RTX Blackwell. Chúng ta hãy xem xét.
Đây là sê-ri GeForce RTX 50 mới, dựa trên kiến trúc Blackwell. GPU này là một con quái vật về hiệu suất, với 92 tỷ bóng bán dẫn, 4000 TOPS hiệu suất AI và 4 PetaFLOPS tỷ lệ băm AI, cao gấp ba lần so với kiến trúc Ada thế hệ trước. Tất cả chỉ là về việc tạo ra những pixel tuyệt vời mà tôi vừa cho bạn xem. Nó cũng có 380 teraflop dò tia để mang lại chất lượng hình ảnh đẹp nhất có thể cho các pixel cần tính toán, cùng với 125 teraflop đổ bóng. Card đồ họa này sử dụng bộ nhớ video G7 của Micron, tốc độ 1,8TB/giây, hiệu năng gấp đôi thế hệ trước.
Giờ đây, chúng ta có thể kết hợp khối lượng công việc AI với khối lượng công việc đồ họa máy tính và một tính năng đáng chú ý của thế hệ này là các trình đổ bóng có thể lập trình cũng có thể xử lý các mạng thần kinh. Điều này dẫn chúng tôi đến việc phát minh ra tính năng nén kết cấu thần kinh và tạo bóng vật liệu thần kinh. Những công nghệ này sử dụng AI để tìm hiểu các thuật toán kết cấu và nén, cuối cùng tạo ra hiệu ứng hình ảnh tuyệt đẹp mà chỉ AI mới có thể đạt được.
Ngay cả về mặt thiết kế cơ học, card đồ họa này cũng là một điều kỳ diệu. Nó sử dụng thiết kế quạt kép, toàn bộ card đồ họa giống như một chiếc quạt khổng lồ và mô-đun điều chỉnh điện áp bên trong là tiên tiến nhất. Thiết kế xuất sắc như vậy hoàn toàn là nhờ nỗ lực của đội ngũ kỹ sư.
Tiếp theo là so sánh hiệu suất. RTX 4090 quen thuộc có giá 1599 USD là khoản đầu tư cốt lõi cho một trung tâm giải trí PC tại nhà. Giờ đây, sê-ri RTX 50 mang lại hiệu suất cao hơn, chỉ bắt đầu từ $549, từ RTX 5070 đến RTX 5090, với hiệu suất gấp đôi RTX 4090.
Điều tuyệt vời hơn nữa là chúng tôi đã đưa GPU hiệu năng cao này vào một chiếc notebook. Máy tính xách tay RTX 5070 có giá 1.299 USD nhưng có hiệu năng của RTX 4090. Thiết kế này kết hợp AI và công nghệ đồ họa máy tính để đạt được hiệu quả sử dụng năng lượng và hiệu suất cao.
Tương lai của đồ họa máy tính sẽ là kết xuất thần kinh - sự kết hợp giữa AI và đồ họa máy tính. Sê-Ri Blackwell thậm chí có thể được triển khai trên các máy tính xách tay có độ dày chỉ 14,9 mm và toàn bộ sê-ri sản phẩm từ RTX 5070 đến RTX 5090 đều có thể được điều chỉnh cho phù hợp với máy tính xách tay siêu mỏng.
GeForce đã giúp phổ biến AI và giờ đây AI đang cách mạng hóa GeForce. Đây là sự thúc đẩy lẫn nhau giữa công nghệ và trí thông minh, và chúng ta đang hướng tới một cảnh giới cao hơn.
Ba định luật mở rộng của AI
Tiếp theo, hãy nói về hướng phát triển của AI.
1) Luật Scaling trước khi đào tạo
Ngành công nghiệp AI đang mở rộng với tốc độ nhanh chóng, được thúc đẩy bởi một mô hình mạnh mẽ có tên là “Luật mở rộng”. Quy tắc ngón tay cái này đã được các nhà nghiên cứu và ngành công nghiệp xác minh nhiều lần, cho thấy kích thước của dữ liệu huấn luyện càng lớn, mô hình càng lớn và sức mạnh tính toán càng được đầu tư thì mô hình sẽ càng mạnh.
Tốc độ tăng trưởng của dữ liệu đang tăng tốc theo cấp số nhân. Người ta ước tính rằng trong vài năm tới, lượng dữ liệu do con người tạo ra hàng năm sẽ vượt quá tổng lượng dữ liệu được tạo ra trong toàn bộ lịch sử loài người trước đây. Dữ liệu này đang trở nên đa phương thức, bao gồm video, hình ảnh và âm thanh. Dữ liệu khổng lồ này có thể được sử dụng để đào tạo hệ thống kiến thức cơ bản về AI và đặt nền tảng kiến thức vững chắc cho AI.
2) Luật Scaling sau đào tạo
Ngoài ra, còn có hai Luật Scaling khác đang xuất hiện.
Loại Luật mở rộng thứ hai là "Luật mở rộng sau đào tạo", liên quan đến các công nghệ như học tập tăng cường và phản hồi của con người. Bằng cách này, AI tạo ra câu trả lời dựa trên các truy vấn của con người và liên tục cải thiện chúng dựa trên phản hồi của con người. Loại hệ thống học tập tăng cường này giúp AI cải thiện kỹ năng trong các lĩnh vực cụ thể thông qua các gợi ý chất lượng cao, chẳng hạn như giải quyết các vấn đề toán học hoặc thực hiện suy luận phức tạp tốt hơn.
Tương lai của AI không chỉ là về nhận thức và sự hình thành mà còn là một quá trình liên tục hoàn thiện và phá vỡ ranh giới. Nó giống như có một người cố vấn hoặc huấn luyện viên đưa ra phản hồi sau khi bạn hoàn thành nhiệm vụ. Thông qua thử nghiệm, phản hồi và tự cải thiện, AI cũng có thể cải thiện thông qua các cơ chế phản hồi và học tập củng cố tương tự. Giai đoạn học tăng cường sau đào tạo này kết hợp với các kỹ thuật tạo dữ liệu tổng hợp tương tự như quá trình tự đào tạo. AI có thể đối diện những câu đố phức tạp và có thể chứng minh được, chẳng hạn như chứng minh các định lý hoặc giải các bài toán hình học, đồng thời liên tục tối ưu hóa các câu trả lời của mình thông qua học tăng cường. Kiểu đào tạo sau này, mặc dù đòi hỏi sức mạnh tính toán khổng lồ, nhưng cuối cùng có thể tạo ra những mô hình phi thường.
3) Luật mở rộng thời gian thử nghiệm
Scalling Law cũng dần xuất hiện trong thời gian thử nghiệm. Định luật này cho thấy tiềm năng độc đáo khi AI thực sự được sử dụng. AI có thể phân bổ tài nguyên một cách linh hoạt trong quá trình suy luận, không còn giới hạn ở việc tối ưu hóa tham số mà tập trung vào phân bổ tính toán để tạo ra các câu trả lời chất lượng cao cần thiết.
Quá trình này tương tự như tư duy suy luận hơn là suy đoán trực tiếp hoặc câu trả lời một lần. AI có thể chia một vấn đề thành nhiều bước, tạo và đánh giá nhiều giải pháp và cuối cùng chọn ra giải pháp tốt nhất. Suy luận dài hạn này có tác động đáng kể đến việc cải thiện khả năng của mô hình.
Chúng tôi đã chứng kiến sự phát triển của công nghệ này, từ ChatGPT đến GPT-4 và bây giờ là Gemini Pro, với tất cả các hệ thống này đều trải qua quá trình phát triển dần dần về mở rộng thời gian đào tạo trước, sau đào tạo và thử nghiệm. Để đạt được những đột phá này đòi hỏi sức mạnh tính toán cực lớn, vốn là giá trị cốt lõi của kiến trúc Blackwell của NVIDIA.
Giới thiệu mới nhất về kiến trúc Blackwell
Hệ thống Blackwell đang được sản xuất hoàn chỉnh và hiệu suất của nó thật đáng kinh ngạc. Ngày nay, mọi nhà cung cấp dịch vụ đám mây đều đang triển khai các hệ thống này, được sản xuất tại 45 nhà máy trên khắp thế giới và hỗ trợ tới 200 cấu hình, bao gồm làm mát bằng chất lỏng, làm mát không khí, kiến trúc x86 và các phiên bản CPU NVIDIA Grace.
Thành phần cốt lõi của nó, chính hệ thống NVLink, nặng tới 1,5 tấn, có 600.000 bộ phận, tương đương với độ phức tạp của 20 ô tô và được kết nối sau 2 dặm dây đồng và 5.000 dây cáp. Toàn bộ quá trình sản xuất cực kỳ phức tạp nhưng mục tiêu là đáp ứng nhu cầu ngày càng mở rộng về điện toán.
So với kiến trúc thế hệ trước, Blackwell mang lại hiệu suất cải thiện gấp 4 lần trên mỗi watt và cải thiện gấp 3 lần về hiệu suất trên mỗi đô la. Điều này có nghĩa là kích thước của mô hình được đào tạo có thể tăng lên gấp 3 lần với cùng một mức chi phí và chìa khóa đằng sau những cải tiến này là việc tạo ra mã thông báo AI. Các mã thông báo này được sử dụng rộng rãi trong ChatGPT, Gemini và các dịch vụ AI khác nhau và là cơ sở cho điện toán trong tương lai.
Trên cơ sở đó, NVIDIA đã thúc đẩy một mô hình điện toán mới: kết xuất thần kinh, tích hợp hoàn hảo AI và đồ họa máy tính. 72 GPU theo kiến trúc Blackwell tạo thành hệ thống chip đơn lớn nhất thế giới, cung cấp hiệu năng dấu phẩy động AI lên tới 1,4 ExaFLOPS và băng thông bộ nhớ của nó đạt mức đáng kinh ngạc 1,2 PB/s, tương đương với tổng lưu lượng truy cập Internet trong thế giới. Sức mạnh siêu điện toán này cho phép AI xử lý nhiệm vụ suy luận phức tạp hơn đồng thời giảm đáng kể chi phí, tạo nền tảng cho tính toán hiệu quả hơn.
Hệ thống và hệ sinh thái AI Agent
Nhìn về tương lai, quá trình suy luận của AI không còn là phản ứng đơn giản trong một bước mà gần hơn với một “cuộc đối thoại nội bộ”. AI của tương lai sẽ không chỉ đưa ra câu trả lời mà còn phản ánh, suy luận và liên tục tối ưu hóa. Khi tốc độ tạo mã thông báo AI tăng lên và chi phí giảm xuống, chất lượng dịch vụ AI sẽ được cải thiện đáng kể để đáp ứng nhiều nhu cầu ứng dụng hơn.
Để giúp các doanh nghiệp xây dựng hệ thống AI có khả năng suy luận tự chủ, NVIDIA cung cấp ba công cụ chính: NVIDIA NeMo, AI microservice và thư viện tăng tốc. Bằng cách đóng gói phần mềm CUDA phức tạp và các mô hình học độ sâu vào các dịch vụ được đóng gói, doanh nghiệp có thể triển khai các mô hình AI này trên bất kỳ nền tảng đám mây nào và nhanh chóng phát triển Tác nhân AI cho các lĩnh vực cụ thể, chẳng hạn như công cụ dịch vụ hỗ trợ quản lý doanh nghiệp hoặc nhân viên kỹ thuật số để tương tác với người dùng.
Những mô hình này mở ra những khả năng mới cho doanh nghiệp, không chỉ hạ thấp ngưỡng phát triển cho các ứng dụng AI mà còn thúc đẩy toàn ngành tiến một bước vững chắc theo hướng Agentic AI (AI tự trị). AI trong tương lai sẽ trở thành nhân viên kỹ thuật số có thể dễ dàng tích hợp vào các công cụ doanh nghiệp như SAP và ServiceNow để cung cấp dịch vụ thông minh cho khách hàng trong hoàn cảnh khác nhau. Đây là cột mốc quan trọng tiếp theo trong mở rộng AI và viễn cảnh mong đợi cốt lõi của hệ sinh thái công nghệ NVIDIA.
Hệ thống đánh giá đào tạo Trong tương lai, các Đại lý AI này về cơ bản sẽ là lực lượng lao động kỹ thuật số sát cánh cùng nhân viên để hoàn thành nhiệm vụ cho bạn. Do đó, việc giới thiệu những đại lý chuyên nghiệp này cho công ty của bạn cũng giống như giới thiệu nhân viên mới. Chúng tôi cung cấp các thư viện công cụ khác nhau để giúp các Đại lý AI này học ngôn ngữ, từ vựng, quy trình việc kinh doanh và phương pháp làm việc riêng của công ty. Bạn cần cung cấp cho họ các ví dụ về sản phẩm công việc mà họ sẽ cố gắng tạo ra, sau đó bạn có thể cung cấp phản hồi, tiến hành đánh giá, v.v. Bạn cũng sẽ đặt ra các hạn chế như những gì họ không thể làm hoặc nói và kiểm soát những thông tin họ có thể truy cập. Toàn bộ quá trình lực lượng lao động kỹ thuật số này được gọi là Nemo. Ở một mức độ nào đó, bộ phận CNTT của mọi công ty sẽ trở thành bộ phận nhân sự của Đại lý AI.
Ngày nay, bộ phận CNTT quản lý và duy trì lượng lớn phần mềm; trong tương lai, họ sẽ quản lý, đào tạo, đào tạo và cải tiến lượng lớn các đại lý kỹ thuật số để cung cấp dịch vụ cho công ty. Vì vậy, bộ phận IT sẽ dần phát triển thành bộ phận nhân sự con người AI Agent.
Ngoài ra, chúng tôi còn cung cấp nhiều bản thiết kế mã nguồn mở để hệ sinh thái sử dụng. Người dùng có thể tự do sửa đổi các bản thiết kế này. Chúng tôi cung cấp bản thiết kế cho tất cả các loại Đại lý khác nhau. Hôm nay, chúng tôi cũng đã công bố một điều rất thú vị và thông minh: chúng tôi đã ra mắt dòng mô hình mới dựa trên Llama, sê-ri mô hình cơ sở ngôn ngữ NVIDIA Llama Nemo TRON .
Llama 3.1 là một mô hình phi thường. Llama 3.1 của Meta đã được tải xuống khoảng 350.650.000 lần và đã tạo ra khoảng 60.000 mô hình khác. Đây là một trong những lý do cốt lõi thúc đẩy hầu hết các công ty và ngành công nghiệp bắt đầu nghiên cứu AI. Chúng tôi nhận thấy rằng mô hình Llama có thể được tinh chỉnh tốt hơn cho các trường hợp sử dụng của doanh nghiệp. Tận dụng chuyên môn và khả năng của mình, chúng tôi đã tinh chỉnh nó thành Bộ mô hình mở Llama Nemotron.
Các mô hình có nhiều kích cỡ khác nhau: mô hình nhỏ có khả năng phản hồi rất nhanh; Super Llama Nemotron phổ thông là mô hình đa năng; và Mô hình Ultra có thể được sử dụng làm mô hình giáo viên để đánh giá các mô hình khác, đưa ra câu trả lời và xác định chất lượng của chúng, hoặc Được sử dụng như một mô hình chắt lọc kiến thức. Tất cả các mô hình này hiện có sẵn ra mắt.
Những mô hình này hoạt động cực kỳ tốt và đứng đầu bảng xếp hạng trong các lĩnh vực như đối thoại, hướng dẫn và truy xuất thông tin, khiến chúng trở nên lý tưởng cho các chức năng của tác nhân AI trên toàn thế giới.
Chúng tôi cũng hợp tác rất chặt chẽ với hệ sinh thái, chẳng hạn như hợp tác với ServiceNow, SAP và Siemens trong lĩnh vực AI công nghiệp. Các công ty như Cadence và Perplexity cũng đang thực hiện những dự án lớn. Sự bối rối Sự lật đổ việc tìm kiếm và Codium phục vụ 30 triệu kỹ sư phần mềm trên khắp thế giới. Trợ lý AI sẽ cải thiện đáng kể năng suất của các nhà phát triển phần mềm, đây là lĩnh vực ứng dụng khổng lồ tiếp theo cho các dịch vụ AI. Có 1 tỷ công nhân tri thức trên thế giới và AI Agent có thể là ngành công nghiệp robot tiếp theo, có tiềm năng đạt tới hàng nghìn tỷ đô la.
Kế hoạch chi tiết về đặc vụ AI
Tiếp theo, chúng tôi hiển thị một số bản thiết kế Tác nhân AI đã hoàn thành với các đối tác.
Đại lý AI là lực lượng lao động kỹ thuật số mới có thể hỗ trợ hoặc thay thế con người trong việc hoàn thành nhiệm vụ. Mô-Đun xây dựng Agentic AI của NVIDIA, các mô hình được đào tạo trước NEM và khung Nemo giúp các tổ chức dễ dàng phát triển và triển khai Tác nhân AI. Các tác nhân này có thể được đào tạo để trở thành chuyên gia nhiệm vụ của một miền cụ thể.
Dưới đây là bốn ví dụ:
Đại lý Trợ lý Nghiên cứu: Có thể đọc các tài liệu phức tạp như bài giảng, tạp chí, báo cáo tài chính, v.v. và tạo podcast tương tác để dễ học;
Bảo mật phần mềm AI Agent: Giúp nhà phát triển liên tục quét các lỗ hổng phần mềm và nhắc nhở thực hiện các biện pháp tương ứng;
Phòng thí nghiệm ảo AI Agent: tăng tốc thiết kế và sàng lọc hợp chất, đồng thời nhanh chóng tìm ra các loại thuốc tiềm năng;
Tác nhân AI phân tích video: Dựa trên bản thiết kế NVIDIA Metropolis, nó phân tích dữ liệu từ hàng tỷ camera và tạo ra các tìm kiếm, tóm tắt và báo cáo tương tác. Ví dụ: giám sát lưu lượng giao thông, quy trình của cơ sở, đưa ra đề xuất cải tiến, v.v.;
Sự xuất hiện của kỷ nguyên AI vật lý
Chúng tôi hy vọng có thể đưa AI từ đám mây đến mọi ngóc ngách, kể cả trong các công ty và PC cá nhân. NVIDIA đang nỗ lực để biến Windows WSL 2 (Hệ thống con Windows) thành nền tảng được lựa chọn để hỗ trợ AI. Điều này sẽ giúp các nhà phát triển và kỹ sư sử dụng kho công nghệ AI của NVIDIA dễ dàng hơn, bao gồm mô hình ngôn ngữ, mô hình hình ảnh, mô hình hoạt hình, v.v.
Ngoài ra, NVIDIA còn ra mắt Cosmos, nền tảng phát triển mô hình cơ bản đầu tiên cho thế giới vật chất, tập trung vào việc tìm hiểu các đặc tính động của thế giới vật chất, như trọng lực, ma sát, quán tính, mối quan hệ không gian, mối quan hệ nhân quả, v.v. Nó có thể tạo ra các video và cảnh tuân thủ các quy luật vật lý và được sử dụng rộng rãi trong việc đào tạo và xác minh robot, AI công nghiệp và các mô hình ngôn ngữ đa phương thức.
Cosmos cung cấp mô phỏng vật lý bằng cách kết nối với NVIDIA Omniverse để tạo ra kết quả mô phỏng thực tế và đáng tin cậy. Sự kết hợp này là công nghệ cốt lõi để phát triển robot và các ứng dụng công nghiệp.
Chiến lược công nghiệp của NVIDIA dựa trên ba hệ thống máy tính:
Hệ thống DGX đào tạo AI;
hệ thống AGX triển khai AI;
Hệ thống song sinh kỹ thuật số để học tăng cường và tối ưu hóa AI;
Thông qua hoạt động hợp tác của ba hệ thống này, NVIDIA thúc đẩy sự phát triển của robot và AI công nghiệp cũng như xây dựng thế giới kỹ thuật số trong tương lai Thay vì nói đây là vấn đề của ba cơ thể, chúng tôi có giải pháp "ba máy tính".
Viễn cảnh mong đợi Robotics của Nvidia Hãy để tôi chỉ cho bạn ba ví dụ.
1) Ứng dụng trực quan hóa công nghiệp
Hiện có hàng triệu nhà máy và hàng trăm nghìn nhà kho trên khắp thế giới, tạo thành xương sống của ngành sản xuất trị giá 50 nghìn tỷ USD. Trong tương lai, tất cả điều này sẽ cần được xác định và tự động hóa bằng phần mềm, kết hợp với robot. Chúng tôi hợp tác với Keon, nhà cung cấp giải pháp tự động hóa kho hàng hàng đầu thế giới và Accenture, nhà cung cấp dịch vụ chuyên nghiệp lớn nhất thế giới, tập trung vào sản xuất kỹ thuật số, để tạo ra một số giải pháp rất đặc biệt. Phương pháp tiếp thị của chúng tôi tương tự như các nền tảng phần mềm và công nghệ khác, thông qua các nhà phát triển và đối tác hệ sinh thái, đồng thời ngày càng nhiều đối tác hệ sinh thái được kết nối với nền tảng Omniverse. Điều này là do mọi người đều muốn hình dung ra tương lai của ngành. Trong GDP toàn cầu trị giá 50 nghìn tỷ USD này, có rất nhiều chất thải và rất nhiều cơ hội cho tự động hóa.
Hãy xem ví dụ về Keon và Accenture làm việc với chúng tôi:
Keon (một công ty giải pháp Chuỗi cung ứng), Accenture (công ty hàng đầu thế giới về dịch vụ chuyên nghiệp) và NVIDIA đang đưa AI vật lý vào thị trường trung tâm phân phối và kho hàng nghìn tỷ đô la. Quản lý kho vận hiệu quả đòi hỏi phải xử lý một mạng lưới các quyết định phức tạp bị ảnh hưởng bởi các biến số luôn thay đổi như thay đổi nhu cầu hàng ngày và theo mùa, hạn chế về không gian, nguồn cung lao động và sự tích hợp của các hệ thống tự động hóa và robot đa dạng. Ngày nay, việc dự đoán chỉ báo hiệu suất hoạt động chính (KPI) cho một kho hàng thực tế là gần như không thể.
Để giải quyết những vấn đề này, Keon đang sử dụng Mega, một bản thiết kế NVIDIA Omniverse, để xây dựng các bản sao kỹ thuật số công nghiệp nhằm thử nghiệm và tối ưu hóa đội robot. Đầu tiên, giải pháp quản lý kho hàng của Keon giao nhiệm vụ cho các bộ não AI công nghiệp trong cặp song sinh kỹ thuật số, chẳng hạn như di chuyển hàng hóa từ các vị trí đệm đến các giải pháp lưu trữ đưa đón. Đội robot thực hiện nhiệm vụ thông qua nhận thức và suy luận trong hoàn cảnh mô phỏng nhà kho vật lý trong Omniverse, lập kế hoạch cho bước đi tiếp theo và thực hiện hành động. Hoàn cảnh song sinh kỹ thuật số sử dụng mô phỏng cảm biến để bộ não robot có thể nhìn thấy trạng thái sau khi nhiệm vụ được thực hiện và quyết định hành động tiếp theo. Với khả năng theo dõi chính xác của Mega, toàn bộ chu trình vẫn tiếp tục trong khi đo lường các KPI hoạt động như thông lượng, hiệu quả và mức sử dụng, tất cả trước khi thực hiện thay đổi đối với kho vật lý.
Với NVIDIA, Keon và Accenture đang xác định lại tương lai của quyền tự chủ công nghiệp.
Trong tương lai, mỗi nhà máy sẽ có một bản song sinh kỹ thuật số được đồng bộ hóa hoàn toàn với nhà máy thực tế. Bạn có thể sử dụng Omniverse và Cosmos để tạo ra lượng lớn các kịch bản trong tương lai và AI sẽ xác định kịch bản KPI tối ưu và sử dụng nó làm các ràng buộc cũng như logic lập trình AI để triển khai nhà máy thực tế.
2) Xe tự lái
Cuộc cách mạng lái xe tự động đã đến. Sau nhiều năm phát triển, sự thành công của cả Waymo và Tesla đã chứng minh sự trưởng thành của công nghệ lái xe tự động. Các giải pháp của chúng tôi cung cấp cho ngành này ba loại hệ thống máy tính: hệ thống đào tạo AI (như hệ thống DGX), hệ thống thử nghiệm mô phỏng và tạo dữ liệu tổng hợp (như Omniverse và Cosmos) và hệ thống máy tính trong ô tô (chẳng hạn như AGX hệ thống). Hầu hết tất cả các công ty ô tô lớn trên thế giới đều đang hợp tác với chúng tôi, bao gồm Waymo, Zoox, Tesla và BYD, công ty xe điện lớn nhất thế giới. Ngoài ra còn có các hãng như Mercedes, Lucid, Rivian, Xiaomi và Volvo sắp tung ra các mẫu xe cải tiến. Aurora đang sử dụng công nghệ Nvidia để phát triển xe tải tự lái.
100 triệu ô tô được sản xuất mỗi năm và 1 tỷ ô tô được lái trên các con đường trên thế giới, tổng cộng hàng nghìn tỷ dặm được lái mỗi năm. Những điều này sẽ dần dần trở nên tự động hóa cao hoặc hoàn toàn. Ngành công nghiệp này dự kiến sẽ trở thành ngành công nghiệp chế tạo robot trị giá hàng nghìn tỷ đô la đầu tiên.
Hôm nay, chúng tôi xin công bố Thor, máy tính trên xe thế hệ tiếp theo của chúng tôi. Nó là một máy tính robot đa năng có khả năng xử lý lượng lớn dữ liệu từ camera, radar độ phân giải cao, lidar và các cảm biến khác. Thor là phiên bản nâng cấp của Orin tiêu chuẩn công nghiệp hiện tại, với sức mạnh tính toán gấp 20 lần và hiện đang được sản xuất hàng loạt. Đồng thời, Drive OS của NVIDIA là hệ điều hành máy tính AI đầu tiên được chứng nhận đáp ứng tiêu chuẩn cao nhất về an toàn chức năng (ISO 26262 ASIL D).
Nhà máy dữ liệu lái xe tự động
NVIDIA sử dụng mô hình Omniverse AI và nền tảng Cosmos để tạo ra một nhà máy dữ liệu lái xe tự động nhằm mở rộng đáng kể dữ liệu đào tạo thông qua các tình huống lái xe tổng hợp. Điều này bao gồm:
OmniMap: Sự kết hợp giữa bản đồ và dữ liệu không gian địa lý để xây dựng hoàn cảnh 3D có thể điều khiển được;
Công cụ tái tạo thần kinh: Sử dụng nhật ký cảm biến để tạo hoàn cảnh mô phỏng 4D có độ chính xác cao và tạo các biến thể cảnh cho dữ liệu huấn luyện;
Chỉnh sửa 3DS: Tìm kiếm hoặc tạo tài sản mới từ thư viện tài sản để tạo cảnh mô phỏng.
Thông qua những công nghệ này, chúng tôi mở rộng lần kịch bản lái xe thành hàng tỷ dặm dữ liệu để phát triển hệ thống lái xe tự động an toàn hơn và tiên tiến hơn.
3) Robot vạn năng
Kỷ nguyên của robot phổ quát đang đến. Chìa khóa để thúc đẩy những đột phá trong lĩnh vực này là đào tạo. Đối với các robot hình người, việc lấy được dữ liệu mô phỏng là tương đối khó khăn, nhưng Isaac Groot của NVIDIA đã đưa ra giải pháp. Nó tạo ra các tập dữ liệu khổng lồ thông qua mô phỏng và kết hợp các công cụ mô phỏng đa vũ trụ của Omniverse và Cosmos để đào tạo, xác minh và triển khai chính sách.
Ví dụ: với Apple Vision Pro, các nhà phát triển có thể vận hành robot từ xa, thu thập dữ liệu mà không cần robot vật lý và dạy các chuyển động nhiệm vụ trong hoàn cảnh không rủi ro . Thông qua chức năng ngẫu nhiên hóa miền của Omniverse và chức năng mở rộng từ 3D sang cảnh thực, các bộ dữ liệu tăng trưởng theo cấp số nhân được tạo ra, cung cấp nguồn tài nguyên khổng lồ cho việc học tập của rô-bốt.
Nói tóm lại, cho dù đó là trực quan hóa công nghiệp, lái xe tự động hay robot thông thường, công nghệ của NVIDIA đang dẫn đầu những thay đổi trong tương lai trong lĩnh vực AI vật lý và robot.
Cuối cùng, tôi có một điều quan trọng khác muốn trình bày. Tất cả những điều này không thể tách rời khỏi một dự án có tên Project Digits mà chúng tôi đã bắt đầu trong công ty cách đây mười năm. Tên đầy đủ là Hệ thống đào tạo trí thông minh GPU Độ sâu Learning, được gọi là Digits.
Trước khi ra mắt chính thức, chúng tôi đã điều chỉnh DGX để hài hòa với RTX, AGX, OVX nội bộ của công ty và sê-ri sản phẩm khác. Sự ra đời của DGX1 đã thực sự thay đổi hướng phát triển của AI và đây cũng là cột mốc quan trọng trong quá trình phát triển AI của NVIDIA.
Cuộc cách mạng DGX1
Mục đích ban đầu của DGX1 là cung cấp cho các nhà nghiên cứu và các công ty khởi nghiệp một siêu máy tính AI sẵn có. Hãy tưởng tượng rằng các siêu máy tính trước đây yêu cầu người dùng xây dựng các cơ sở chuyên dụng và thiết kế cũng như xây dựng cơ sở hạ tầng phức tạp để hiện thực hóa sự tồn tại của chúng. DGX1 là siêu máy tính được thiết kế đặc biệt để phát triển AI. Nó không yêu cầu các thao tác phức tạp và có thể sử dụng ngay lập tức.
Tôi vẫn nhớ rằng vào năm 2016, tôi đã giao chiếc DGX1 đầu tiên cho một công ty khởi nghiệp OpenAI. Vào thời điểm đó, Elon Musk, Ilya Sutskever và nhiều kỹ sư NVIDIA đã có mặt và chúng tôi đã cùng nhau kỷ niệm sự xuất hiện của DGX1. Thiết bị này thúc đẩy đáng kể sự phát triển của điện toán AI.
Ngày nay, AI có mặt ở khắp mọi nơi. Không chỉ giới hạn ở các tổ chức nghiên cứu và phòng thí nghiệm khởi nghiệp, như tôi đã đề cập ở phần đầu, AI đã trở thành một phương thức phát triển phần mềm và điện toán hoàn toàn mới. Mọi kỹ sư phần mềm, nghệ sĩ sáng tạo và thậm chí cả người dùng công cụ máy tính thông thường đều cần một siêu máy tính AI. Nhưng tôi luôn ước DGX1 có thể nhỏ hơn.
Siêu máy tính AI mới nhất
Dưới đây là những siêu máy tính AI mới nhất của Nvidia. Nó vẫn thuộc về Project Digits. Chúng tôi vẫn đang tìm kiếm một cái tên hay hơn và hoan nghênh những đề xuất của bạn. Đây thực sự là một thiết bị tuyệt vời.
Siêu máy tính có thể chạy kho phần mềm AI hoàn chỉnh của Nvidia, bao gồm cả DGX Cloud. Nó có thể được sử dụng như một siêu máy tính đám mây, một máy trạm hiệu suất cao hoặc thậm chí là một máy trạm phân tích trên máy tính để bàn. Điều tuyệt vời nhất là nó dựa trên một con chip mới mà chúng tôi đã bí mật phát triển, có tên mã là GB110, đây là con chip Grace Blackwell nhỏ nhất mà chúng tôi từng tạo ra.
Tôi có một con chip trong tay để cho bạn xem thiết kế bên trong của nó. Con chip này được phát triển với sự hợp tác của MediaTek, công ty SoC hàng đầu thế giới. CPU SoC được tùy chỉnh cho Nvidia và sử dụng công nghệ kết nối chip-to-chip NVLink để kết nối với GPU Blackwell. Con chip nhỏ hiện đang được sản xuất đầy đủ. Chúng ta kỳ vọng siêu máy tính này sẽ chính thức có mặt vào khoảng tháng 5
Chúng tôi thậm chí còn cung cấp cấu hình "tỷ lệ băm kép", có thể kết nối các thiết bị này với nhau thông qua ConnectX và hỗ trợ công nghệ truyền qua GPU (GPUDirect). Nó là một bộ giải pháp siêu máy tính hoàn chỉnh có thể đáp ứng các nhu cầu khác nhau về phát triển AI, công việc phân tích và ứng dụng công nghiệp.
Ngoài ra, hãng cũng công bố sản xuất hàng loạt ba chip hệ thống Blackwell mới, mô hình cơ bản AI vật lý đầu tiên trên thế giới và những đột phá trong ba lĩnh vực robot chính - robot AI Agent tự động, robot hình người và ô tô tự lái.