Ultraman: o1 chỉ là "GPT-2 của mô hình suy luận" Huang Renxun: Tôi sẽ tăng tốc cho bạn gấp 50 lần;

avatar
36kr
15 giờ trước
Bài viết này được dịch máy
Xem bản gốc

Hai trong số những người có ảnh hưởng nhất trong ngành AI xuất hiện cùng lúc tại một sự kiện:

Giám đốc điều hành OpenAI Ultraman gợi ý rằng phiên bản đầy đủ của o1 sẽ được phát hành trong vài tháng tới.

Người sáng lập NVIDIA Huang Jensen cho biết GPU kiến ​​trúc Blackwell thế hệ mới có thể tăng tốc độ suy luận O1 lên 50 lần.

Altman so sánh địa vị của o1 trong mô hình suy luận với giai đoạn GPT-2 trong mô hình ngôn ngữ.

Trong một vài năm nữa, chúng ta sẽ thấy "GPT-4 của các mô hình suy luận", nhưng với những cải tiến đáng kể trong những tháng gần đây, đường cong tiến bộ của mô hình mới là rất dốc.

“Lý do” L2 rất khác với “chatbot” L1. Mọi người vẫn chưa tìm ra cách sử dụng các mô hình này và chúng tôi chưa quyết định sẽ thêm chức năng nào vào APP.

Nhưng điều thú vị nhất là “đặc vụ” L3 sẽ đến rất nhanh.

Một số giáo sư y khoa đã cân nhắc việc từ chức khi họ nhìn thấy điều này.

Nghe nói, sê-ri o1 đã chính thức bước vào đấu trường mô hình lớn Lmsys, lần điểm số quyết toán và họ dẫn đầu ở nhiệm vụ toán học . Hạn chế duy nhất là câu trả lời hơi chậm.

Quan điểm của Lão Hoàng về vấn đề này là:

GPU kiến ​​trúc Blackwell mới nhất của NVIDIA cải thiện hiệu suất suy luận lên 50 lần, nghĩa là nó có thể rút ngắn thời gian phản hồi của mô hình o1 từ vài phút xuống còn vài giây.

Nội dung trên xuất phát từ ngày T-Mobile Capital Markets Day T-Mobile vừa ký một đơn đặt hàng lớn với OpenAI để hợp tác xây dựng hệ thống dịch vụ khách hàng hỗ trợ AI.

Tuy nhiên, tại sự kiện này, ngoài sự hợp tác giữa một số công ty, hai nhà lãnh đạo ngành còn chia sẻ nhiều nội dung đáng quan tâm xung quanh hiện tại và tương lai của AI.

Về cách o1 thực hiện nhiệm vụ khác ngoài toán học và mã hóa, vui lòng xem bản dịch sau đây của văn bản gốc do o1 dẫn dắt và được hỗ trợ bởi qubit.

Ultraman: Bí quyết của OpenAI là niềm tin và sự tập trung

Người dẫn chương trình: Trước tiên tôi muốn chúc mừng bạn về việc ra mắt mẫu o1. Có lẽ bạn có thể giới thiệu mẫu mới này với khán giả vì nó thực sự tuyệt vời.

Sam Altman: Vâng, chúng tôi rất vui mừng về điều đó và đó là điều chúng tôi đã làm trong một thời gian dài. Sê-Ri mô hình GPT vượt trội về tư duy kiểu "Hệ thống 1", nhưng điều chúng tôi thực sự muốn là một hệ thống có thể suy luận.

Nếu trí tuệ nhân tạo có thể giải quyết được những vấn đề phức tạp hơn thì giá trị của nó sẽ rất lớn. Bạn đã thấy một số gợi ý về nó trong mô hình GPT-4, nhưng o1 thực sự là hệ thống đầu tiên có khả năng suy luận cấp cao. Cho dù đó là một thử thách lập trình phức tạp, một bài toán hay một câu đố khoa học, bạn đều có thể đạt được những kết quả thực sự phi thường. Chúng tôi tin rằng theo thời gian, điều này sẽ trở nên quan trọng như sê-ri GPT và mở ra sê-ri các kịch bản ứng dụng mới và có giá trị.

Người điều hành: Bạn đã tuyên bố công khai rằng những gì chúng ta đang thấy bây giờ là phiên bản xem trước và nó sẽ được lặp lại nhanh chóng. Điều gì sẽ xảy ra trong vài tháng tới?

Sam Altman: Tôi cho rằng các mô hình suy luận mới hiện nay tương tự như những gì chúng tôi đã có trong thời kỳ GPT-2. Bạn sẽ thấy nó phát triển đến mức tương đương với GPT-4 trong vài năm tới. Thậm chí trong vài tháng tới, bạn sẽ thấy sự tiến bộ đáng kể khi chúng tôi nâng cấp từ phiên bản o1-preview lên phiên bản chính thức của o1.

Tôi cho rằng trong đó trong nhiều điều thú vị về những thời điểm xuất hiện mô hình mới này là đường cong cải tiến rất dốc. Một số vấn đề mà mô hình ngày nay không thể giải quyết được nhưng lại có thể giải quyết được trong vài tháng, thậm chí nhiều hơn trong vài tháng. Quan trọng nhất, chúng ta sẽ thấy một loạt cách sử dụng hoàn toàn mới, không chỉ giao diện trò chuyện. Chúng tôi cần một thời gian để xây dựng những tính năng này, thời gian cho những tính năng khác và thời gian để người dùng thích ứng. Điều này rất khác với mô hình GPT.

Chúng ta nói về 5 cấp độ của AI: L1 là chatbot (ChatBot), L2 là người suy luận (Reasoner) mà chúng ta vừa đạt tới, L3 là tác nhân (Agent) và L4 là người đổi mới (Innovator), có khả năng khám phá. Thông tin khoa học mới, L5 là tổ chức hoàn chỉnh.

Phải mất một thời gian để chuyển từ L1 sang L2, nhưng tôi cho rằng một trong những điều thú vị nhất về L2 là khả năng đạt L3 tương đối nhanh chóng và chúng tôi dự đoán rằng các tác nhân mà công nghệ này cuối cùng sẽ kích hoạt sẽ có tác động rất lớn.

(Bỏ qua trao đổi thương mại)

Moderator: Đổi chủ đề một chút, tại sao OpenAI lại dẫn đầu? Bạn đang làm gì khác biệt trong lĩnh vực này để cho phép bạn phát triển những mô hình này với tốc độ này?

Sam Altman: Trước hết, cảm ơn bạn đã khen ngợi. Đó là một đánh giá rất tốt. Chúng tôi xây dựng dựa trên lượng lớn công trình trước đây Trí tuệ nhân tạo là một lĩnh vực cũ và mọi người đã đóng góp những ý tưởng rất hay cho nó trong một thời gian dài. Hãy nghĩ về tất cả công việc mà con người đã làm trong suốt lịch sử loài người để khám phá chất bán dẫn, chế tạo chip, xây dựng mạng và các trung tâm dữ liệu khổng lồ này, và ngoài những việc đó, chúng ta chỉ mới thực hiện được một phần nhỏ của riêng mình.

Nhưng chúng tôi cố gắng làm hết sức mình và cố gắng có một chương trình nghiên cứu thật tập trung. Tôi cho rằng một trong những sai lầm mà các chương trình nghiên cứu khác mắc phải là họ không có đủ niềm tin và sự tập trung. Một khi một cái gì đó hoạt động, rất dễ dàng để sao chép nó.

Vì vậy, tôi cho rằng hai cách để thành công là trở thành người theo dõi nhanh chóng và sao chép những gì OpenAI hoặc các công ty thành công khác đang làm và tôi không có ý nói điều đó theo cách tiêu cực vì tôi cho rằng có rất nhiều công ty đang làm như vậy. chỉ chờ xem những gì hoạt động và sau đó thực hiện tốt công việc cải thiện nó và thực hiện nó.

Hoặc cố gắng vượt qua giới hạn, điều này rất khó khăn và đòi hỏi niềm tin cũng như sự tập trung của nhiều người trong một hoàn cảnh phức tạp, là cách tốt nhất để tiến về phía trước. Đó là những gì chúng tôi cố gắng làm.

Chúng tôi thực sự tin tưởng vào độ sâu learning và chúng tôi thực sự tin tưởng vào con đường từ vị trí hiện tại đến AGI và hơn thế nữa, nhưng chúng tôi sẵn sàng sửa chữa dựa trên những gì chúng tôi học được trong quá trình thực hiện. Chúng tôi sẽ tiếp tục làm việc chăm chỉ để thực hiện điều tiếp theo với khả năng tốt nhất của mình và tin rằng điều này sẽ có tác động phúc lợi theo thời gian.

Nó thực sự hiệu quả với chúng tôi, phương pháp đơn giản.

Jen-Hsun Huang: Những người trẻ tuổi sẽ có những chú robot đồng hành cùng họ suốt cuộc đời

(Bỏ qua một phần lớn nội dung trao đổi thương mại và việc kinh doanh của T-mobile)

Người dẫn chương trình: Chúng tôi vừa nói chuyện với Sam Altman về sự phát triển nhanh chóng của AI trong đó một trong những điều đó là AI cần độ trễ cực thấp, thời gian phản hồi nhanh. Vì AI đang chuyển từ dạng văn bản truyền thống sang phản hồi theo thời gian thực đối với video, nét mặt và tương tác với hình đại diện nên điều này đòi hỏi tốc độ phản hồi cực cao. Khối lượng công việc AI trong tương lai sẽ đòi hỏi sức mạnh tính toán trong các mạng gần với khách hàng.

Jen -Hsun Huang: Thật vậy, chúng tôi hiện đang tích hợp điện toán vô tuyến và điện toán AI vào một kiến ​​trúc. Chiếc máy tính mà chúng tôi xây dựng này có độ trễ cực thấp và có thể xử lý các giao dịch nhạy cảm với thời gian. -Dịch vụ thoại chất lượng.

Điều mọi người không nhận ra là mạng không dây trên khắp thế giới rất dư thừa. Lý do dư thừa là chất lượng dịch vụ cực kỳ cao phải được cung cấp khi ai đó cần. Nhưng khi không ai cần, cơ sở hạ tầng đó sẽ không hoạt động và có thể được tái sử dụng.

Vì vậy, khi chúng tôi làm cho nó được xác định bằng phần mềm, tăng tốc, có khả năng xử lý AI, giờ đây chúng tôi biến toàn bộ mạng thành dung lượng dư thừa có thể được sử dụng cho các cơ hội khác khi cần. Đây sẽ là cơ hội tăng trưởng mới rất lớn cho ngành viễn thông.

Người dẫn chương trình: Tôi rất thích nó. Chúng ta còn vài phút nữa và trước khi để bạn rời đi, hãy chuyển sang chế độ khác và nói về điều khiến bạn hào hứng.

NVIDIA có một viễn cảnh đáng kinh ngạc vì tất cả những người đi đầu trong lĩnh vực AI đều đang làm việc cùng bạn. Điều gì khiến bạn phấn khích khi nghĩ về việc công nghệ có tính biến đổi lớn nhất trong đời chúng ta đang thực sự thay đổi cuộc sống của con người như thế nào? Bạn cho rằng AI sẽ tác động đến tất cả chúng ta như thế nào?

Jen-Hsun Huang: Tất cả chúng ta đều sẽ có một số lượng lớn trợ lý kỹ thuật số làm việc cùng mình. Tôi thực sự thích ý tưởng rằng tôi sẽ có một chiếc máy tính, theo thời gian, sẽ hoạt động cùng tôi, ngày càng thông minh hơn, hiểu tôi và giúp tôi hoàn thành nhiệm vụ. Tôi thích việc mình sẽ có R2-D2 và C-3PO (droid từ Star Wars) của riêng mình.

R2 của tôi sẽ luôn theo tôi. Đối với nhiều người trẻ, họ sẽ có chiếc R2 của riêng mình để sử dụng suốt đời. R2 đó có thể là phiên bản kỹ thuật số hoặc phiên bản vật lý. Nó có sẵn cho tất cả mọi người, cho dù bạn là nhà khoa học, kỹ sư, triết gia hay chỉ là một người bình thường, tất cả chúng ta đều có những trợ lý tuyệt vời này để giúp chúng ta vượt qua cuộc sống.

(Đối với quan điểm của Lao Huang về robot, Musk cũng vào khu vực bình luận để bày tỏ sự đồng tình.)

Jen-Hsun Huang: Gần đây, Sam đưa ra quan điểm rằng khả năng suy luận của những AI này sẽ trở nên thông minh hơn, nhưng điều này đòi hỏi nhiều sức mạnh tính toán hơn. Hiện tại, mỗi tip trong ChatGPT là một đường dẫn, và trong tương lai sẽ có hàng trăm đường dẫn nội bộ. Nó sẽ thực hiện suy luận, học tập củng cố, nó sẽ cố gắng tạo ra những câu trả lời tốt hơn cho bạn.

Đó là lý do tại sao kiến ​​trúc Blackwell của chúng tôi cải thiện hiệu suất suy luận lên gấp 50 lần. Bằng cách tăng hiệu suất suy luận lên hệ số 50, một mô hình suy luận hiện có thể mất vài phút để trả lời một lời nhắc cụ thể và có thể phản hồi sau vài giây. Vì vậy, đây sẽ là một thế giới hoàn toàn mới và tôi rất hào hứng với nó.

Người dẫn chương trình: Bạn ứng xử những thay đổi trong mức tiêu thụ năng lượng như thế nào? Đây là một trong những khía cạnh đáng lo ngại nhất của AI, lượng khí thải carbon của nó.

Jen-Hsun Huang: Chúng ta phải sử dụng AI để giảm mức tiêu thụ năng lượng. Bây giờ chúng ta biết rằng chúng ta có thể dự đoán khí hậu và thời tiết hiệu quả hơn 10.000 lần so với sử dụng siêu máy tính truyền thống. Định luật Moore thực sự đã kết thúc và chúng ta phải sử dụng một phương pháp mới để giải những phép tính này.

Một ví dụ tôi đưa ra là những chú chó con của tôi không hiểu vật lý Newton, chúng không hiểu quỹ đạo của một quả bóng. Chúng ta biết rằng siêu máy tính đầu tiên trên thế giới được tạo ra để mô phỏng quỹ đạo của tên lửa. Tuy nhiên, nếu luyện tập một chút, con chó có thể dễ dàng lấy quả bóng từ trên không, đôi khi bằng một cú lộn nhào. Vậy họ làm điều đó như thế nào? Đó là cùng một ý tưởng.

Do đó, chúng tôi sẽ dạy AI không tính toán thời tiết thông qua vật lý, động lực, động lực, v.v. mà là dự đoán nó. Nó có thể không hiểu đầy đủ về nguyên nhân và kết quả, nhưng những dự đoán của nó rất tuyệt vời. Chúng tôi chỉ muốn biết thời tiết ngày mai sẽ như thế nào. Đây là một ví dụ. Chúng tôi muốn làm điều tương tự với mạng vô tuyến. Chúng tôi hiểu tính chất vật lý cơ bản của điện từ, cách các chùm tia vô tuyến phản xạ và khúc xạ, cách xử lý hoàn cảnh khác nhau và tính chất vật lý của quá trình định dạng chùm tia.

Tuy nhiên, khi bạn vận hành một mạng, bạn chỉ đang cố gắng cung cấp chất lượng dịch vụ tốt hơn với mức tiêu thụ năng lượng thấp hơn, thông lượng cao hơn và chi phí thấp hơn. Do đó, bạn không cần phải thực hiện các mô phỏng vật lý cơ bản trong thời gian thực mà chỉ cần sử dụng AI để thực hiện. Nguyên tắc mô phỏng bằng cách hiểu các nguyên tắc đầu tiên và sau đó sử dụng AI để mô phỏng sự hiểu biết cơ bản này có thể làm giảm đáng kể mức tiêu thụ năng lượng.

Mọi người cần nhận ra rằng các mô hình đào tạo đòi hỏi lượng lớn năng lượng. Tuy nhiên mục tiêu không phải là huấn luyện mô hình mà mục đích là sử dụng mô hình sẽ tiết kiệm được lượng lớn năng lượng.

Một điều nữa

Tại một sự kiện khác do Salesforce tổ chức cùng thời điểm, Huang Jenxun cũng chia sẻ quan điểm này:

Công nghệ đã bước vào một vòng phản hồi tích cực. AI đang thiết kế thế hệ AI tiếp theo và tiến bộ của nó đã đạt đến bình phương Định luật Moore.

Điều này có nghĩa là trong một đến hai năm tới, chúng ta sẽ chứng kiến ​​sự tiến bộ đáng kinh ngạc và bất ngờ .

Phát lại video: https://www.youtube.com/watch?v=r-xmUM5y0LQ&t=5145shttps://www.youtube.com/watch?v=kfe3ajUYSdc

Bài viết này xuất phát từ tài khoản công khai WeChat "Qubit" (ID: QbitAI) , tác giả: Mengchen, 36 Krypton được xuất bản với sự cho phép.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận