Với sự gia nhập của Karpathy, Anthropic sắp sửa làm trống rỗng vòng tròn xã hội của OpenAI.

Bài viết này được dịch máy
Xem bản gốc

Tác giả: David, TechFlow TechFlow

Một người khác từ OpenAI đã được tập hợp lại.

Ngày 19 tháng 5, Andrej Karpathy, cựu đồng sáng lập OpenAI, cựu giám đốc AI tại Tesla và chuyên gia có tiếng về Vibe Coding, chính thức thông báo gia nhập Anthropic.

Karpathy gia nhập OpenAI khi công ty được thành lập vào năm 2015, sau đó chuyển sang Tesla làm Giám đốc AI, và vào năm 2024, ông thành lập công ty giáo dục AI của riêng mình, Eureka Labs.

Nói một cách đơn giản, ông ấy là người đã độc lập về tài chính, sở hữu công ty riêng và không còn cần phải làm việc cho ai nữa. Nhưng ông ấy vẫn thay đổi công việc.

Điều bất thường hơn nữa là nhân vật cấp cao này không báo cáo trực tiếp cho người sáng lập Anthropic, Dario Amodei. Thông cáo chính thức của Anthropic cho biết ông sẽ báo cáo cho Nick Joseph, người đứng đầu bộ phận đào tạo trước của công ty.

Trong một công ty công nghệ truyền thống, vị trí và hoàn cảnh này có lẽ chỉ tương ứng với vai trò cấp giám đốc. Ông ấy báo cáo trực tiếp cho Nick Joseph, người cũng đến từ OpenAI...

Tình huống là như sau: một trong những người đồng sáng lập OpenAI trở thành cấp dưới tại một công ty đối thủ, và cấp trên của anh ta cũng là một cựu nhân viên của OpenAI. Trong khi đó, người sáng lập công ty đối thủ Anthropic, Dario Amodei, cũng xuất thân từ OpenAI, trước đây từng giữ chức Phó Chủ tịch Nghiên cứu của OpenAI.

Điều đó thật thú vị.

Tôi lướt qua danh sách nhân sự nội bộ của Anthropic, từ những người sáng lập Dario và Daniela Amodei, đến John Schulman, người đã rời OpenAI vào năm 2024 để lãnh đạo bộ phận nghiên cứu về sự phù hợp, rồi Nick Joseph, và giờ là Karpathy, người vừa mới gia nhập...

Công ty này đã trở nên giống như một cuộc họp mặt cựu nhân viên OpenAI tại một công ty đối thủ. Nếu Mỹ áp dụng "thỏa thuận không cạnh tranh" phổ biến trong các công ty lớn của Trung Quốc, thì cuộc họp mặt này có lẽ sẽ phải được giải quyết tại tòa án ngày hôm nay.

Đồng sáng lập đã làm việc cho một đồng nghiệp cũ để Claude có thể tự rèn luyện kỹ năng của mình.

Nhiệm vụ cụ thể của Karpathy lần gia nhập là xây dựng một đội ngũ mới. Theo tuyên bố chính thức của Anthropic, điều này được gọi là "sử dụng chính Claude để đẩy nhanh quá trình nghiên cứu tiền đào tạo".

Hãy dịch nó sang ngôn ngữ dễ hiểu và để AI tự huấn luyện.

Nhìn chung, giai đoạn tiền huấn luyện là giai đoạn tốn kém nhất và tỷ lệ băm đối với các mô hình lớn, và nó quyết định khả năng cốt lõi của mô hình. Trước đây, việc này hoàn toàn do con người thực hiện: các nhà nghiên cứu thiết kế chương trình huấn luyện, các kỹ sư chạy nhiệm vụ huấn luyện quy mô lớn, và hiệu quả chỉ có thể được xác định sau vài tháng.

hình ảnh

Đội ngũ Karpathy dẫn đầu hiện đang tích hợp chính Claude vào quá trình đào tạo cho thế hệ Claude tiếp theo. Nói cách khác, một số công việc nghiên cứu và phát triển cho thế hệ Claude tiếp theo sẽ do chính thế hệ Claude hiện tại thực hiện.

Nếu điều này thực sự khả thi, tốc độ phát triển của AI sẽ không còn tuyến tính nữa. Jack Clark, đồng sáng lập của Anthropic, đã đề cập đến hướng đi này vào đầu tháng 5, nói rằng ông "ngày càng cho rằng" rằng AI đang thúc đẩy nghiên cứu và phát triển AI.

Hãy quay lại với Karpathy. Tại sao một người có nhiều tiền, danh tiếng, công việc ổn định, thậm chí còn đang điều hành một công ty khởi nghiệp về giáo dục, lại sẵn lòng trở thành cấp dưới của một đồng nghiệp cũ?

Lời giải thích hợp lý duy nhất là ông ấy cho rằng việc tự đào tạo trí tuệ nhân tạo đặc biệt quan trọng trong vài năm tới, quan trọng đến mức đáng để gác lại mọi thứ khác vì ông ấy tin tưởng, bởi vì đó là sự kết hợp hoàn hảo cả về sở thích và khả năng.

Nếu tỷ lệ băm không đủ, các chuyên gia sẽ can thiệp.

Thực tế có những lý do kinh doanh đằng sau việc cho phép AI tự học.

Đầu tháng 5, Dario Amodei thừa nhận tại hội nghị nhà phát triển của công ty rằng doanh thu và lượng người dùng của Anthropic tăng trưởng 80 lần so với cùng kỳ năm ngoái trong quý đầu tiên của năm nay, trong khi công ty chỉ dự kiến ​​tăng gấp 10 lần.

Tăng trưởng nhanh gấp tám lần dự kiến, và công ty hoàn toàn không chuẩn bị cho tỷ lệ băm khổng lồ đó. Hậu quả trực tiếp là một số phiên bản trả phí của Claude Pro, Max và Code gặp phải tình trạng hạn chế băng thông ở các mức độ khác nhau, dẫn đến nhiều lời phàn nàn người dùng trả phí.

Lý do rất đơn giản: đơn giản là không đủ GPU. Công ty này đã mua tỷ lệ băm gần như điên cuồng trong vài tháng qua.

Động thái gây chú ý nhất là hợp đồng được ký kết với SpaceX của Musk vào ngày 6 tháng 5. Theo CNBC, Anthropic đã giành được toàn bộ công suất của trung tâm dữ liệu Colossus 1 của SpaceX. Colossus 1, nằm ở Memphis, Tennessee, chứa hơn 220.000 GPU Nvidia và có công suất điện vượt quá 300 megawatt, đủ để cung cấp điện cho 300.000 hộ gia đình.

Trớ trêu thay, Colossus 1 ban đầu được thiết kế để cung cấp tỷ lệ băm cho xAI của chính Musk. Và chỉ mới tháng Hai vừa rồi, Musk đã lên sóng X và gọi Anthropic là "kẻ thù của loài người". Lý do duy nhất khiến hai người có thể ngồi xuống và thảo luận về công việc là vì Musk vẫn đang vướng vào vụ kiện với OpenAI.

Kẻ thù của kẻ thù tôi là nhà cung cấp tỷ lệ băm, điều này hoàn toàn hợp lý.

Ngoài thỏa thuận với SpaceX, Anthropic cũng đã ký một thỏa thuận hợp tác tỷ lệ băm với Amazon với công suất lên đến 5 gigawatt, một thỏa thuận 5 gigawatt khác với Google và Broadcom, một thỏa thuận trị giá 30 tỷ đô la với Microsoft và NVIDIA, và một khoản đầu tư bổ sung 50 tỷ đô la với Fluidstack vào cơ sở hạ tầng của Mỹ.

Nghe có vẻ như số tiền đã được chi ra rất lớn. Nhưng một báo cáo của IDC hồi tháng 5 đã chỉ ra rằng so với OpenAI, tỷ lệ băm chuyên dụng hiện tại của Anthropic có thể được sử dụng để huấn luyện vẫn còn nhỏ hơn nhiều.

Cách tiếp cận của OpenAI rất rõ ràng: tập trung tỷ lệ băm, tập trung trung tâm dữ liệu, tập trung các tham số. Anthropic chắc chắn không thể theo kịp con đường này.

Vì vậy, Anthropic không còn lựa chọn nào khác ngoài việc để AI tự huấn luyện. Sử dụng GPU một cách thông minh hơn tương đương với việc mua thêm một GPU. Do đó, việc mời chuyên gia Karpathy là một nỗ lực nhằm tận dụng trí tuệ của ông để tiết kiệm chi phí cho một GPU không có sẵn.

Trong số 11 nhà sáng lập OpenAI, chỉ còn lại 2 người.

Nếu Karpathy tương đương với một trung tâm dữ liệu, thì OpenAI đã mất đi không chỉ một người.

Và toàn bộ sự việc này không bắt đầu từ anh ta.

Anthropic được thành lập từ đầu bởi một nhóm người đến từ OpenAI. Năm 2021, OpenAI mất đi bảy nhân viên chủ chốt cùng một lúc, bao gồm Phó Chủ tịch Nghiên cứu, Phó Chủ tịch Chính sách An ninh, kỹ sư trưởng của GPT-3, hai tác giả của bài báo về các định luật mở rộng quy mô, một nhân vật hàng đầu trong nghiên cứu về khả năng giải thích và giám đốc phụ trách chính sách. Họ cùng nhau đăng ký một công ty có tên là Anthropic.

Đó là lý do tại sao công ty này thường được gọi đùa là "Hiệp hội cựu sinh viên OpenAI".

Nhiều người khác đã tham gia sau đó. Năm 2024 là người đồng sáng lập OpenAI, John Schulman và cựu giám đốc điều phối Jan Leike, và năm nay là Karpathy và cấp trên của ông, Nick Joseph, cùng với một nhóm các nhà nghiên cứu ít được biết đến hơn nhưng cũng không kém phần quan trọng.

Nhóm người này không tách ra và tự mở doanh nghiệp riêng. Tất cả họ đều đến làm việc cho cùng một công ty. Quan trọng hơn, họ không có ý định quay trở lại.

Các báo cáo công khai cho thấy lý do cốt lõi khiến nhóm này rời OpenAI vào năm 2021 là do họ bất đồng với tốc độ thương mại hóa nhanh chóng và sự tụt hậu trong nghiên cứu bảo mật của công ty. Năm năm sau, OpenAI đã nhận được hàng tỷ đô la đầu tư từ Microsoft, biến ChatGPT thành một sản phẩm dành cho người tiêu dùng, và vào tháng 5 năm nay, thậm chí còn bổ sung thêm hệ thống quản lý quảng cáo. Bất kỳ công ty nào ở Hoa Kỳ hiện đều có thể trực tiếp quảng cáo trên ChatGPT.

Những người đã rời đi cách đây 5 năm vì công ty thương mại hóa quá nhanh thì giờ đây càng không có lý do gì để quay lại.

Nhìn rộng hơn, trong số 11 người đồng sáng lập ban đầu của OpenAI, chỉ còn hai người ở lại công ty: CEO Sam Altman và Chủ tịch Greg Brockman. Chín người còn lại đều đã rời đi bằng nhiều cách khác nhau.

Năm 2024, gần như toàn bộ ban lãnh đạo cấp cao của OpenAI đã rời đi. Giám đốc công nghệ Mira Murati, nhà khoa học trưởng Ilya Sutskever, trưởng bộ phận nghiên cứu liên kết Jan Leike và đồng sáng lập John Schulman đều tuyên bố rời công ty trong năm đó. Năm 2025, thêm 12 giám đốc điều hành nữa rời đi, cùng với 7 nhà nghiên cứu cốt lõi được Meta chiêu mộ vào mùa hè.

Một số người trong số họ đã thành lập các công ty riêng liên quan đến trí tuệ nhân tạo, trong khi những người khác gia nhập các đối thủ cạnh tranh như Anthropic. Tuy nhiên, hầu như không ai trong số họ rời đi để theo đuổi sự nghiệp khác, và hầu như không ai chọn quay trở lại OpenAI.

Anthropic dường như là bên hưởng lợi lớn nhất từ ​​sự dịch chuyển này. Nhưng nguyên nhân gốc rễ của cuộc di cư này có thể nằm ở OpenAI. Karpathy không phải là công ty đầu tiên đến và có lẽ cũng sẽ không phải là công ty cuối cùng.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
82
Thêm vào Yêu thích
12
Bình luận