Nguồn: Quan điểm dựa trên silicon
Một nhà khoa học đã viết một bài báo cách đây vài tháng, tuyên bố ý định tốt đẹp của ông và công ty ông là giải quyết nhiều khía cạnh về sức khỏe thể chất và tinh thần của con người, bệnh tâm thần, nghèo đói, hòa bình, ý nghĩa của công việc và cuộc sống, v.v. thông qua trí tuệ nhân tạo mạnh mẽ. Vài tháng sau, chính nhà khoa học đó bất ngờ xuất bản một bài báo, kêu gọi mạnh mẽ không xuất khẩu chip của Mỹ sang Trung Quốc, nhằm hạn chế sự phát triển của trí tuệ nhân tạo Trung Quốc và duy trì "thế giới đơn cực" về trí tuệ nhân tạo (tôi đã rất sốc khi biết điều đó). ông ấy sử dụng thuật ngữ này một cách rất thẳng thừng). Dù nhìn nhận vấn đề này theo cách nào thì nó cũng khiến mọi người cảm thấy xa cách và có phần đạo đức giả.
Người này là Dario Amodei, người sáng lập và giám đốc điều hành của công ty trí tuệ nhân tạo Anthropic, một người Mỹ gốc Ý, một bác sĩ về vật lý thần kinh, một nhà khoa học AI cấp cao, một trong những linh hồn của đội ngũ nghiên cứu OpenAI trước đây và là một nhà nghiên cứu ban đầu tại Độ sâu Phòng thí nghiệm học tập của công ty Trung Quốc Baidu. Một nhân viên, một người theo chủ nghĩa lý tưởng tuyên bố xây dựng AI mạnh mẽ và an toàn nhất, người sáng lập đối thủ cạnh tranh quan trọng nhất của OpenAI và hiện là người ủng hộ nhiệt thành nhất cho nền tảng toàn diện và không bao giờ chết của Hoa Kỳ -cấm AI của Trung Quốc.
Mặc dù Anthropic và sê-ri mô hình Claude của nó không được công chúng Trung Quốc biết đến nhiều, nhưng xét cho cùng, đây là nhà cung cấp các mô hình ngôn ngữ lớn phổ biến nhất thế giới cho các nhà phát triển ứng dụng AI và được các nhà nghiên cứu và phát triển AI tại Trung Quốc sử dụng rộng rãi . Trong nhóm cũng có khá nhiều người hâm mộ. Nhưng chỉ sau một đêm, nhiều người hành nghề AI Trung Quốc đã công khai tuyên bố rằng Anthropic và bản thân Amodei đã mất đi sự tôn trọng cơ bản nhất của họ.
Đây chính là tác dụng của một "tuyên ngôn".
Trong bài viết này có tiêu đề "Về DeepSeek và Kiểm soát xuất khẩu", Dario Amodei bình tĩnh tuyên bố rằng những thành tựu của DeepSeek trong việc làm lung lay lợi thế của AI Mỹ là phóng đại. Đồng thời, ông bày tỏ sự khẳng định của mình về sự đổi mới của mô hình DeepSeek-V3. , và kiên quyết từ chối thừa nhận sự đột phá của mô hình suy luận DeepSeek R1, điều này đã gây chấn động lớn hơn (suy nghĩ của ông về vấn đề này sẽ là trọng tâm của bài viết này sau). Điều mà ông ta còn miễn cưỡng thừa nhận hơn nữa là kết quả đạt được của mô hình DeepSeek về mặt chi phí tỷ lệ băm và hiệu quả thuật toán - sử dụng DeepSeek mà chính ông ta thừa nhận là "chưa được xác minh" với 50.000 card đồ họa Nvidia A100, H100 và H800 buôn lậu. Tin đồn chứng minh rằng mô hình DeepSeek-V3 không thể được đào tạo với chi phí thấp là 6 triệu đô la. Rõ ràng, Amodei không thể chấp nhận con đường ngày càng được chấp nhận rộng rãi của DeepSeek là thay thế tích lũy tỷ lệ băm bằng đổi mới hiệu quả thuật toán, vì vậy ông không ngần ngại sử dụng tiền đề rằng DeepSeek đã buôn lậu lượng lớn card đồ họa cao cấp, điều mà chính ông biết là chưa được xác minh. , để thực hiện lập luận này. Nhưng ông cũng tuyên bố rằng việc kiểm soát xuất khẩu tỷ lệ băm của Hoa Kỳ sang Trung Quốc vẫn chưa thất bại - có thể ông chỉ quên rằng lập luận trước đây của mình dựa trên giả định về hoạt động buôn lậu DeepSeek.

Nguồn: https://darioamodei.com/on-deepseek-and-export-controls
Hãy khôi phục lại dòng logic trong lập luận của ông ấy: Ảnh hưởng của DeepSeek đã bị phóng đại - V3 thực sự là một sự đổi mới, nhưng không thể chi quá ít tiền - Tôi nghe nói rằng họ đã buôn lậu chip - vì vậy họ đã dành nhiều thời gian hơn cho việc đào tạo Chi phí - DeepSeek là không phải bản gốc, nó dựa trên nghiên cứu của chúng tôi và tất nhiên chi phí thấp hơn - mô hình suy luận R1 hoàn toàn không có tính sáng tạo, nó chỉ sao chép kết quả của o1 (giả vờ không thấy rằng OpenAI đã thừa nhận những thành tựu của DeepSeek trong khám phá độc lập về suy luận) - Kiểm soát xuất khẩu không hề thất bại, đúng vậy (tôi quên mất rằng tiền đề của cuộc thảo luận trước đây của tôi là DeepSeek đã có được card đồ họa lậu) - Chúng ta muốn tạo ra một thế giới AI đơn cực và Trung Quốc không thể tạo ra thứ gì đó ngang hàng với chúng ta mô hình (tôi quên nói lúc đầu là không nên sợ DeepSeek) - Do đó, chưa nói đến H100 và H800, ngay cả H20 cấp thấp nhất cũng không thể xuất khẩu sang Trung Quốc, nên Trung Quốc không thể thắng.
Bạn thấy đấy, một nhà khoa học luôn nói về logic và lý luận, nếu ông ta cố gắng sử dụng một bài viết dài mười nghìn từ để chứng minh một kết luận không thể biện minh được mà phải sử dụng lý luận logic dưới hình thức, ông ta sẽ có vẻ rất vụng về và đạo đức giả.
Đây không phải là lần đầu tiên Dario Amodei kêu gọi kiểm soát chặt chẽ hơn đối với tỷ lệ băm của Trung Quốc. Bạn không thể mong đợi một nhà khoa học trí tuệ nhân tạo người Mỹ có thiện chí cố hữu đối với Trung Quốc, nhưng DeepSeek của ông đã thu hút sự chú ý rộng rãi ở Thung lũng Silicon. Trong bối cảnh một mức độ hoảng loạn nhất định, tiếng kêu gọi kiểm soát chặt chẽ hơn việc xuất khẩu tỷ lệ băm của Trung Quốc và sự phủ nhận mạnh mẽ những đổi mới của DeepSeek trong tối ưu hóa hiệu quả tỷ lệ băm và phương pháp suy luận mô hình là những hiện tượng đáng được quan tâm và phân tích. Không ai mong đợi ông ta có thiện chí với Trung Quốc, nhưng thật thú vị khi suy ngẫm về sự ác ý và oán giận sâu sắc của ông ta đối với Trung Quốc và DeepSeek, một công ty AI ra đời tại Trung Quốc.
Tại sao Dario Amodei lại "coi thường" DeepSeek-R1?
Mặc dù có suy đoán rằng chi phí đào tạo của DeepSeek-V3 lên tới hơn 6 triệu đô la, Dario Amodei thừa nhận rằng V3 là một cải tiến thực sự, nhưng ông nhấn mạnh rằng nó không phải là một bước đột phá, mà là "một bước tiến trên đường cong giảm chi phí liên tục". "điểm mong đợi". Ông cho rằng"sự khác biệt là công ty đầu tiên chứng minh được mức giảm chi phí dự kiến là một công ty Trung Quốc, điều này chưa từng xảy ra trước đây và có ý nghĩa địa chính trị". Thật sự rất mệt mỏi khi phải chứng kiến mọi người khen ngợi người khác mà không thực sự muốn làm như vậy một cách chân thành. Tôi sụp đổ nghe Amodei nói thẳng: "Các công ty Mỹ đều đang cải tiến để giảm chi phí mô hình, chỉ có điều DeepSeek tình cờ là công ty đầu tiên làm được điều đó", nhưng sự thẳng thắn không phải là phẩm chất của ông.
Khi nói đến DeepSeek-R1, Amodei rất thẳng thắn. Ông hoàn toàn từ chối thừa nhận rằng R1 là một bước đột phá, không để lại chỗ cho sự nghi ngờ về vấn đề này, mặc dù OpenAI, đơn vị đào tạo các mô hình học tăng cường o1 và o3, đã thừa nhận rằng R1 đã có những đột phá ban đầu trong phương pháp học tăng cường và cũng không để ý đến kết quả nghiên cứu chỉ ra rằng phương pháp học tăng cường của DeepSeek không cần sự can thiệp của phản hồi của con người và chính là "khoảnh khắc AlphaGo" của các mô hình ngôn ngữ lớn. Ông nhấn mạnh: R1 chỉ là một quá trình học tăng cường dựa trên V3 và mọi hành động của nó đều sao chép o1. Mọi công ty AI của Mỹ đều đang cố gắng đưa ra suy luận về vấn đề này. Đây là một xu hướng công nghệ và không liên quan gì đến mã nguồn mở. Có không có mối liên hệ nào giữa hai cái này, chỉ là DeepSeek tình cờ được phát triển trước.
Chúng ta sụp đổ cần phải tức giận về sự bướng bỉnh của Amodei. Suy cho cùng, với tư cách là một nhà nghiên cứu được công nhận với những thành tựu nổi bật trong lĩnh vực AI, quan điểm của Amodei về một số vấn đề quan trọng có thể ảnh hưởng rất lớn đến ngành công nghiệp AI, giới đầu tư rủi ro, Phố Wall và thậm chí cả Washington, D.C. Cùng nhìn vào hiện tượng DeepSeek. Đây chính là lý do vì sao anh ta phải nhảy ra ngoài. Ông không lên tiếng bênh vực OpenAI (mối bất hòa giữa ông và OpenAI đã ăn sâu bén rễ), nhưng vào thời điểm này, ông phải lên tiếng và tìm cách chuẩn bị từng bước cho bước đi tiếp theo của Anthropic mà ông sáng lập.
Một sự thật rất đáng chú ý là Anthropic vẫn chưa chính thức công bố mô hình suy luận cho công chúng. Mặc dù Dario Amodei đã công khai tuyên bố trong một cuộc phỏng vấn rằng ông khinh thường các mô hình suy luận độc lập - nhưng vào thời điểm đó, mục tiêu chính của ông tất nhiên là OpenAI.
Quan điểm của Amodei là lý luận không khó đến vậy, và mô hình cơ sở quan trọng hơn. Tương tự như cách ông ấy thầm khen ngợi DeepSeek-V3 vì sự đổi mới của nó, nhưng đánh giá của nó về lập trình và các khía cạnh khác vẫn yếu hơn mô hình Claude 3.5 Sonnet của ông ấy. Ông ấy công khai thừa nhận bước đột phá do o1 tạo ra, nhưng không cho rằng học tăng cường là chìa khóa để đạt được khả năng suy luận mô hình. Phương pháp tốt nhất để nâng cao. Ông cho biết trong một số tình huống và thực hành cụ thể, Claude 3.5 Sonnet, với tư cách là mô hình được đào tạo trước, đã cho thấy khả năng lập luận không thua kém gì o1. Do đó, ông không cho rằng mô hình lý luận và mô hình thông thường nên tách biệt. Mô hình cơ sở được đào tạo trước vẫn quan trọng hơn và có thể bao gồm khả năng lý luận.
Do đó, rất có thể Anthropic có kế hoạch đạt được bước nhảy vọt về khả năng suy luận mô hình theo cách khác với OpenAI và DeepSeek, điều này rất có thể sẽ được phản ánh trong mô hình cơ sở hàng đầu thế hệ tiếp theo của Claude và vẫn sẽ sử dụng Phản hồi của con người phương pháp tiếp cận dựa trên học tăng cường (RLHF), bổ sung bằng phương pháp học tăng cường khác (do chính Amodei phát biểu) - phương pháp này tương tự như Chuỗi of Thought (CoT) và DeepSeek R1 của OpenAI o1 trong học tăng cường tự động bằng AI. Những đột phá này khác biệt đáng kể.
Anthropic, được bắt nguồn hoàn toàn từ OpenAI và coi OpenAI là đối thủ cạnh tranh trực tiếp nhất (gần như là duy nhất), theo một nghĩa nào đó, là người tin tưởng triệt để nhất vào sê-ri khái niệm mô hình ngôn ngữ lớn của OpenAI trong kỷ nguyên trước GPT-4. Amodei đã lần phủ nhận rằng quá trình đào tạo trước đã "gặp phải rào cản" và rằng hiệu ứng quy mô đã giảm đi khi dữ liệu đào tạo cạn kiệt, và đã nhiều lần nhấn mạnh tầm quan trọng của "Luật quy mô" cổ điển (tức là sự mở rộng liên tục của kích thước mô hình có thể dẫn đến cải thiện hiệu suất). Các nhà nghiên cứu và phát triển AI đang háo hức mong đợi Anthropic phá vỡ nút thắt của Luật mở rộng quy mô và các mô hình được đào tạo trước, đồng thời ra mắt thế hệ mô hình được đào tạo trước hàng đầu mới với khả năng suy luận mạnh mẽ hơn.
Nhưng cho đến nay, Anthropic vẫn chưa ra mắt thứ này. Với khả năng đào tạo mô hình tuyệt vời và lịch sử không bao giờ phát hành phiên bản tương lai, có lý do để tin rằng Anthropic đang tích cực chuẩn bị mô hình được đào tạo trước này với khả năng suy luận mạnh mẽ hơn để chứng minh rằng o1 của OpenAI không phải là con đường tốt nhất để đạt được khả năng suy luận được cải thiện. Nhưng với sự ra mắt của DeepSeek-V3, họ đột nhiên phải chứng minh rất nhiều điều.
Đầu tiên, DeepSeek-V3 chứng minh thêm rằng con đường của mô hình lý luận độc lập của học tăng cường là đáng tin cậy và thậm chí có thể là tốt nhất sau R1. Thứ hai, DeepSeek-V3 xác minh rằng học tăng cường có thể cho phép AI học mà không cần phản hồi của con người. Tư duy độ sâu tự chủ ( Dario Amodei (là một trong những nhà phát minh chính của phương pháp học tăng cường dựa trên phản hồi của con người); một lần nữa, DeepSeek-V3 chứng minh rằng chi phí đào tạo để đạt được tất cả những điều này có thể được giảm đáng kể.
Điều này có nghĩa là khi Anthropic tung ra một mô hình được đào tạo trước mới với khả năng lý luận mạnh hơn, nó sẽ phải trả lời những câu hỏi phức tạp hơn so với trước đây: Tại sao không sử dụng học tăng cường làm chế độ đào tạo chính? Ưu điểm của việc học tăng cường dựa trên phản hồi của con người so với học tăng cường tự động được biểu diễn bằng R1 là gì? Và chi phí đào tạo của bạn là bao nhiêu? Có cách nào rẻ hơn và hiệu quả hơn không? Giá API có thể giảm được không? (Claude API là đắt nhất thế giới, và Deep Seek gần như là rẻ nhất)
Những vấn đề và rắc rối nhức nhối này đều do DeepSeek gây ra.
Do đó, trước khi tung ra mô hình mới của riêng mình với khả năng suy luận mạnh mẽ hơn, "linh hồn" Dario Amodei của Anthropic chỉ có thể chủ động nhảy ra và cố gắng hết sức để giảm bớt và xua tan ấn tượng tốt đẹp có sẵn của mọi người về DeepSeek-R1: thừa nhận rằng nó là sáng tạo và một bước đột phá là Hoàn toàn không thể. Thật khó để chấp nhận rằng chi phí thực sự đã giảm.

Dario Amodei (Nguồn: Wikipedia)
Đây là câu hỏi về hai con đường và nó mang tính sống còn. Ở một mức độ nào đó, hai lộ trình này cũng là những biểu diễn khác nhau của hai con đường đào tạo mô hình Thung lũng Silicon cổ điển và đào tạo mô hình Trung Quốc trong "thời kỳ hậu đào tạo trước" của các mô hình ngôn ngữ lớn: con đường trước dựa vào lợi thế của tài nguyên tỷ lệ băm. Cách tiếp cận đầu tiên cải thiện hiệu suất mô hình thông qua tính thẩm mỹ thô sơ và mạnh mẽ của việc xếp chồng sức tỷ lệ băm; cách tiếp cận thứ hai tập trung vào hiệu quả thuật toán, giảm chi phí đào tạo thông qua các cải tiến về kiến trúc và kỹ thuật, đồng thời cải thiện hiệu suất mô hình.
Anthropic thậm chí còn đại diện nhiều hơn cho quy mô tỷ lệ băm, quy mô mô hình và tính thẩm mỹ bạo lực so với OpenAI, điều này cũng dẫn đến bài báo mới được xuất bản của Dario Amodei, không chỉ bí mật phát hành ác ý đối với DeepSeek mà còn công khai Sự ác ý này được chiếu tới toàn bộ lĩnh vực AI trong Trung Quốc.
Tại sao Dario Amodei lại ám ảnh với việc kiểm soát xuất khẩu tỷ lệ băm đến vậy?
Đây không phải là lần Dario Amodei công khai kêu gọi kiểm soát chặt chẽ hơn việc xuất khẩu tỷ lệ băm sang Trung Quốc. Trước đó, ông đã bày tỏ trong một cuộc phỏng vấn rằng quan điểm xuất khẩu tỷ lệ băm sang Trung Quốc là cần thiết và cần phải được tăng cường. Những người bạn Mỹ của chúng ta không nên cảm thấy tiếc nuối về điều này, và những người bạn Trung Quốc của chúng ta cũng không nên cảm thấy tức giận về điều này. Ông ấy vẫn luôn như vậy.
Nhưng điều rất thú vị là Amodei đã tận dụng "hiệu ứng DeepSeek" và viết một vài nghìn từ trong đó ông kêu gọi tăng cường hơn nữa khả năng kiểm soát tỷ lệ băm của Trung Quốc, lập luận rằng xu hướng đằng sau DeepSeek là trí tuệ nhân tạo của Trung Quốc có thể ngang bằng với Hoa Kỳ. Hãy tin tôi, khi một nhà khoa học hoặc doanh nhân người Mỹ công khai thể hiện thái độ quá gần gũi hoặc thù địch với Trung Quốc, nhu cầu cá nhân của họ được đặt lên hàng đầu.
Trước tiên chúng ta hãy cùng xem lại Anthropic là gì.
Không còn nghi ngờ gì nữa, đây là công ty trí tuệ nhân tạo tốt nhất tại Hoa Kỳ và trên thế giới hiện nay - đôi khi còn là công ty tốt nhất, và Dario Amodei chính là linh hồn kỹ thuật của công ty. So với sự tự mâu thuẫn và sự e thẹn của mình khi hạ thấp DeepSeek và nói về kiểm soát xuất khẩu tỷ lệ băm, ông đã đưa ra một tuyên bố thuyết phục khi nói về viễn cảnh mong đợi và những hạn chế của trí tuệ nhân tạo và giải thích các thuật ngữ và lý thuyết cụ thể về trí tuệ nhân tạo. Ông là người lý trí, kiềm chế, rõ ràng và chính xác, thuyết phục hơn nhiều so với người đồng nghiệp cũ của ông, Sam Altman, CEO của OpenAI, người thực sự không rành về công nghệ.
Tất nhiên, với tư cách là đối thủ cạnh tranh chính của OpenAI, nhãn hiệu gây ấn tượng nhất với thế giới bên ngoài về Anthropic là "tính an toàn", đây cũng là khía cạnh bị chỉ trích nhiều nhất của OpenAI. Tất nhiên, nó cũng mang lại nhiều lợi ích cho vấn đề bảo mật, chẳng hạn như nhúng nguyên tắc "AI theo hiến pháp" về học tăng cường dựa trên phản hồi của con người (RLHF) ở mọi nơi trong toàn bộ quá trình đào tạo mô hình. "An toàn" là điểm bán hàng của Anthropic, nhưng đôi khi nó cũng trở thành gánh nặng.
Vào năm 2024, Anthropic đã chiếm mất 15% thị thị phần của OpenAI trên thị trường doanh nghiệp. Tất nhiên, điều này là do mô hình Sonnet 3.5 thực sự mạnh mẽ, nhưng cũng vì bùa hộ mệnh "an toàn". Nhưng hãy suy nghĩ kỹ, khi tập trung vào "bảo mật", ngoài việc nhắm tới người dùng doanh nghiệp, ai sẽ là người mua chính?
Câu trả lời hiển nhiên là: chính phủ. Nói một cách chính xác thì là chính phủ Hoa Kỳ.
Tuy nhiên, khi nói đến việc tham gia vào các dự án của chính phủ liên bang và các bộ phận liên quan, Anthropic, là người đến sau, rõ ràng không được ưa chuộng bằng OpenAI. Dự án AI lớn đầu tiên trong kỷ nguyên Trump 2.0, Stargate, do Nhà Trắng dẫn đầu, với OpenAI và SoftBank là những bên tham gia chính, và Anthropic không tham gia vào dự án này.

Mặc dù Dario Amodei ngay lập tức chế giễu "Stargate" của chính quyền Trump là một "mớ hỗn độn" tại Diễn đàn Davos, nhưng rõ ràng không có công ty AI nào muốn tham gia vào một dự án do chính phủ Hoa Kỳ lãnh đạo hơn Anthropic. Để đạt được mục đích này, ông cũng đã thực hiện sê-ri những hành động trái ngược nhau:
Một mặt, vào ngày 6 tháng 1, trước khi Trump chính thức nhậm chức, Dario Amodei đã xuất bản một bài báo có chữ ký trên tờ Wall Street Journal với tiêu đề "Trump có thể đảm bảo vị thế dẫn đầu của Hoa Kỳ trong lĩnh vực AI", đây rõ ràng là một nỗ lực thăm dò thị trường. để hợp tác tích cực.
Mặt khác, "Đạo luật đổi mới sáng tạo vì sự an toàn và bảo mật của các mô hình trí tuệ nhân tạo tiên tiến" gây tranh cãi được đưa ra vào cuối chính quyền Dân chủ trước, nhằm mục đích tăng cường giám sát và yêu cầu các công ty trí tuệ nhân tạo phải tích cực chia sẻ kết quả nghiên cứu mô hình với chính phủ, gần như đã bị từ chối. Thung lũng Silicon phải đối mặt với sự phản đối nhất trí từ cả phe tiến bộ và bảo thủ, và cuối cùng đã bị Thống đốc California Newsom từ chối ký. Và Dario Amodei của chúng tôi gần như là người sáng lập duy nhất của một công ty trí tuệ nhân tạo ở Thung lũng Silicon ủng hộ dự luật này.
Trước đây, tôi ngây thơ cho rằng Anthropic có cái bóng của Google thời kỳ đầu, vì công ty này đặt tính minh bạch, khả năng giải thích và đạo đức lên hàng đầu trong công nghệ và sản phẩm, và có sự thông minh của chủ nghĩa lý tưởng. Tuy nhiên, Google thời kỳ đầu đã đưa nguyên tắc này vào các giá trị cốt lõi của những người sáng lập và đội ngũ của mình, và không hề ủng hộ việc dựa vào quy định hoặc ý chí hành chính để đạt được tất cả những điều này. Hai nhà sáng lập Google chưa bao giờ cố gắng rèn luyện bản thân để trở thành những kẻ tay sai của Nhà Trắng. Nhưng trường hợp của Dario Amodei của chúng ta thì không như vậy.
Thật không may, nội các của Trump, vốn gồm nhiều người ủng hộ mới từ Thung lũng Silicon, lại có những ý tưởng rất khác biệt so với nội các của Biden về sự phát triển và quản lý trí tuệ nhân tạo. Ít nhất là cho đến hiện tại, nhóm này có vẻ không tin vào ý tưởng của Dario Amodei. Sau khi Amodei công bố bài viết kỳ lạ kêu gọi kiểm soát chặt chẽ hơn tỷ lệ băm của Trung Quốc, Marc Andreessen, người sáng lập công ty đầu tư rủi ro Andreessen Horowitz, vốn ủng hộ Trump, đã lên tiếng tát vào mặt ông: “Nguồn đóng, không minh bạch, soi mói, tìm kiếm động cơ chính trị sự thao túng và Cuộc chiến giữa mã nguồn mở và miễn phí không phải là cách mà Hoa Kỳ cần để giành chiến thắng."
Theo một nghĩa nào đó, mong muốn có được những đơn đặt hàng lớn từ chính quyền liên bang và tham gia vào các "dự án lớn" về trí tuệ nhân tạo quốc gia đã dẫn đến sự ủng hộ vô điều kiện đối với quy định về AI trong chính quyền Biden, và sau cuộc bầu cử của Trump, ông đã ca ngợi Trump là người đảm bảo vị trí dẫn đầu của Hoa Kỳ trong lĩnh vực AI. Dario Amodei, vị cứu tinh vĩ đại, hiện thực sự là sự cô lập sinh thái. Ông không nằm trong nhóm nòng cốt hoạch định chính sách AI tại Hoa Kỳ, nhưng ông rất muốn tham gia, điều này đòi hỏi ông phải thể hiện thái độ quyết liệt và kiên quyết hơn để có được tấm vé này.
Vào thời điểm này, DeepSeek xuất hiện, khiến Anthropic có phần thụ động trong con đường học tăng cường, nhưng cũng là cơ hội tốt để thể hiện lập trường cấp tiến của mình nhằm kiềm chế sự phát triển của trí tuệ nhân tạo tại Trung Quốc. Tuy nhiên, con đường đào tạo mô hình của Anthropic dựa vào sự tích tụ tỷ lệ băm. Việc mở rộng quy mô khiến ông không muốn tin rằng hiệu quả thuật toán và tối ưu hóa kỹ thuật thực sự có thể giảm chi phí tỷ lệ băm và ông tin rằng việc bóp nghẹt tỷ lệ băm sẽ cắt đứt tương lai của AI tại Trung Quốc. Tuy nhiên, đây là đề xuất mà Nhà Trắng có nhiều khả năng hiểu và chấp nhận nhất. Do đó, không khó để hiểu tại sao Amodei lại ám ảnh với việc kêu gọi kiểm soát xuất khẩu chặt chẽ hơn đối với tỷ lệ băm.
Tôi vẫn không thể không thở dài: những nhân vật cốt lõi của thế hệ công ty trí tuệ nhân tạo mới tại Hoa Kỳ - dù là Sam Altman của OpenAI hay Dario Amodei của Anthropic, hay thậm chí là Zuckerberg của Meta và Alexandr Wang của Scale.ai , họ và sự nghiệp của họ Việc chấp nhận kỷ luật của "chủ nghĩa dân tộc" Mỹ là điều rất tự nhiên và nhanh chóng. Tuy nhiên, “ngành học” được hầu hết các doanh nhân trí tuệ nhân tạo Trung Quốc chấp nhận - đại diện mới nhất là DeepSeek và người sáng lập Liang Wenfeng - lại mang tính quốc tế và toàn cầu. Đây thực sự là một hiện tượng thú vị.



