DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng trên nền tảng mã nguồn mở. DeepSeek cũng làm chấn động ngành công nghiệp AI khi ch...

DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng trên nền tảng mã nguồn mở.DeepSeek cũng làm chấn động ngành công nghiệp AI khi chứng minh rằng có thể phát triển một AI mạnh mẽ chỉ với chi phí 6 triệu USD cho phần cứng, trong khi các công ty Mỹ như <a href="https://tapchibitcoin.io/openai-la-gi-cong-ty-ai-dung-sau-chatgpt.html" rel="nofollow">OpenAI</a>, Google và Microsoft đã đầu tư hàng tỷ USD.<img src="https://tapchibitcoin.io/wp-content/uploads/2025/01/DeepSeek-AI-.jpg" alt="">DeepSeek là dự án của nhà đầu tư kiêm doanh nhân Lương Văn Phong (Liang Wenfeng), sinh năm 1985, ông từng theo học ngành kỹ thuật thông tin điện tử và truyền thông tại Đại học Chiết Giang. Liang bắt đầu sự nghiệp AI bằng cách ứng dụng công nghệ này vào giao dịch định lượng, đồng sáng lập quỹ phòng hộ High-Flyer Quantitative Investment Management có trụ sở tại Hàng Châu vào năm 2015. Đến năm 2023, Liang thành lập DeepSeek với mục tiêu thúc đẩy trí tuệ nhân tạo tổng quát (AGI).DeepSeek ra mắt mô hình ngôn ngữ lớn đầu tiên, DeepSeek-Coder, vào ngày 29 tháng 11 năm 2023.Tuy nhiên, phải đến ngày 20 tháng 1 năm 2025, khi DeepSeek-R1 được công bố, công ty này mới thực sự làm khuynh đảo ngành <a href="https://tapchibitcoin.io/ai-la-gi.html" rel="nofollow">AI</a>.Với đội ngũ chỉ chưa tới 200 người và ngân sách vỏn vẹn 6 triệu USD, DeepSeek đã phát hành một mô hình mã nguồn mở miễn phí, đạt chất lượng ngang ngửa GPT-o1 của OpenAI – một dự án tiêu tốn tới 600 triệu USD và mất khoảng hai năm với 3.500 nhân sự để phát triển.Không giống các tập đoàn công nghệ phương Tây với đội ngũ nhân sự khổng lồ, DeepSeek tối ưu hóa việc tuyển dụng bằng cách tập trung vào sinh viên mới tốt nghiệp: “Kinh nghiệm làm việc từ 3 đến 5 năm là tối đa, và những người có hơn 8 năm kinh nghiệm gần như bị loại,” một chuyên gia tuyển dụng tiết lộ với 36kr, trang tin công nghệ hàng đầu Trung Quốc.Ngoài ra, trong khi OpenAI và các mô hình AI hàng đầu khác chủ yếu được cung cấp dưới dạng sản phẩm đăng ký trả phí, mã nguồn của DeepSeek hoàn toàn mở, có thể được kiểm tra công khai và tải xuống để chạy cục bộ trên máy tính thông qua nền tảng Hugging Face hoặc sử dụng miễn phí qua ứng dụng di động.Công nghệ nền tảng của DeepSeek được xem là một bước đột phá lớn trong lĩnh vực AI. Việc ra mắt mô hình này đã gây chấn động giới công nghệ Mỹ, khiến tổng vốn hóa thị trường của các công ty lớn bốc hơi 1.000 tỷ USD chỉ trong một ngày.Thành công của DeepSeek đến từ cách tiếp cận độc đáo trong thiết kế và huấn luyện mô hình. Giống như một siêu máy tính song song khổng lồ chia nhỏ nhiệm vụ để xử lý đồng thời, hệ thống Mixture-of-Experts (MoE) của DeepSeek chỉ kích hoạt khoảng 37 tỷ trong tổng số 671 tỷ tham số cho mỗi tác vụ. Cách tiếp cận này giúp tối ưu hiệu suất đáng kể, giảm chi phí tính toán trong khi vẫn duy trì hiệu suất hàng đầu trên nhiều ứng dụng.DeepSeek còn cải tiến quá trình huấn luyện thông qua Group Relative Policy Optimization, một kỹ thuật học tăng cường giúp nâng cao khả năng ra quyết định bằng cách so sánh lựa chọn của mô hình với các tác nhân học tập tương tự. Điều này giúp AI tinh chỉnh lập luận hiệu quả hơn, từ đó tạo ra dữ liệu huấn luyện chất lượng cao hơn.Bên cạnh đó, DeepSeek cam kết tính minh bạch và khả năng tiếp cận mã nguồn mở khi phát hành mô hình của mình theo giấy phép MIT. Điều này cho phép người dùng tải xuống, triển khai và tùy chỉnh mô hình AI, tạo nên sự khác biệt so với các đối thủ duy trì hệ thống độc quyền. Mô hình mã nguồn mở cũng giúp các nhà phát triển cải thiện và chia sẻ công nghệ, tạo ra một chu kỳ tiến hóa và nâng cấp liên tục.DeepSeek được hỗ trợ bởi lượng lớn chip Nvidia A100 kết hợp với phần cứng giá rẻ hơn. Một số ước tính cho rằng DeepSeek có quyền truy cập vào khoảng 50.000 GPU Nvidia, so với con số 500.000 GPU mà OpenAI đã sử dụng để huấn luyện ChatGPT.Nhiều chuyên gia công nghệ AI ca ngợi DeepSeek là một mô hình mạnh mẽ, hiệu quả và chi phí thấp, trong khi một số ý kiến chỉ trích bày tỏ lo ngại về quyền riêng tư và bảo mật dữ liệu.“Chúng ta đang sống trong một thời điểm mà một công ty ngoài Mỹ lại giữ vững sứ mệnh ban đầu của OpenAI—một nghiên cứu mở, tiên phong và trao quyền cho tất cả mọi người. Điều này thật khó tin,” Jim Fan, Giám đốc Nghiên cứu cấp cao của Nvidia, viết trên X. “Kết cục thú vị nhất cũng là kết cục dễ xảy ra nhất.”Ngay cả CEO của OpenAI, Sam Altman, cũng thừa nhận DeepSeek là một đối thủ đáng gờm:“Chúng tôi chắc chắn sẽ tạo ra những mô hình tốt hơn, nhưng thật sự là rất thú vị khi có một đối thủ mới!” Altman chia sẻ trên X.Tuy nhiên, chỉ vài ngày sau đó, OpenAI tuyên bố đã tìm thấy bằng chứng cho thấy DeepSeek sử dụng các mô hình độc quyền của OpenAI để huấn luyện mô hình AI của riêng mình bằng hành động gọi là chưng cất.Ngoài ra, DeepSeek còn vấp phải chỉ trích về điều khoản dịch vụ, thực tiễn an ninh mạng và mối quan hệ tiềm tàng với chính phủ Trung Quốc. Một số chuyên gia cũng lo ngại về lượng dữ liệu người dùng mà DeepSeek thu thập, bao gồm model thiết bị, hệ điều hành, mẫu gõ phím và địa chỉ IP—tất cả đều được lưu trữ trên các máy chủ đặt tại Trung Quốc theo chính sách quyền riêng tư của công ty.“Vấn đề quyền riêng tư vẫn luôn tồn tại khi nói đến Trung Quốc. Luôn có sự thu thập dữ liệu từ người dùng, vì vậy hãy cẩn trọng,” Kevin Surace, CEO của Appvance nói. “Điều này sẽ buộc tất cả chúng ta phải suy nghĩ lại về cách huấn luyện mô hình và lượng tài nguyên cần thiết để vận hành AI.”Sự trỗi dậy nhanh chóng của DeepSeek đang thách thức vị thế thống trị của các tập đoàn công nghệ phương Tây và đặt ra những câu hỏi lớn về tương lai của AI—ai sẽ xây dựng, ai kiểm soát, và AI có nên được mở và dễ tiếp cận cho tất cả mọi người hay không.Tuy nhiên, vẫn còn nhiều nghi vấn về tác động dài hạn của DeepSeek, và liệu Tổng thống Mỹ Donald Trump có phản ứng trước sự thống trị bất ngờ của Trung Quốc trong lĩnh vực AI bằng một lệnh cấm tương tự như TikTok hay không. Liệu High-Flyer có thổi phồng hiệu suất sử dụng GPU để khiến DeepSeek trông hiệu quả hơn thực tế? Việc ra mắt công khai bất ngờ của DeepSeek có phải là một chiêu trò nhằm kéo giá cổ phiếu Nvidia xuống để mang lại lợi ích cho các nhà đầu tư có vị thế tốt?

DeepSeek là gì? Đối thủ của ChatGPT đến từ Trung Quốc đang gây bão trên toàn cầu

DeepSeek,一家中國初創公司,憑藉其基於<開源>平臺構建的強大語言模型在科技行業引起了轟動。DeepSeek還在AI行業掀起了轟動,因為它...

DeepSeek，一家中國初創公司，憑藉其強大的大型語言模型和開源基礎設施在科技界引起了轟動。DeepSeek 在證明僅用 600 萬美元的硬體成本就能開發出與 OpenAI、谷歌和微軟等公司耗資數十億美元開發的 AI 模型相媲美的強大 AI 系統時,引發了 AI 行業的震動。<img src="https://tapchibitcoin.io/wp-content/uploads/2025/01/DeepSeek-AI-.jpg" alt="">DeepSeek 是由投資者兼企業家梁文峰於 2023 年創立的,目標是推動通用人工智慧(AGI)的發展。DeepSeek 於 2023 年 11 月 29 日首次釋出了其語言模型 DeepSeek-Coder,但直到 2025 年 1 月 20 日 DeepSeek-R1 的釋出,該公司才真正引起 AI 行業的轟動。憑藉不到 200 人的團隊和僅 600 萬美元的預算,DeepSeek 釋出了一個免費開源的模型,其質量堪比 OpenAI 耗資 6 億美元、歷時兩年、由 3500 人開發的 GPT-o1。DeepSeek 透過最佳化招聘,專注於招聘應屆畢業生,成功控制了成本。該公司的開源模型可供公眾免費下載和使用,與 OpenAI 等公司主要提供付費訂閱產品的做法不同。DeepSeek 的技術突破被視為 AI 領域的一大進步。該模型的釋出震驚了美國科技界,僅一天就導致多家大公司市值蒸發 1 萬億美元。DeepSeek 的成功源於其獨特的模型設計和訓練方法。該公司採用 Mixture-of-Experts (MoE) 系統,僅啟用 671 億引數中的 37 億引數來完成每項任務,大幅提高了效率。此外,DeepSeek 還開發了 Group Relative Policy Optimization 技術,提高了模型的決策能力。DeepSeek 承諾以 MIT 許可證釋出開源模型,允許使用者下載、部署和定製,這與其他公司保持專有系統的做法不同。開源模型有助於開發者改進和分享技術,促進持續的進化和升級。DeepSeek 得益於大量的 Nvidia A100 GPU 和相對便宜的硬體。有人估計 DeepSeek 可以訪問約 5 萬個 GPU,而 OpenAI 訓練 ChatGPT 使用了 50 萬個 GPU。許多 AI 專家讚揚 DeepSeek 是一個強大、高效且低成本的模型,但也有人擔心其隱私和資料安全問題。OpenAI CEO Sam Altman 承認 DeepSeek 是一個強大的競爭對手,但 OpenAI 隨後指控 DeepSeek 使用了 OpenAI 的專有模型進行訓練。DeepSeek 還面臨關於服務條款、網路安全實踐和與中國政府關係的批評。DeepSeek 的迅速崛起正在挑戰西方科技公司的主導地位,並引發關於 AI 未來的重大問題:誰來構建、誰來控制,以及 AI 是否應該對所有人開放和可訪問。DeepSeek 的長期影響仍存在許多未知數。

什麼是 DeepSeek？ ChatGPT 的中國競爭對手正在席捲全球

2026 年的第一個週末，表現良好的代幣有望延續上週的上漲趨勢。受外部市場信號影響的山寨幣也有望……

本週末值得關注的 3 種山寨幣| 1 月 3 日至 4 日

受對替代價值儲存手段的需求不斷增長以及監管前景明朗的推動，人們對加密貨幣在 2026 年的表現抱有很高的期望。

據 Grayscale 研究主管 Zach Pandl 稱，更多支撐……

Grayscale預測比特幣將在2026年3月創下歷史新高。

據鏈上調查員 ZachXBT 稱，數百個分佈在多個兼容 EVM區塊鏈上的加密貨幣錢包正在被提取，攻擊仍在繼續，損失也在上漲。在頻道中……