DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng trên nền tảng mã nguồn mở. DeepSeek cũng làm chấn động ngành công nghiệp AI khi ch...

DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng trên nền tảng mã nguồn mở.DeepSeek cũng làm chấn động ngành công nghiệp AI khi chứng minh rằng có thể phát triển một AI mạnh mẽ chỉ với chi phí 6 triệu USD cho phần cứng, trong khi các công ty Mỹ như <a href="https://tapchibitcoin.io/openai-la-gi-cong-ty-ai-dung-sau-chatgpt.html" rel="nofollow">OpenAI</a>, Google và Microsoft đã đầu tư hàng tỷ USD.<img src="https://tapchibitcoin.io/wp-content/uploads/2025/01/DeepSeek-AI-.jpg" alt="">DeepSeek là dự án của nhà đầu tư kiêm doanh nhân Lương Văn Phong (Liang Wenfeng), sinh năm 1985, ông từng theo học ngành kỹ thuật thông tin điện tử và truyền thông tại Đại học Chiết Giang. Liang bắt đầu sự nghiệp AI bằng cách ứng dụng công nghệ này vào giao dịch định lượng, đồng sáng lập quỹ phòng hộ High-Flyer Quantitative Investment Management có trụ sở tại Hàng Châu vào năm 2015. Đến năm 2023, Liang thành lập DeepSeek với mục tiêu thúc đẩy trí tuệ nhân tạo tổng quát (AGI).DeepSeek ra mắt mô hình ngôn ngữ lớn đầu tiên, DeepSeek-Coder, vào ngày 29 tháng 11 năm 2023.Tuy nhiên, phải đến ngày 20 tháng 1 năm 2025, khi DeepSeek-R1 được công bố, công ty này mới thực sự làm khuynh đảo ngành <a href="https://tapchibitcoin.io/ai-la-gi.html" rel="nofollow">AI</a>.Với đội ngũ chỉ chưa tới 200 người và ngân sách vỏn vẹn 6 triệu USD, DeepSeek đã phát hành một mô hình mã nguồn mở miễn phí, đạt chất lượng ngang ngửa GPT-o1 của OpenAI – một dự án tiêu tốn tới 600 triệu USD và mất khoảng hai năm với 3.500 nhân sự để phát triển.Không giống các tập đoàn công nghệ phương Tây với đội ngũ nhân sự khổng lồ, DeepSeek tối ưu hóa việc tuyển dụng bằng cách tập trung vào sinh viên mới tốt nghiệp: “Kinh nghiệm làm việc từ 3 đến 5 năm là tối đa, và những người có hơn 8 năm kinh nghiệm gần như bị loại,” một chuyên gia tuyển dụng tiết lộ với 36kr, trang tin công nghệ hàng đầu Trung Quốc.Ngoài ra, trong khi OpenAI và các mô hình AI hàng đầu khác chủ yếu được cung cấp dưới dạng sản phẩm đăng ký trả phí, mã nguồn của DeepSeek hoàn toàn mở, có thể được kiểm tra công khai và tải xuống để chạy cục bộ trên máy tính thông qua nền tảng Hugging Face hoặc sử dụng miễn phí qua ứng dụng di động.Công nghệ nền tảng của DeepSeek được xem là một bước đột phá lớn trong lĩnh vực AI. Việc ra mắt mô hình này đã gây chấn động giới công nghệ Mỹ, khiến tổng vốn hóa thị trường của các công ty lớn bốc hơi 1.000 tỷ USD chỉ trong một ngày.Thành công của DeepSeek đến từ cách tiếp cận độc đáo trong thiết kế và huấn luyện mô hình. Giống như một siêu máy tính song song khổng lồ chia nhỏ nhiệm vụ để xử lý đồng thời, hệ thống Mixture-of-Experts (MoE) của DeepSeek chỉ kích hoạt khoảng 37 tỷ trong tổng số 671 tỷ tham số cho mỗi tác vụ. Cách tiếp cận này giúp tối ưu hiệu suất đáng kể, giảm chi phí tính toán trong khi vẫn duy trì hiệu suất hàng đầu trên nhiều ứng dụng.DeepSeek còn cải tiến quá trình huấn luyện thông qua Group Relative Policy Optimization, một kỹ thuật học tăng cường giúp nâng cao khả năng ra quyết định bằng cách so sánh lựa chọn của mô hình với các tác nhân học tập tương tự. Điều này giúp AI tinh chỉnh lập luận hiệu quả hơn, từ đó tạo ra dữ liệu huấn luyện chất lượng cao hơn.Bên cạnh đó, DeepSeek cam kết tính minh bạch và khả năng tiếp cận mã nguồn mở khi phát hành mô hình của mình theo giấy phép MIT. Điều này cho phép người dùng tải xuống, triển khai và tùy chỉnh mô hình AI, tạo nên sự khác biệt so với các đối thủ duy trì hệ thống độc quyền. Mô hình mã nguồn mở cũng giúp các nhà phát triển cải thiện và chia sẻ công nghệ, tạo ra một chu kỳ tiến hóa và nâng cấp liên tục.DeepSeek được hỗ trợ bởi lượng lớn chip Nvidia A100 kết hợp với phần cứng giá rẻ hơn. Một số ước tính cho rằng DeepSeek có quyền truy cập vào khoảng 50.000 GPU Nvidia, so với con số 500.000 GPU mà OpenAI đã sử dụng để huấn luyện ChatGPT.Nhiều chuyên gia công nghệ AI ca ngợi DeepSeek là một mô hình mạnh mẽ, hiệu quả và chi phí thấp, trong khi một số ý kiến chỉ trích bày tỏ lo ngại về quyền riêng tư và bảo mật dữ liệu.“Chúng ta đang sống trong một thời điểm mà một công ty ngoài Mỹ lại giữ vững sứ mệnh ban đầu của OpenAI—một nghiên cứu mở, tiên phong và trao quyền cho tất cả mọi người. Điều này thật khó tin,” Jim Fan, Giám đốc Nghiên cứu cấp cao của Nvidia, viết trên X. “Kết cục thú vị nhất cũng là kết cục dễ xảy ra nhất.”Ngay cả CEO của OpenAI, Sam Altman, cũng thừa nhận DeepSeek là một đối thủ đáng gờm:“Chúng tôi chắc chắn sẽ tạo ra những mô hình tốt hơn, nhưng thật sự là rất thú vị khi có một đối thủ mới!” Altman chia sẻ trên X.Tuy nhiên, chỉ vài ngày sau đó, OpenAI tuyên bố đã tìm thấy bằng chứng cho thấy DeepSeek sử dụng các mô hình độc quyền của OpenAI để huấn luyện mô hình AI của riêng mình bằng hành động gọi là chưng cất.Ngoài ra, DeepSeek còn vấp phải chỉ trích về điều khoản dịch vụ, thực tiễn an ninh mạng và mối quan hệ tiềm tàng với chính phủ Trung Quốc. Một số chuyên gia cũng lo ngại về lượng dữ liệu người dùng mà DeepSeek thu thập, bao gồm model thiết bị, hệ điều hành, mẫu gõ phím và địa chỉ IP—tất cả đều được lưu trữ trên các máy chủ đặt tại Trung Quốc theo chính sách quyền riêng tư của công ty.“Vấn đề quyền riêng tư vẫn luôn tồn tại khi nói đến Trung Quốc. Luôn có sự thu thập dữ liệu từ người dùng, vì vậy hãy cẩn trọng,” Kevin Surace, CEO của Appvance nói. “Điều này sẽ buộc tất cả chúng ta phải suy nghĩ lại về cách huấn luyện mô hình và lượng tài nguyên cần thiết để vận hành AI.”Sự trỗi dậy nhanh chóng của DeepSeek đang thách thức vị thế thống trị của các tập đoàn công nghệ phương Tây và đặt ra những câu hỏi lớn về tương lai của AI—ai sẽ xây dựng, ai kiểm soát, và AI có nên được mở và dễ tiếp cận cho tất cả mọi người hay không.Tuy nhiên, vẫn còn nhiều nghi vấn về tác động dài hạn của DeepSeek, và liệu Tổng thống Mỹ Donald Trump có phản ứng trước sự thống trị bất ngờ của Trung Quốc trong lĩnh vực AI bằng một lệnh cấm tương tự như TikTok hay không. Liệu High-Flyer có thổi phồng hiệu suất sử dụng GPU để khiến DeepSeek trông hiệu quả hơn thực tế? Việc ra mắt công khai bất ngờ của DeepSeek có phải là một chiêu trò nhằm kéo giá cổ phiếu Nvidia xuống để mang lại lợi ích cho các nhà đầu tư có vị thế tốt?

DeepSeek là gì? Đối thủ của ChatGPT đến từ Trung Quốc đang gây bão trên toàn cầu

DeepSeek,一家中国初创公司,凭借其基于<开源>平台构建的强大语言模型在科技行业引起了轰动。DeepSeek还在AI行业掀起了轰动,因为它...

DeepSeek，一家中国初创公司，凭借其强大的大型语言模型和开源基础设施在科技界引起了轰动。DeepSeek 在证明仅用 600 万美元的硬件成本就能开发出与 OpenAI、谷歌和微软等公司耗资数十亿美元开发的 AI 模型相媲美的强大 AI 系统时,引发了 AI 行业的震动。<img src="https://tapchibitcoin.io/wp-content/uploads/2025/01/DeepSeek-AI-.jpg" alt="">DeepSeek 是由投资者兼企业家梁文峰于 2023 年创立的,目标是推动通用人工智能(AGI)的发展。DeepSeek 于 2023 年 11 月 29 日首次发布了其语言模型 DeepSeek-Coder,但直到 2025 年 1 月 20 日 DeepSeek-R1 的发布,该公司才真正引起 AI 行业的轰动。凭借不到 200 人的团队和仅 600 万美元的预算,DeepSeek 发布了一个免费开源的模型,其质量堪比 OpenAI 耗资 6 亿美元、历时两年、由 3500 人开发的 GPT-o1。DeepSeek 通过优化招聘,专注于招聘应届毕业生,成功控制了成本。该公司的开源模型可供公众免费下载和使用,与 OpenAI 等公司主要提供付费订阅产品的做法不同。DeepSeek 的技术突破被视为 AI 领域的一大进步。该模型的发布震惊了美国科技界,仅一天就导致多家大公司市值蒸发 1 万亿美元。DeepSeek 的成功源于其独特的模型设计和训练方法。该公司采用 Mixture-of-Experts (MoE) 系统,仅激活 671 亿参数中的 37 亿参数来完成每项任务,大幅提高了效率。此外,DeepSeek 还开发了 Group Relative Policy Optimization 技术,提高了模型的决策能力。DeepSeek 承诺以 MIT 许可证发布开源模型,允许用户下载、部署和定制,这与其他公司保持专有系统的做法不同。开源模型有助于开发者改进和分享技术,促进持续的进化和升级。DeepSeek 得益于大量的 Nvidia A100 GPU 和相对便宜的硬件。有人估计 DeepSeek 可以访问约 5 万个 GPU,而 OpenAI 训练 ChatGPT 使用了 50 万个 GPU。许多 AI 专家赞扬 DeepSeek 是一个强大、高效且低成本的模型,但也有人担心其隐私和数据安全问题。OpenAI CEO Sam Altman 承认 DeepSeek 是一个强大的竞争对手,但 OpenAI 随后指控 DeepSeek 使用了 OpenAI 的专有模型进行训练。DeepSeek 还面临关于服务条款、网络安全实践和与中国政府关系的批评。DeepSeek 的迅速崛起正在挑战西方科技公司的主导地位,并引发关于 AI 未来的重大问题:谁来构建、谁来控制,以及 AI 是否应该对所有人开放和可访问。DeepSeek 的长期影响仍存在许多未知数。

什么是 DeepSeek？ ChatGPT 的中国竞争对手正在席卷全球

加密没有永远的冬天或盛夏，活下来、是唯一的叙事。

2025 年加密死亡项目复盘：累计近 7 亿美元融资，昔日明星项目扎堆谢幕

图表已经说明了一切，市场情绪也随之转变。随着2025年接近尾声，我们必须面对现实：比特币已经正式进入熊市。
数月来，交易员和分析师一直在争论价格走势仅仅是盘整阶段还是更深度的修正。现在确认信号已经到来，不仅体现在价格上，还体现在链上数据、资本流动逆转和破碎的市场结构的汇合上。虽然“熊市”这个词常常引发恐慌，但了解这次低迷的机制是成功度过难关的第一步。
本深度分析将详细拆解定义2025年末当前格局的...

比特币正式进入熊市：链上证据、资金流向与投资者如何获利

美国最大的加密货币交易所 Coinbase 将上线 Lighter (LIT) 代币，该代币今日发布后引起了广泛关注。

*本文不构成投资建议。