Một tính năng mới bị đánh giá thấp của ChatGPT, một nghiên cứu chuyên sâu trong 10 phút về cơ sở mã DeepSeek

avatar
36kr
05-19
Bài viết này được dịch máy
Xem bản gốc

ChatGPT đã âm thầm ra mắt tính năng mới kết nối trực tiếp tới Github, tính năng này thực sự rất mạnh mẽ! Sau khi kết nối với Github, nó ngay lập tức biến thành một "quái vật nghiên cứu": bất kể đó là dự án mã nguồn mở nổi tiếng như DeepSeek hay tài liệu tự làm của riêng bạn, miễn là chúng được đưa vào kho, chúng có thể được chuyển giao cho nghiên cứu chuyên sâu và có thể tạo báo cáo chuyên nghiệp chỉ bằng một cú nhấp chuột.

Khoảng 5 ngày trước, ChatGPT đã "âm thầm"ra mắt tính năng mới, chức năng Nghiên cứu sâu có thể kết nối trực tiếp đến kho lưu trữ Github.

Khi tính năng này mới ra mắt, phản ứng đầu tiên của tôi là nó dành cho lập trình viên, nhưng sau khi sử dụng gần đây, tôi thấy tính năng này rất mạnh mẽ - phạm vi ứng dụng rộng hơn nhiều so với tôi tưởng tượng.

Không chỉ dùng để xem lại mã hoặc tạo báo cáo, ChatGPT, có thể kết nối với Github, còn hiệu quả hơn bạn có thể tưởng tượng sau khi sử dụng nhiều - nó có thể tiến hành nghiên cứu chuyên sâu theo hầu hết mọi hướng.

Chỉ cần là kho lưu trữ công khai mã nguồn mở Github, bạn có thể nhanh chóng xuất ra báo cáo nghiên cứu cấp độ chuyên nghiệp thông qua chuỗi "dự án kho lưu trữ chính thức- Phân nhánh kho lưu trữ sang tài khoản cá nhân - ChatGPT - Kết nối Github - nghiên cứu chuyên sâu- chọn kho lưu trữ cá nhân - báo cáo hoàn chỉnh"!

Tôi xin giới thiệu sơ qua lần sau khi kết nối với Github, ChatGPT có khả năng tự động đọc, phân tích cú pháp và tóm tắt toàn bộ kho lưu trữ GitHub.

Trước đây, nếu bạn muốn khám phá và nghiên cứu một dự án mã nguồn mở, bạn thường mất vài ngày để đọc mã nguồn, nhưng hiện nay với trình kết nối ChatGPT+Github, hiệu quả đã được cải thiện đáng kể.

Nếu trước đây chúng ta phải đào kho báu trên Github bằng xẻng, thì bây giờ chúng ta có thể sử dụng trực tiếp máy đào!

Ví dụ, tôi đã yêu cầu ChatGPT phân tích một trong những kho hàng của tôi. Bước đầu tiên là bước Nghiên cứu sâu thông thường, đó là xác định nội dung nghiên cứu và sau đó bắt đầu nhiệm vụ.

ChatGPT sẽ tiến hành phân tích toàn diện về kiến ​​trúc chức năng, mô-đun cốt lõi, ngăn xếp công nghệ và trạng thái bảo trì của toàn bộ mã kho.

Sau một thời gian nghiên cứu, bạn có thể tạo ra một báo cáo nghiên cứu rất chuyên nghiệp mà hầu như không có ảo tưởng nào.

Báo cáo này đã gần hoàn thiện mọi nghiên cứu và phân tích có thể thực hiện trên một dự án.

Báo cáo này chủ yếu bao gồm sáu phần chính: 1. Kiến trúc kỹ thuật 2. Phân tích mô-đun cốt lõi 3. Đánh giá chất lượng mã 4. Tài liệu 5. Hoạt động kho lưu trữ và trạng thái bảo trì 6. Khả năng áp dụng của dự án

Vì chúng ta có thể nghiên cứu một nhà kho, vậy chúng ta có thể nghiên cứu các nhà kho khác không? Kho lưu trữ Github không nhất thiết phải chứa mã; bất kỳ tập tin nào cũng có thể được tải lên.

Đợi đã, vì ChatGPT có thể cung cấp khả năng nghiên cứu chuyên sâu mạnh mẽ, còn trình kết nối Github giới hạn phạm vi nghiên cứu, nên hai khả năng này kết hợp lại tương đương với một nhà nghiên cứu rất chuyên nghiệp trong một lĩnh vực cụ thể!

Trước khi chức năng này ra đời, ChatGPT chủ yếu dựa vào mạng lưới để tiến hành nghiên cứu chuyên sâu . Mặc dù có thể thu thập được nhiều thông tin hơn, nhưng khả năng "ảo giác" cũng sẽ tăng lên đồng thời.

Nhưng nếu chúng ta giới hạn "phạm vi nghiên cứu" bằng cách sử dụng Github, liệu báo cáo " nghiên cứu chuyên sâu " do ChatGPT cung cấp có chuyên nghiệp hơn không?

Rất dễ để giới hạn phạm vi. Chỉ cần thay thế nội dung kho bằng thông tin bạn muốn. Điều này tương đương với hàm RAG+MCP đặc biệt.

Chúng ta hãy làm ngay bây giờ nhé. Hãy sử dụng mã mã nguồn mở trên Github để thử nghiệm hiệu ứng này.

Toàn bộ cuộc sống: nghiên cứu búp bê lồng nhau DeepSeek

Lần, tôi muốn ChatGPT tạo một báo cáo phân tích chuyên nghiệp về DeepSeek-R1 và tình cờ là DeepSeek-V3 đã được mã nguồn mở trên Github.

Chỉ cần chọn Kết nối với Github trong Nghiên cứu chuyên sâu và chọn kho lưu trữ tương ứng.

Để dễ vận hành, trước tiên tôi đã phân nhánh DeepSeek-R1 vào kho lưu trữ của riêng tôi. Vì các trình kết nối cho ChatGPT và Github cần lập chỉ mục để tìm kho lưu trữ, nên việc sao chép nó vào kho lưu trữ cá nhân của tôi sẽ đẩy nhanh quá trình lập chỉ mục.

Vậy quá trình này như sau:

Kho lưu trữ chính thức DeepSeek-R1 - Kho lưu trữ DeepSeek-R1 Fork - ChatGPT - Trình kết nối Github - Chọn Nghiên Cứu Chuyên Sâu- Chọn kho lưu trữ Github làm kho lưu trữ DeepSeek-R1 Fork.

Sau đó, bạn có thể sụp đổ một tách cà phê và xem ChatGPT hoạt động chỉ trong 10 phút!

Khi ChatGPT bắt đầu nghiên cứu chuyên sâu, giao diện của nó được hiển thị như hình bên dưới, với quy trình hoạt động và các nguồn thông tin nghiên cứu được gọi đến ở bên phải.

Có thể thấy rằng trong nhiệm vụ này, ChatGPT chỉ sử dụng nội dung tệp bị giới hạn bởi kho lưu trữ Github.

Sau khi chờ khoảng mười đến hai mươi phút, ChatGPT sẽ xử lý và cân nhắc cẩn thận thông tin này ở chế độ ẩn.

Bạn có thể thấy rằng báo cáo này thực sự dài và rất chi tiết, và mỗi phần đều có thể được truy ngược về vị trí của tệp gốc.

Những ai quan tâm có thể xem qua liên kết này: https://chatgpt.com/share/682571fe-52c8-8013-a8f1-c85562ec1850

Tôi xin giới thiệu sơ qua về chất lượng của báo cáo đã tạo. Báo cáo bắt đầu với kiến ​​trúc mô hình R1, sau đó là quy trình đào tạo dữ liệu R1, tiếp theo là cơ chế đào tạo, lý luận và triển khai, và cuối cùng là sự đổi mới của mô hình.

Có thể nói đây là một báo cáo nghiên cứu mô hình rất hoàn thiện , sử dụng kho lưu trữ chính thức của DeepSeek-R1 và thậm chí còn có phần giải thích về mã nguồn mô-đun-đun của DeepSeek-R1 ở cuối.

Có thể nói là rất chi tiết.

Một lợi ích khác khi sử dụng ChatGPT+Github để nghiên cứu chuyên sâu là sau khi báo cáo nghiên cứu được công bố, bạn có thể trực tiếp đặt câu hỏi trong ChatGPT để tiến hành nghiên cứu sâu hơn.

Toàn bộ quá trình diễn ra vô cùng suôn sẻ.

Sử dụng "kỹ thuật lập chỉ mục" để tăng tốc độ khám phá kho lưu trữ

Một điều cần lưu ý là hiện tại trình kết nối ChatGPT+Github không thực sự nhanh khi lập chỉ mục kho lưu trữ.

Ví dụ, tôi không thể tìm thấy kho lưu trữ lúc đầu và tôi đã liên tục khởi động lại trình kết nối nhưng vẫn không tìm thấy kho lưu trữ, dù đó là kho lưu trữ của riêng tôi hay kho lưu trữ công khai khác.

Sau đó tôi tìm thấy hướng dẫn trong tài liệu chính thức của OpenAI. OpenAI đề cập rằng kho lưu trữ Github cần được kích hoạt thủ công trước khi chúng có thể được thêm vào danh sách chỉ mục và được trình kết nối tìm thấy.

ChatGPT cũng cung cấp giải pháp cho vấn đề này, đó là tìm kiếm kho lưu trữ trong hộp tìm kiếm Github hoặc tải lên bản cập nhật mới.

Không nhất thiết phải là mã

Trên thực tế, tính năng này của ChatGPT rất mạnh mẽ. Nó chủ yếu sử dụng chức năng truy cập kho lưu trữ Github để nghiên cứu chuyên sâu.

Mở rộng ra, bạn có thể tải một số nội dung cụ thể, chẳng hạn như PDF, Word, v.v. lên kho dữ liệu mới tạo, sau đó sử dụng quy trình này để tiến hành nghiên cứu.

Điều này giới hạn dữ liệu nghiên cứu trong một phạm vi cố định, đồng thời tận dụng khả năng sắp xếp nhiều tệp khác nhau của trình kết nối Github. Rốt cuộc, khi phân tích kho lưu trữ của một dự án, Github cũng sẽ phân biệt các loại tệp khác nhau.

Đây là sự kết hợp hoàn hảo giữa RAG và MCP. Nó không chỉ sử dụng các khả năng mô hình mạnh mẽ của ChatGPT mà còn sử dụng khả năng xây dựng kho lưu trữ của Github. Nó thực sự hoàn hảo.

Điều quan trọng nhất là tính năng này có sẵn cho bất kỳ người dùng nào đã kích hoạt Plus. Theo quan điểm này, ChatGPT Plus cuối cùng lần xứng đáng với mức giá 20 đô la.

Cách mới này kết nối độ sâu ChatGPT và GitHub và củng cố lẫn nhau thực sự mở ra một mô hình nghiên cứu mới.

Cho dù bạn muốn nhanh chóng bắt đầu một dự án mã nguồn mở chưa quen thuộc hay phân tích chính xác nội dung trong một lĩnh vực cụ thể, bạn đều có thể sử dụng kết hợp này.

Quan trọng hơn, lối chơi này thậm chí có thể được mở rộng sang nhiều loại vật liệu nghiên cứu khác nhau, tạo ra sự kết hợp RAG+MCP thực sự - chuyên nghiệp và hiệu quả.

Nếu bạn có cách chơi thú vị và vui nhộn hơn, hãy chia sẻ ở phần bình luận.

Tham khảo

https://help.openai.com/en/articles/11145903-connecting-github-to-chatgpt-deep-research

https://x.com/OpenAIDevs/status/1920556386083102844

Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Dinghui và được 36Kr cho phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận