Bài viết này được dịch máy
Xem bản gốc
Karpathy đã chia sẻ cách anh ấy xây dựng một cơ sở tri thức AI cục bộ, rất giống với phương pháp tôi đã sử dụng, nhưng vẫn còn nhiều điều tôi có thể học hỏi từ đó. Tôi khuyên các bạn nên xem qua.
Tất cả chúng đều sử dụng Obsidian, MD cục bộ thuần túy, và sau đó kết nối chúng bằng một số liên kết ngược và chỉ mục.
Anh ấy đã xây dựng một kho tri thức Wiki cá nhân dựa trên một mô hình ngôn ngữ lớn, rồi đưa tất cả dữ liệu thô vào một mục lục có tên là RAW.
Sau đó, mô hình ngôn ngữ quy mô lớn sẽ biên soạn các nguyên liệu thô này thành một Wiki Markdown, cho phép thực hiện các chức năng như tự động tạo tóm tắt, tạo chỉ mục, tạo mục khái niệm, thêm liên kết nội bộ, tạo hình ảnh trực quan, v.v.
Tôi đã làm việc này khi thu thập nội dung; tôi đã sử dụng plug-in cắt nội dung web Obsidian.
Khi thu thập nội dung, AI sẽ tự động thực hiện các quy trình sau: gắn thẻ, tóm tắt tự động, dịch thuật và tạo bản tóm tắt. Hiện tại, chưa có backlink.
Sau khi Wiki được xây dựng xong, bạn có thể đặt câu hỏi trên Wiki này để đảm bảo tính xác thực của các nguồn dữ liệu.
Ví dụ, một mô hình ngôn ngữ quy mô lớn có thể tự động tìm kiếm trong các chỉ mục, đọc các tài liệu liên quan và viết câu trả lời hoặc báo cáo, thay vì chỉ tìm kiếm trên các trang web. Bằng cách này, thông tin mà nó thu được về cơ bản là phù hợp với bạn.
Kết quả đầu ra không phải là một câu đơn lẻ, mà là một tập tin mới, một trang web trực quan mới hoặc một bản trình chiếu PowerPoint, sau đó được trả về cơ sở tri thức để làm cho cơ sở tri thức ngày càng phong phú hơn khi được sử dụng.
Tuy nhiên, điều này lại gây ra một vấn đề, như các tác giả của Obsidian đã nêu, đó là nó có thể làm ô nhiễm kho tri thức. Do đó, tốt nhất là nên tách biệt các nguồn đáng tin cậy và nội dung do AI tạo ra.
Một khía cạnh tích cực khác là nó cho phép các mô hình lớn thực hiện kiểm tra sức khỏe của Wiki. Ví dụ, nó có thể xác định các mâu thuẫn, bổ sung thông tin còn thiếu, khám phá các mối liên hệ mới và cải thiện tính nhất quán.
Thực tế, hiện nay nhiều người đang làm điều này, và tôi cũng đã tích hợp khái niệm này vào CodePilot.
Về việc lựa chọn thư mục trợ lý, tôi thường khuyên dùng thư mục Obsidian.
Nếu bạn có thư mục Obsidian riêng, AI sẽ trực tiếp truy cập tất cả ngữ cảnh và kiến thức của bạn ngay khi bạn vào đó.
Ví dụ, tôi đã nhờ anh ấy tìm một số bài viết về nguyên tắc thiết kế giao diện người dùng trong kỷ nguyên AI từ thư mục Obsidian của tôi và trên internet. Chất lượng của những bài viết này rất cao.
Bằng cách này, bạn có thể trực tiếp sở hữu một trợ lý AI với bộ nhớ đầy đủ.
Nếu bạn không biết cách luyện tập, tôi khuyên bạn nên thử trợ lý của Codepilot.
Đặt thư mục Obsidian của bạn vào đó và để nó tự động sắp xếp, đồng thời để nó ghi các nguyên tắc này vào Claude.md.

Andrej Karpathy
@karpathy
LLM Knowledge Bases
Something I'm finding very useful recently: using LLMs to build personal knowledge bases for various topics of research interest. In this way, a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating



Hình ảnh được tạo nên từ chuối 🍌

歸藏(guizang.ai)
@op7418
用香蕉做一张图片,来解释 Karpathy 的方法和我的方法之间的一些区别和共性 x.com/op7418/status/…

Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan





