avatar
歸藏(guizang.ai)
90,871 người theo dõi trên Twitter
Theo dõi
关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design) AIGC 周刊主理人|公众号:歸藏的AI工具箱
Bài đăng
avatar
歸藏(guizang.ai)
Hôm qua, Alibaba đã phát hành Qwen 3.6 Plus, với những cải tiến đáng kể về khả năng của agent và lập trình! Gần đây anh ấy rất năng suất: đầu tiên là Omni 3.5, sau đó là Wanxiang 2.7, rồi đến Qwen 3.6 Plus, và có vẻ như Max cũng sẽ sớm được ra mắt. Về mặt phát triển và đánh giá của người dùng, mô hình 3.6 Plus hiện đã cho thấy những cải tiến đáng kể so với phiên bản 3.5. Qwen 3.6 Plus cũng đã được nâng cấp khả năng hiểu hình ảnh và tài liệu. Ví dụ, nó hoạt động đặc biệt tốt trong các lĩnh vực sau: trải nghiệm nhận dạng hình ảnh toán học, trả lời câu hỏi thực tế bằng giọng nói và khả năng nhận dạng ký tự quang học (OCR). Đây cũng là những lĩnh vực mà Qwen trước đây đã khá mạnh. Tuyệt vời hơn nữa, lần nó hỗ trợ mặc định 1 triệu ngữ cảnh. Đầu ra dài nhất gần 991K, và đầu vào là 64K. Hiệu năng với 1 triệu ngữ cảnh vẫn thuộc hàng đỉnh cao. Về trải nghiệm phát triển, nó tốt hơn đáng kể so với phiên bản 256 ban đầu. Về giá cả, chi phí đầu vào của Qwen 3.6 Plus là 2 nhân dân tệ cho mỗi triệu token, và chi phí đầu ra là 12 nhân dân tệ cho mỗi triệu token. Ngoài ra, một số công cụ (như trích xuất trang web) hiện đang được cung cấp miễn phí trong thời gian có hạn. Nó đã ra mắt Bailian rồi. Qoder và Wukong của Alibaba cũng sẽ sớm có mặt; hy vọng họ cũng sẽ sớm được đưa vào kế hoạch mã nguồn. Nếu bạn không chắc chắn về chất lượng, bạn có thể trải nghiệm miễn phí trên OpenRouter để xem hiệu năng của nó như thế nào. twitter.com/op7418/status/2039...
MAX
5.63%
avatar
歸藏(guizang.ai)
Nội dung chủ đề
Karpathy đã chia sẻ cách anh ấy xây dựng một cơ sở tri thức AI cục bộ, rất giống với phương pháp tôi đã sử dụng, nhưng vẫn còn nhiều điều tôi có thể học hỏi từ đó. Tôi khuyên các bạn nên xem qua. Tất cả chúng đều sử dụng Obsidian, MD cục bộ thuần túy, và sau đó kết nối chúng bằng một số liên kết ngược và chỉ mục. Anh ấy đã xây dựng một kho tri thức Wiki cá nhân dựa trên một mô hình ngôn ngữ lớn, rồi đưa tất cả dữ liệu thô vào một mục lục có tên là RAW. Sau đó, mô hình ngôn ngữ quy mô lớn sẽ biên soạn các nguyên liệu thô này thành một Wiki Markdown, cho phép thực hiện các chức năng như tự động tạo tóm tắt, tạo chỉ mục, tạo mục khái niệm, thêm liên kết nội bộ, tạo hình ảnh trực quan, v.v. Tôi đã làm việc này khi thu thập nội dung; tôi đã sử dụng plug-in cắt nội dung web Obsidian. Khi thu thập nội dung, AI sẽ tự động thực hiện các quy trình sau: gắn thẻ, tóm tắt tự động, dịch thuật và tạo bản tóm tắt. Hiện tại, chưa có backlink. Sau khi Wiki được xây dựng xong, bạn có thể đặt câu hỏi trên Wiki này để đảm bảo tính xác thực của các nguồn dữ liệu. Ví dụ, một mô hình ngôn ngữ quy mô lớn có thể tự động tìm kiếm trong các chỉ mục, đọc các tài liệu liên quan và viết câu trả lời hoặc báo cáo, thay vì chỉ tìm kiếm trên các trang web. Bằng cách này, thông tin mà nó thu được về cơ bản là phù hợp với bạn. Kết quả đầu ra không phải là một câu đơn lẻ, mà là một tài liệu mới, một trang web trực quan mới, hoặc một bài thuyết trình PowerPoint, sau đó được trả về cơ sở tri thức để làm cho cơ sở tri thức ngày càng phong phú hơn khi được sử dụng. Tuy nhiên, điều này tạo ra một vấn đề, như các tác giả của Obsidian đã nêu, đó là nó có thể làm ô nhiễm kho tri thức. Do đó, tốt nhất là nên tách biệt các nguồn đáng tin cậy và nội dung do AI tạo ra. Một khía cạnh tích cực khác là nó cho phép các mô hình lớn thực hiện kiểm tra sức khỏe của Wiki. Ví dụ, nó có thể xác định các mâu thuẫn, bổ sung thông tin còn thiếu, khám phá các mối liên hệ mới và cải thiện tính nhất quán. Thực tế, hiện nay nhiều người đang làm điều này, và tôi cũng đã tích hợp khái niệm này vào CodePilot. Về việc lựa chọn thư mục trợ lý, tôi thường khuyên dùng thư mục Obsidian. Nếu bạn có thư mục Obsidian riêng, AI sẽ trực tiếp truy cập tất cả ngữ cảnh và kiến ​​thức của bạn ngay khi bạn vào đó. Ví dụ, tôi đã nhờ anh ấy tìm một số bài viết về nguyên tắc thiết kế giao diện người dùng trong kỷ nguyên AI từ thư mục Obsidian của tôi và trên internet. Chất lượng của những bài viết này rất cao. Bằng cách này, bạn có thể trực tiếp sở hữu một trợ lý AI với bộ nhớ đầy đủ. Nếu bạn không biết cách luyện tập, tôi khuyên bạn nên thử trợ lý của Codepilot. Đặt thư mục Obsidian của bạn vào đó và để nó tự động sắp xếp, đồng thời để nó ghi các nguyên tắc này vào Claude.md. twitter.com/op7418/status/2039...
avatar
歸藏(guizang.ai)
Nội dung chủ đề
Google đã phát hành Gemma 4 ngày hôm qua, lần thực sự tuyệt vời! Nó được thiết kế đặc biệt để chạy trên các thiết bị cục bộ (như điện thoại di động và máy tính) và hỗ trợ việc sử dụng các tác nhân và công cụ. Kích thước của bốn tham số: E2B: Tập trung vào điện thoại di động/IoT/thiết bị biên. E4B: Được thiết kế cho thiết bị di động + Jetson/Raspberry Pi. 26B MoE: 3,8B lần kích hoạt, với các thông số hiệu quả rất nhỏ, tập trung vào TPS cao và độ trễ thấp. 31B Mật độ cao: Loại 31B có mật độ cao, chủ yếu dành cho máy trạm để bàn/máy tính H100 một card, v.v. Lần, họ ưu tiên hỗ trợ cho Quy trình làm việc của Cơ quan: hỗ trợ gốc cho các Lệnh gọi hàm, JSON và đầu ra có cấu trúc, cũng như các Hướng dẫn hệ thống. Ấn tượng hơn nữa, đây là một mô hình đa phương thức gốc hỗ trợ hiểu hình ảnh và video, chuyển đổi giọng nói thành văn bản và có thể hoạt động như một trợ lý giọng nói cục bộ. Hơn nữa, lần là mã nguồn mở Apache 2.0 chính hãng, cho phép sử dụng thương mại, phân phối lại và tích hợp vào sản phẩm, cũng như triển khai sở hữu tư nhân, mà không có điều khoản bổ sung nào. twitter.com/op7418/status/2039...
IOT
0%
loading indicator
Loading..