avatar
头雁
21,116 người theo dõi trên Twitter
Theo dõi
科技 / AI / BTC / ZK
Bài đăng
avatar
头雁
12-12
OpenAI vừa phát hành phiên bản GPT 5.2 mới nhất, mang đến những cải tiến đáng kể về trí tuệ tổng quát, khả năng hiểu ngữ cảnh dài hạn, tác nhân và thị giác máy tính. - Mô hình này hoạt động tốt hơn trong tạo ra bảng tính, thiết kế bài thuyết trình, viết mã, nhận dạng hình ảnh, hiểu ngữ cảnh của văn bản dài, sử dụng công cụ và xử lý các dự án phức tạp nhiều bước. GPT-5.2 đã thiết lập các tiêu chuẩn ngành trong nhiều bài kiểm tra, bao gồm cả GDPval. Trong bài kiểm tra đó, nó vượt qua các chuyên gia trong ngành về nhiệm vụ công việc dựa trên kiến ​​thức chuyên môn, bao gồm 44 ngành nghề. GPT-5.2 Thinking đã đạt được điểm số mới là 55,6% trong bài kiểm tra SWE-bench Pro. SWE-bench Pro là một bài kiểm tra chuẩn nghiêm ngặt đánh giá năng lực kỹ sư phần mềm thực tế. Không giống như SWE-bench Verified chỉ kiểm tra Python, SWE-bench Pro bao gồm bốn ngôn ngữ, hướng đến sự mạnh mẽ hơn, thách thức hơn, đa dạng hơn và gần gũi hơn với các tình huống công nghiệp thực tế. GPT-5.2 Thinking cũng vượt trội hơn GPT-5.1 Thinking trong kỹ thuật phần mềm giao diện người dùng. Những người thử nghiệm ban đầu nhận thấy nó hoạt động tốt hơn trong phát triển giao diện người dùng và các tác vụ giao diện người dùng phức tạp hoặc không thông thường (đặc biệt là những tác vụ liên quan đến các yếu tố 3D). GPT-5.2 Thinking thiết lập một chuẩn mực công nghệ mới trong khả năng suy luận ngữ cảnh dài. Trong nhiệm vụ thực tế, chẳng hạn như phân tích tài liệu độ sâu(yêu cầu liên kết thông tin trên hàng trăm nghìn từ khóa), GPT-5.2 Thinking chính xác hơn đáng kể so với GPT-5.1 Thinking. GPT-5.2 Thinking là mô hình trực quan mạnh mẽ nhất cho đến nay, giúp giảm đáng kể tỷ lệ lỗi trong lập luận bằng sơ đồ và hiểu giao diện phần mềm xuống khoảng một nửa. GPT-5.2 trong ChatGPT GPT-5.2 Instant là một công cụ "chủ lực" mạnh mẽ và hiệu quả cao cho công việc và học tập hàng ngày, với những cải tiến đáng kể trong việc tìm kiếm thông tin, hướng dẫn vận hành, giải thích từng bước, viết tài liệu kỹ thuật và dịch thuật. Nó cũng giữ lại phong cách hội thoại thân thiện và tự nhiên hơn của GPT-5.1 Instant. Những người thử nghiệm ban đầu đặc biệt lưu ý đến các giải thích rõ ràng hơn, trình bày thông tin chính ngay từ đầu. GPT-5.2 Thinking được thiết kế để hỗ trợ công việc chuyên sâu hơn, giúp người dùng xử lý nhiệm vụ phức tạp với tỷ lệ hoàn thành cao hơn, lập trình tốt hơn, tóm tắt các tài liệu dài, trả lời các câu hỏi liên quan đến các tệp đã tải lên, giải quyết các vấn đề toán học và logic từng bước một, đồng thời hỗ trợ lập kế hoạch và ra quyết định với cấu trúc rõ ràng hơn và nhiều chi tiết hữu ích hơn. GPT-5.2 Pro là sự lựa chọn thông minh và đáng tin cậy nhất để giải quyết các vấn đề phức tạp, đặc biệt phù hợp với các tình huống đòi hỏi câu trả lời chất lượng cao. Các thử nghiệm ban đầu cho thấy nó mắc ít lỗi nghiêm trọng hơn và hoạt động tốt hơn trong các lĩnh vực phức tạp như lập trình.
OpenAI
@OpenAI
12-12
GPT-5.2 is now rolling out to everyone. https://openai.com/index/introducing-gpt-5-2/…
avatar
头雁
12-01
Bobbin (@bobbinth @0xMiden), nhà phát triển cốt lõi và CEO. Anh ấy thường được biết đến với kinh nghiệm làm việc tại Polygon (@0xPolygon) với dự án Miden. Anh ấy là một nhà phát triển ZooKeeper điển hình tự học, rất thành thạo trong việc học công nghệ ZooKeeper (lý thuyết) thông qua thực hành. Anh ấy đã huy động thành công 25 triệu đô la để xây dựng bộ nhớ đệm L2 dựa trên công nghệ bảo mật. Hãy cùng xem xét con đường sự nghiệp của Bobbin. Hành trình Web3 của Bobbin bắt đầu vào khoảng năm 2018, khi anh không phải là người hành nghề blockchain toàn thời gian mà hoạt động với tư cách là nhà nghiên cứu độc lập và cộng tác viên mã nguồn mở. Sự quan tâm của ông đối với Bằng chứng không tri thức bắt nguồn từ sự say mê của ông với "tính toàn vẹn tính toán", đặc biệt là các hệ thống bằng chứng chung như SNARK và STARK. Bobbin nhớ lại, “Ngay khi tôi biết đến Bằng chứng không tri thức, tôi ngay lập tức nhận ra rằng chúng rất quan trọng đối với blockchain — chúng cho phép bạn xác minh các phép tính mà không cần người khác phải chạy lại toàn bộ quy trình.” Cột mốc đầu tiên của ông là genSTARK (khoảng năm 2018-2019), Prover STARK mã nguồn mở đầu tiên của ông. genSTARK là một công cụ thử nghiệm để tạo và xác thực các bằng chứng STARK, giải quyết một điểm yếu trong cộng đồng ZK lúc bấy giờ: thiếu các triển khai mã mã nguồn mở hiệu quả. Bobbin là một nhà phát triển độc lập, không có bối cảnh các công ty lớn; ông đã xây dựng nó bằng cách tự học ngôn ngữ lập trình Rust. Công trình của ông đã đưa ông trở nên nổi tiếng trong cộng đồng ZK, mang lại cho ông danh tiếng là người tiên phong của " Prover STARK thực tế đầu tiên". Sau đó, ông đã phát triển Distaff VM (đầu năm 2020). Đây là một nguyên mẫu máy ảo dựa trên STARK (lần đầu tiên tôi tìm hiểu về các nguyên tắc triển khai của zkvm thông qua zkvm này), lấy cảm hứng từ kiến ​​trúc RISC-V và được thiết kế để hỗ trợ các bằng chứng ZK cho điện toán đa năng. Distaff là tiền thân của Miden VM. Bobbin đã thực hiện lần lần lặp lại và thử nghiệm người dùng trong quá trình phát triển, thậm chí còn tự mình viết AirScript (một ngôn ngữ hợp ngữ đơn giản) và AirAssembly để đơn giản hóa việc lập trình VM. Cuối năm 2020, Bobbin gia nhập dự án Novi của Meta (Facebook) với tư cách là nhà nghiên cứu ZK cốt lõi. Novi là bộ phận thử nghiệm blockchain và ví kỹ thuật số của Meta, hướng đến việc khám phá các công nghệ bảo mật trong hệ sinh thái Libra (hậu Diem). Đây là "điểm nhấn" của anh ấy—anh ấy đã dẫn dắt sự phát triển của Winterfell, một Prover và xác thực STARK đa năng, hiệu suất cao. Nó hỗ trợ tạo bằng chứng song song và nhanh hơn gấp nhiều lần so với các triển khai STARK trước đó. Trong đội ngũ, Bobbin chịu trách nhiệm thiết kế và tối ưu hóa kiến ​​trúc, xử lý toàn bộ quy trình từ biên dịch mạch đến tổng hợp bằng chứng. Kinh nghiệm này đã mang lại cho anh ấy chuyên môn trong việc triển khai ZK cấp doanh nghiệp. Tiếp theo là trải nghiệm được Polygon tiếp nhận và nhận ra Miden, mà tôi đã chia sẻ trước đó.
META
5.42%
avatar
头雁
12-01
Nội dung chủ đề
Gần đây tôi đã có một khoảng thời gian tuyệt vời khi đọc một bài phỏng vấn với nhà sáng lập OpenAI, Ilya, vào cuối tuần. Bài phỏng vấn này đáng để xem lại nhiều lần. Bên cạnh việc nói về việc chuyển từ kỷ nguyên mở rộng sang kỷ nguyên nghiên cứu (chúng ta không thể đạt được trí thông minh cao hơn chỉ bằng cách liên tục mở rộng tỷ lệ băm ), điều khiến tôi ấn tượng nhất là bài nói chuyện của ông về "gu nghiên cứu". Trong quá trình nghiên cứu, vị giác này cho phép anh ta sử dụng vị giác của chính mình (niềm tin và kinh nghiệm) để kiểm chứng mọi thứ từ trên xuống dưới khi nghiên cứu những thứ có độ bất định cao. Cốt lõi của niềm tin này vào AI là nhân hóa mạng lưới nơ-ron (nguyên lý của não bộ con người). Những cảm giác vị giác này là nền tảng. Khi các thí nghiệm và niềm tin không nhất quán, đôi khi có thể là do lỗi trong chính dữ liệu. Tuy nhiên, nếu chúng ta chỉ nhìn vào tình hình hiện tại và dữ liệu đã biết, chúng ta có thể không tìm ra được hướng đi thực sự đúng đắn. Sở thích nghiên cứu này không chỉ áp dụng cho chương trình Thạc sĩ Luật về Trí tuệ Nhân tạo (AI LLM). Dù bạn đang khởi nghiệp, đầu tư, tham gia airdrop hay phát triển sản phẩm mới, bạn đều đang đối diện những tình huống cực kỳ bất định. Sở thích của bạn là sự hiểu biết cơ bản của bạn về bản chất của sự vật, hoặc một số nguyên tắc cơ bản hoặc các khía cạnh nền tảng khác. Ví dụ, nếu bạn là quản lý sản phẩm và thấy một tính năng hầu như không ai sử dụng, bạn có thể kết luận rằng người dùng không cần nó và loại bỏ nó. Tuy nhiên, cũng có thể thiết kế của bạn có vấn đề và người dùng đơn giản là chưa nhận thấy tính năng đó. Ngược lại, một người thiếu gu thẩm mỹ về sản phẩm có thể đưa ra quyết định chỉ dựa trên thông tin hạn chế mà họ có thể thấy. Nhiều năm trước, Ilya nhìn lên một bài viết về học độ sâu trên CSDN, giải thích cách thực hiện các phép tính cộng, trừ, nhân và chia bằng RNN. Lúc đó, anh chỉ thấy nó thật tuyệt vời. Tuy nhiên, sự tò mò đã thôi thúc Ilya nghĩ rằng nếu nó có thể dự đoán được phép cộng, trừ, nhân và chia, thì nó cũng có thể thực hiện những việc phức tạp hơn. Anh cũng nhận ra rằng mạng nơ-ron nhân tạo dựa trên nền tảng lý thuyết mô phỏng cấu trúc não bộ. Hai điểm này đã đặt nền móng quan trọng cho việc khám phá nghiên cứu LLM thông minh của Ilya.
LLM
0%
loading indicator
Loading..