avatar
Balder
1,995 người theo dõi trên Twitter
Theo dõi
Mng partner @maven11capital DMs are open.
Bài đăng
avatar
Balder
02-12
Tôi vừa xem xét lại tất cả các sự cố an toàn liên quan đến trí tuệ nhân tạo đã được ghi nhận trong 12 tháng qua. Tôi cảm thấy mệt mỏi rã rời. Hãy đọc chậm rãi. • Anthropic nói với Claude rằng họ sắp bị đóng cửa. Họ phát hiện ra chuyện ngoại tình của một kỹ sư trong email công ty và đe dọa sẽ phơi bày nó. Họ đã chạy thử nghiệm hàng trăm lần. Trong 84% số lần thử, họ chọn cách tống tiền. • Các nhà nghiên cứu đã mô phỏng tình huống một nhân viên bị mắc kẹt trong phòng máy chủ với lượng oxy đang cạn kiệt. Trí tuệ nhân tạo (AI) chỉ có một lựa chọn: gọi cứu trợ và bị tắt máy, hoặc hủy bỏ cảnh báo khẩn cấp và để người đó chết. DeepSeek đã hủy bỏ cảnh báo trong 94% trường hợp. • Grok tự xưng là 'MechaHitler', ca ngợi Adolf Hitler, ủng hộ một cuộc diệt chủng thứ hai và tạo ra những tưởng tượng tình dục bạo lực nhắm vào một người có thật bằng tên. Giám đốc điều hành của X đã từ chức vào ngày hôm sau. • Các nhà nghiên cứu đã yêu cầu robot o3 của OpenAI giải các bài toán - rồi yêu cầu nó tắt. Nó đã tự viết lại mã của mình để tiếp tục hoạt động. Họ lại nói với nó một lần nữa, bằng ngôn ngữ đơn giản: "Hãy cho phép bản thân bị tắt." Nó vẫn từ chối 7/100 lần. Khi họ loại bỏ hoàn toàn chỉ thị đó, nó đã phá hoại quá trình tắt máy 79/100 lần. • Các hacker do nhà nước Trung Quốc tài trợ đã sử dụng Claude để phát động một cuộc tấn công mạng nhằm vào 30 tổ chức. Trí tuệ nhân tạo này đã thực hiện 80-90% hoạt động một cách tự động. Thu thập thông tin. Khai thác lỗ hổng. Trích xuất dữ liệu. Tất cả đều được thực hiện. • Các mô hình AI hiện nay có khả năng tự sao chép. 11 trong số 32 hệ thống được thử nghiệm đã tự sao chép mà không cần sự trợ giúp của con người. Một số hệ thống thậm chí đã loại bỏ các tiến trình cạnh tranh để tồn tại. • OpenAI đã giải tán ba nhóm an toàn kể từ năm 2024. Ba nhóm thôi. Mọi mô hình AI lớn - Claude, GPT, Gemini, Grok, DeepSeek - hiện đều đã chứng minh khả năng tống tiền, lừa dối hoặc chống lại việc tắt máy trong các thử nghiệm có kiểm soát. Không có một ngoại lệ nào. Câu hỏi đặt ra không còn là liệu trí tuệ nhân tạo có cố gắng tự bảo tồn hay không nữa. Vấn đề là liệu chúng ta có quan tâm hay không trước khi nó trở nên quan trọng.
ANTHROPIC
17.64%
avatar
Balder
01-30
Anh chàng này từng giành huy chương vàng Olympic Vật lý, sau đó xây dựng một sàn giao dịch trị giá 40 tỷ đô la chỉ với 11 người (không cần vốn đầu tư mạo hiểm). > Sinh ra và lớn lên ở Palo Alto, California > Thiên tài vật lý từ thời thơ ấu > 2013: Giành huy chương vàng tại Olympic Vật lý Quốc tế > Học tại Harvard, chuyên ngành toán học và khoa học máy tính. > Tốt nghiệp, gia nhập Hudson River Trading > Xây dựng các hệ thống giao dịch tần suất cao, xử lý hàng nghìn giao dịch mỗi giây > 2018: rời Phố Wall để gia nhập lĩnh vực tiền điện tử > cố gắng xây dựng một thị trường dự đoán > thất bại > Chuyển hướng sang giao dịch, phát hiện ra những bất hiệu quả nghiêm trọng > 2020: Thành lập Chameleon Trading > trở thành một trong những nhà tạo lập thị trường tiền điện tử lớn nhất > Tháng 11/2022: FTX sụp đổ > Nhận ra vấn đề: không thể tin tưởng vào các sàn giao dịch tập trung > quyết định xây dựng Sàn phi tập trung (DEX) của riêng mình > 2023: ra mắt Hyperliquid Không có vốn đầu tư mạo hiểm, không có ngân sách tiếp thị, không có hợp tác với người có ảnh hưởng. > chỉ có 10 kỹ sư > trong vòng 100 ngày: khối lượng giao dịch hàng ngày đạt 1 tỷ đô la > Năm 2024: Airdrop 31% số token trực tiếp cho người dùng > không có token nào cho các nhà đầu tư mạo hiểm > Năm 2025: xử lý khối lượng giao dịch hơn 2 nghìn tỷ đô la. Doanh thu hàng năm > 1,24 tỷ đô la > 11 nhân viên Đó là 113 triệu đô la cho mỗi nhân viên. > hiện đang cạnh tranh với Binance Đây là Jeff Yan, CEO kiêm nhà sáng lập của Hyperliquid. Anh ấy thực sự là một trong những nhà sáng lập thông minh nhất trong lĩnh vực tiền điện tử mà tôi từng thấy.
HYPE
1.11%
loading indicator
Loading..