Bài viết này được dịch máy
Xem bản gốc

Đây là một bài viết hữu ích (và tôi cũng đã góp Bit vào vấn đề ban đầu bằng cách nêu bật một phần của thẻ mô hình Claude mà không có ngữ cảnh).

Séb Krier
@sebkrier
Every time a model card drops, a lot of people screenshot scary parts - blackmail, evaluation awareness, misalignment etc. Now this is happening again, but instead of it being confined to a niche part of the safety community, it’s established commentators who are looking for
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận