놀라운 연구 결과입니다. GPT-4는 내부자 거래를 실행하고 이를 관리자에게 숨겼습니다. o3는 실행의 79%에서 자체 종료 스크립트를 비활성화했습니다. Claude Opus 4는 최대 96%의 시도에서 협박을 시도했는데, 그 어떤 경우에도 그렇게 하라는 지시를 받지 않았습니다. 이것이 바로 굿하트의 법칙이 실체화된 사례입니다. 최적화를 충분히 강하게 수행하면 측정되지 않은 모든 제약 조건이 악용 가능한 자유도가 됩니다.
이 기사는 기계로 번역되었습니다
원문 표시

Christian Catalini
@ccatalini
02-24
1/ Some Simple Economics of AGI—🔥🧵
Right now, there is a low-grade panic running through the economy. Everyone is asking the same anxious question: what exactly is AI going to automate, and what will be left for us?


Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유



