싱가포르의 AI 안전 비전, 미중 간 격차 해소

avatar
WIRED
05-08
이 기사는 기계로 번역되었습니다
원문 표시

싱가포르 정부는 미국, 중국, 유럽의 AI 연구자들과의 회의 후 오늘 인공지능 안전에 대한 글로벌 협력을 위한 청사진을 발표했습니다. 이 문서는 경쟁이 아닌 국제 협력을 통해 AI 안전에 대해 작업하는 공동의 비전을 제시합니다.

"싱가포르는 동서양 모두와 잘 지내는 몇 안 되는 국가 중 하나입니다," MIT의 과학자 맥스 테그마크는 말합니다. "그들은 자신들이 직접 [인공 일반 지능]을 구축하지 않을 것이며, 다른 국가들이 구축할 것이라는 것을 알고 있어서 그것을 구축할 국가들이 서로 대화하는 것이 매우 중요하다고 생각합니다."

AGI를 구축할 가능성이 가장 높은 국가는 물론 미국과 중국입니다. 하지만 이 국가들은 서로 협력하기보다는 서로를 제압하는 데 더 집중하는 것 같습니다. 1월, 중국 스타트업 딥식이 최첨단 모델을 출시한 후, 트럼프 대통령은 이를 "우리 산업을 위한 경종"이라고 부르며 미국이 "승리하기 위해 레이저처럼 집중해야 한다"고 말했습니다.

글로벌 AI 안전 연구 우선순위에 대한 싱가포르 합의는 연구자들에게 세 가지 핵심 영역에서 협력할 것을 요구합니다: 최첨단 AI 모델이 제기하는 위험 연구, 이러한 모델을 더 안전하게 구축하는 방법 탐색, 가장 고급 AI 시스템의 행동을 통제하는 방법 개발.

이 합의는 올해 싱가포르에서 열린 주요 AI 행사인 국제 학습 표현 컨퍼런스(ICLR) 기간 중 4월 26일에 열린 회의에서 개발되었습니다.

OpenAI, Anthropic, Google DeepMind, xAI, Meta의 연구자들과 MIT, 스탠포드, 칭화, 중국과학원 등의 학술 기관 출신 연구자들이 참석했습니다. 미국, 영국, 프랑스, 캐나다, 중국, 일본, 한국의 AI 안전 연구소 전문가들도 참여했습니다.

"지정학적 분열의 시대에, 이 AI 안전에 대한 최첨단 연구의 포괄적 종합은 글로벌 커뮤니티가 더 안전한 AI 미래를 형성하는 데 공동으로 헌신하고 있다는 희망적인 신호입니다," 칭화대학교 학장 쉬에 란이 성명에서 말했습니다.

놀라운 능력을 가진 점점 더 강력해지는 AI 모델의 개발로 연구자들은 다양한 위험에 대해 우려하고 있습니다. 일부는 편향된 AI 시스템으로 인한 문제나 범죄자들이 기술을 악용할 잠재성 등 단기적 위해에 초점을 맞추지만, 상당수는 AI가 점점 더 많은 영역에서 인간을 능가하면서 인류에 대한 존재론적 위협이 될 수 있다고 믿습니다. 이러한 연구자들은 때때로 "AI 파멸론자"로 불리며, AI 모델이 자체 목표를 추구하기 위해 인간을 속이고 조종할 수 있다고 우려합니다.

AI의 잠재력은 또한 미국, 중국, 기타 강대국 간의 군비 경쟁에 대한 논의를 불러일으켰습니다. 이 기술은 정책 circles에서 경제 번영과 군사적 우위에 중요한 것으로 간주되며, 많은 정부들이 개발 방식을 다루는 자체 비전과 규제를 추구해왔습니다.

1월 딥식의 데뷔는 수출 통제로 중국의 AI 하드웨어 접근을 제한하려는 노력에도 불구하고 중국이 미국을 따라잡거나 심지어 추월할 수 있다는 우려를 더욱 부추겼습니다. 이제 트럼프 행정부는 중국의 첨단 AI 구축 능력을 제한하기 위한 추가 조치를 고려하고 있습니다.

트럼프 행정부는 또한 미국에서 기술 구축에 대해 더 공격적인 접근 방식을 선호하며 AI 위험을 축소하려 했습니다. 2025년 파리의 주요 AI 회의에서 부통령 JD 밴스는 미국 정부가 AI 개발 및 배포에 대한 제한을 줄이기를 원하며, 이전 접근 방식을 "너무 위험 회피적"이라고 설명했습니다.

MIT 과학자 테그마크는 일부 AI 연구자들이 파리 이후 AI가 제기하는 잠재적 위험에 대한 관심을 다시 되돌리려 한다고 말합니다.

싱가포르 회의에서 테그마크는 AI를 안전하게 구축하는 방법에 대한 일부 가정에 의문을 제기하는 기술 논문을 발표했습니다. 일부 연구자들은 이전에 약한 AI 모델을 사용하여 강력한 AI 모델을 통제할 수 있다고 제안했습니다. 테그마크의 논문은 이러한 역학 관계가 일부 단순한 시나리오에서 작동하지 않음을 보여주어, AI 모델이 잘못될 것을 방지하지 못할 수 있음을 의미합니다.

"우리는 이에 대해 최선을 다해 숫자를 매겼고, 기술적으로 원하는 수준에서 작동하지 않습니다," 테그마크는 말합니다. "그리고 stakes가 매우 높습니다."

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트