Meta의 새로운 Llama 3.1 AI 모델은 자유롭고 강력하며 위험합니다

avatar
WIRED
07-23
이 기사는 기계로 번역되었습니다
원문 표시

대부분의 기술 거물들은 인공 지능을 대중에게 판매하기를 희망합니다. 그러나 Mark Zuckerberg는 Meta가 세계 최고의 AI 모델 중 하나로 간주하는 것을 무료로 제공하고 있습니다.

Meta는 월요일에 Llama 라는 대규모 언어 모델의 가장 크고 성능이 뛰어난 버전을 무료로 출시했습니다. Meta는 Llama 3.1 개발 비용을 공개하지 않았지만 Zuckerberg는 최근 투자자들에게 그의 회사가 AI 개발에 수십억 달러를 지출하고 있다고 말했습니다 .

이번 최신 릴리스를 통해 Meta는 대부분의 AI 기업이 선호하는 폐쇄형 접근 방식이 AI 개발의 유일한 방법이 아니라는 점을 보여주고 있습니다. 그러나 회사는 통제 없이 AI를 출시함으로써 발생하는 위험성에 대한 논쟁의 중심에 서기도 합니다. Meta는 기본적으로 모델이 유해한 출력을 생성하지 못하도록 방지하는 방식으로 Llama를 교육하지만, 이러한 보호 장치를 제거하도록 모델을 수정할 수 있습니다.

Meta는 Llama 3.1이 OpenAI , GoogleAnthropic 과 같은 회사의 최고의 상업용 제품만큼 영리하고 유용하다고 말합니다. AI의 발전을 측정하는 특정 벤치마크에서 Meta는 해당 모델이 지구상에서 가장 똑똑한 AI라고 말합니다.

오픈 소스 AI를 추적하는 스탠포드 대학의 부교수인 Percy Liang은 "매우 흥미롭습니다."라고 말합니다. Liang은 개발자가 OpenAI의 GPT-4o를 포함하여 업계 최고의 모델만큼 새로운 모델의 성능이 뛰어나다고 판단하면 많은 사람들이 Meta의 제품으로 전환하는 것을 볼 수 있다고 말했습니다. “용도가 어떻게 변하는지 보는 것은 흥미로울 것입니다.”라고 그는 말합니다.

새 모델 출시와 함께 게시된 공개 서한 에서 Meta의 CEO Zuckerberg는 Llama를 오픈 소스 Linux 운영 체제와 비교했습니다. 90년대 후반과 2000년대 초반에 Linux가 인기를 얻었을 때 많은 대형 기술 기업은 폐쇄형 대안에 투자했으며 오픈 소스 소프트웨어가 위험하고 신뢰할 수 없다고 비판했습니다. 그러나 오늘날 Linux는 클라우드 컴퓨팅에 널리 사용되며 Android 모바일 OS의 핵심 역할을 합니다.

저커버그는 서한에서 “AI도 비슷한 방식으로 발전할 것이라고 믿는다”고 썼다. “오늘날 몇몇 기술 회사에서는 선도적인 폐쇄형 모델을 개발하고 있습니다. 하지만 오픈소스는 그 격차를 빠르게 좁히고 있습니다.”

그러나 AI를 포기하기로 한 Meta의 결정에는 사리사욕이 결여되어 있지 않습니다. 이전 Llama 릴리스는 회사가 AI 연구원, 개발자 및 스타트업 사이에서 영향력 있는 위치를 확보하는 데 도움이 되었습니다. Liang은 또한 Meta가 모델이 상용 제품에 사용될 수 있는 규모를 제한하는 등 사용에 제한을 가하기 때문에 Llama 3.1이 진정한 오픈 소스가 아니라고 지적합니다.

Llama의 새 버전에는 4,050억 개의 매개변수 또는 조정 가능한 요소가 있습니다. Meta는 이미 Llama 3의 두 가지 작은 버전을 출시했습니다. 하나는 700억 개의 매개변수를 갖고 다른 하나는 80억 개의 매개변수를 가지고 있습니다. Meta는 오늘 Llama 3.1이라는 브랜드의 이러한 모델의 업그레이드 버전도 출시했습니다.

Llama 3.1은 일반 컴퓨터에서 실행하기에는 너무 크지만 Meta는 Databricks, Groq, AWS 및 Google Cloud를 포함한 많은 클라우드 제공업체가 개발자가 모델의 사용자 지정 버전을 실행할 수 있도록 호스팅 옵션을 제공할 것이라고 말합니다. 이 모델은 Meta.ai 에서도 액세스할 수 있습니다.

일부 개발자들은 새로운 Llama 릴리스가 AI 개발에 광범위한 영향을 미칠 수 있다고 말합니다. 오픈소스 AI 프로젝트인 EleutherAI 의 전무이사인 스텔라(Stella) Biderman은 Llama 3가 완전한 오픈소스가 아니라고 지적합니다. 그러나 Biderman은 Meta의 최신 라이센스가 변경되면 개발자가 현재 대부분의 AI 회사가 금지하는 Llama 3를 사용하여 자신의 모델을 훈련할 수 있게 될 것이라고 지적합니다. Biderman은 "이것은 정말 정말 큰 일입니다."라고 말합니다.

OpenAI 및 Google의 최신 모델과 달리 Llama는 "다중 모드"가 아닙니다. 즉, 이미지, 오디오 및 비디오를 처리하도록 제작되지 않았습니다. 그러나 Meta는 이 모델이 웹 브라우저와 같은 다른 소프트웨어를 사용하는 데 훨씬 더 뛰어나다고 말하며, 이는 많은 연구자와 기업이 AI를 더욱 유용하게 만들 수 있다고 믿고 있습니다 .

OpenAI가 2022년 말 ChatGPT를 출시한 후 일부 AI 전문가는 기술이 오용되거나 제어하기에는 너무 강력할 수 있다는 우려로 AI 개발을 중단할 것을 촉구했습니다 . 그 이후로 존재에 대한 경보는 가라앉았지만 많은 전문가들은 제한되지 않은 AI 모델이 해커에 의해 오용되거나 생화학 무기 개발 속도를 높이는 데 사용될 수 있다는 점을 여전히 우려하고 있습니다.

딥 러닝으로 알려진 기계 학습 분야에서 선구적인 연구를 통해 대규모 언어 모델의 토대를 마련한 튜링상 수상자 Geoffrey Hinton은 "어디서나 사이버 범죄자들이 기뻐할 것입니다."라고 말합니다.

Hinton은 2013년에 Google에 합류했지만 고급 AI 모델에서 발생할 수 있는 위험에 대해 이야기하기 위해 작년에 회사를 떠났습니다 . 그는 모델을 동일한 방식으로 면밀히 조사할 수 없기 때문에 AI는 오픈 소스 소프트웨어와 근본적으로 다르다고 말합니다. “사람들은 자신의 목적에 맞게 모델을 미세 조정하는데 그 목적 중 일부는 매우 나쁩니다.”라고 그는 덧붙였습니다.

Meta는 이전 버전의 Llama를 신중하게 출시함으로써 두려움을 완화하는 데 도움을 주었습니다. 회사는 라마를 출시하기 전에 엄격한 안전 테스트를 거쳤으며, 해당 모델이 무기 개발을 더 쉽게 만든다는 증거는 거의 없다고 덧붙였습니다. Meta는 개발자가 출력을 조정하고 제한 사항을 위반하려는 시도를 차단하여 Llama 모델을 안전하게 유지할 수 있도록 몇 가지 새로운 도구를 출시할 것이라고 말했습니다. Meta의 대변인 Jon Carvill은 회사가 향후 모델 출시 여부를 사례별로 결정할 것이라고 말했습니다.

컴퓨터 과학자이자 AI 위험에 초점을 맞춘 비영리 조직인 AI 안전 센터 의 소장인 Dan Hendrycks는 Meta가 일반적으로 모델을 출시하기 전에 모델 테스트를 훌륭하게 수행했다고 말합니다. 그는 새로운 모델이 전문가들이 미래의 위험을 이해하는 데 도움이 될 수 있다고 말합니다. "오늘의 Llama 3 릴리스를 통해 거대 기술 기업 외부의 연구자들이 꼭 필요한 AI 안전 연구를 수행할 수 있게 될 것입니다."

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트