이 게시물은 NEAR 프로토콜의 공동 창립자 일리아 폴로수킨이 "왜 AI는 개방적이어야 하는가 - 왜 AI에 웹3.0이 필요한가"에 대해 설명한 글입니다.
IOSG Ventures에서 번역
표지: NEAR 프로토콜

이 글은 업계 학습 및 커뮤니케이션 목적으로만 IOSG Ventures에서 번역한 것으로, 투자 참고 자료가 될 수 없습니다. 인용을 원하시면 출처를 명시하고 IOSG 팀에 연락하여 승인 및 재인쇄 지침을 요청하시기 바랍니다. 이 글에 언급된 모든 프로젝트는 추천이나 투자 조언을 의미하지 않습니다.
지난 4월 17일, IOSG 벤처스는 "싱귤래리티: 인공지능과 암호화폐의 융합"이라는 주제로 제12회 올드 프렌즈 리유니온을 개최하여 업계에서 가장 저명하고 떠오르는 대표들을 초청했습니다. 이 모임의 목적은 참가자들을 한자리에 모아 AI와 암호화폐가 융합하는 지점과 이러한 융합이 미래에 미칠 영향에 대해 논의하는 것이었습니다. 이와 같은 행사에서 참석자들은 인사이트, 경험, 아이디어를 공유함으로써 업계 내 협업과 혁신을 촉진할 수 있는 기회를 갖게 됩니다.
다음은 이번 행사의 기조연설 중 하나인 "왜 AI가 개방되어야 하는가 - 왜 AI에 Web3가 필요한가 "를 IOSG Ventures의 포트폴리오 니어 프로토콜 공동 설립자 일리아 폴로수킨이 발표합니다.

AI가 개방되어야 하는 이유
"AI가 개방되어야 하는 이유"에 대해 알아봅시다. 저는 머신러닝을 전공했고, 약 10년 동안 다양한 머신러닝 관련 직무를 수행해 왔습니다. 하지만 암호화, 자연어 이해, NEAR를 설립하기 전에는 Google에서 근무했습니다. 현재 대부분의 최신 AI를 구동하는 프레임워크인 트랜스포머를 개발했고, 구글을 떠난 후에는 머신러닝 회사를 설립해 기계에 프로그래밍을 가르치고 컴퓨터와 상호작용하는 방식을 바꾸고자 했습니다. 하지만 2017년이나 2018년에는 너무 이른 시기였고, 당시에는 이를 수행할 수 있는 컴퓨팅 성능이나 데이터가 없었습니다.

그때는 전 세계에서 데이터에 라벨을 붙이는 작업을 할 사람들을 모집했는데, 대부분 학생들이었습니다. 그들은 중국, 아시아, 동유럽에 있었습니다. 이들 중 상당수는 해당 국가에 은행 계좌가 없었습니다. 미국은 송금을 쉽게 하지 않기 때문에 저희는 이 문제를 해결하기 위해 블록체인을 활용하고 싶었습니다. 전 세계 사람들이 어디에 있든 프로그램된 방식으로 더 쉽게 돈을 지불할 수 있게 만들고 싶었습니다. 그런데 현재 암호화폐의 문제점은 현재 NEAR가 많은 문제를 해결하고 있지만, 일반적으로 블록체인에서 거래하려면 먼저 암호화폐를 구매해야 하는데, 이 과정이 역효과를 내고 있다는 것입니다.
기업처럼 암호화폐를 사용하려면 우선 회사의 지분을 사야 한다고 말할 것입니다. 이것이 바로 NEAR에서 해결하고 있는 많은 문제 중 하나입니다. 이제 AI 측면에 대해 좀 더 자세히 살펴보겠습니다. 언어 모델링은 새로운 것이 아니라 50년대부터 사용되어 왔습니다. 자연어 도구에서 널리 사용되는 통계적 도구입니다. 하지만 2013년부터 딥러닝이 재부팅되면서 새로운 종류의 혁신이 시작되었습니다. 이 혁신은 단어를 매칭하고, 다차원 벡터에 추가하고, 수학적 형태로 변환할 수 있다는 것입니다. 이는 행렬 곱셈과 활성화 함수가 많은 딥러닝 모델에서 잘 작동했습니다.

이를 통해 고급 딥러닝을 시작하고 모델이 많은 흥미로운 작업을 수행하도록 훈련할 수 있었습니다. 돌이켜보면 당시에는 한 번에 한 단어씩 읽을 수 있는 인간을 모방한 모델인 뉴런 신경망을 사용했습니다. 그래서 속도가 매우 느렸죠. Google.com에서 사용자에게 무언가를 보여주려고 할 때, 누구도 5분 동안 위키백과를 읽은 후 답을 줄 생각은 하지 않고 바로 답을 얻고 싶어 합니다. 따라서 ChatGPT, Midjourney 및 최근의 모든 발전의 원동력인 트랜스포머 모델은 데이터를 병렬로 처리할 수 있고 추론할 수 있으며 즉시 답변을 제공할 수 있는 무언가를 갖고 싶다는 동일한 아이디어에서 비롯된 것입니다.
따라서 이 아이디어의 주요 혁신 중 하나는 모든 단어, 모든 토큰, 모든 이미지 블록을 병렬로 처리하여 고도의 병렬 컴퓨팅 기능을 갖춘 GPU 및 기타 가속기를 활용한다는 것입니다. 이렇게 함으로써 대규모로 추론할 수 있습니다. 이러한 확장을 통해 자동화된 학습 데이터를 처리할 수 있도록 학습을 확장할 수 있었습니다. 그 결과 단기간에 폭발적인 학습량을 처리하는 놀라운 성과를 거둔 도파민을 만나게 되었습니다. 엄청난 양의 텍스트를 가지고 전 세계 언어를 추론하고 이해하는 데 놀라운 성과를 거두기 시작했습니다.

이전에는 데이터 과학자, 머신러닝 엔지니어가 사용하고 나서 어떻게든 제품에서 해석하거나 의사 결정권자에게 데이터의 내용에 대해 이야기할 수 있는 도구였다면, 이제는 혁신적인 AI를 가속화하는 것이 방향입니다. 이제 우리는 사람과 직접 소통하는 AI 모델을 갖게 되었습니다. 실제로는 제품 뒤에 숨어 있기 때문에 사용자는 모델과 소통하고 있다는 사실조차 모를 수도 있습니다. 따라서 이전에는 AI의 작동 원리를 이해하던 사람들이 이제는 AI를 이해하고 활용할 수 있는 단계로 변화했습니다.

여기서 몇 가지 배경 설명을 드리자면, GPU를 사용하여 모델을 학습시킨다는 것은 데스크톱에서 비디오 게임을 플레이할 때 사용하는 것과 같은 종류의 게임용 GPU가 아닙니다.

각 머신에는 일반적으로 8개의 GPU가 제공되며, 마더보드를 통해 서로 연결된 다음 각각 약 16개의 머신으로 구성된 랙에 쌓여 있습니다. 이제 이 모든 랙은 전용 네트워크 케이블로 서로 연결되어 GPU 간에 정보를 매우 빠른 속도로 직접 전송할 수 있습니다. 따라서 정보는 CPU를 위한 것이 아니며, 실제로 CPU에서 전혀 처리하지 않습니다. 사실, CPU에서는 전혀 처리하지 않고 모든 연산이 GPU에서 이루어집니다. 따라서 이것은 슈퍼컴퓨터 설정입니다. 다시 말하지만, 이것은 기존의 "이봐, GPU야"가 아닙니다. 따라서 GPU4와 같은 규모의 모델은 약 3개월에 걸쳐 10,000대의 H100을 사용하여 6,400만 달러의 비용으로 훈련되었습니다. 현재 비용 규모와 일부 최신 모델을 훈련하는 데 드는 비용이 얼마인지 알고 계실 겁니다.

중요한 것은 시스템이 상호 연결되어 있다고 할 때, 이전 세대인 H100의 현재 연결 속도는 초당 900기가비트이고 컴퓨터 내부의 CPU와 RAM 간의 연결 속도는 초당 200기가비트로 모두 컴퓨터 로컬에 있습니다. 따라서 동일한 데이터 센터 내에서 한 GPU에서 다른 GPU로 데이터를 전송하는 것이 컴퓨터보다 빠릅니다. 컴퓨터는 기본적으로 상자 안에서 자체적으로 통신할 수 있습니다. 그리고 새로운 세대는 기본적으로 초당 1.8테라바이트의 속도로 연결됩니다. 개발자의 관점에서 볼 때 이것은 개별 컴퓨팅 장치가 아닙니다. 엄청난 양의 메모리와 연산 능력을 갖춘 슈퍼컴퓨터로 매우 큰 규모의 연산을 수행할 수 있습니다.

이제 우리가 직면한 문제는 이러한 대기업들이 이러한 모델을 구축할 수 있는 자원과 능력을 갖추고 있다는 점인데, 현재 이러한 서비스가 얼마나 실제로 작동하는지 모르겠습니다. 그래서 그게 예시죠? 완전히 중앙 집중화된 회사 제공업체에 가서 쿼리를 입력한다고 가정해 보겠습니다. 알고 보니 소프트웨어 엔지니어링 팀이 아니라 결과 표시 방식을 결정하는 팀이 몇 개 있었습니다. 데이터 집합에 어떤 데이터가 들어갈지 결정하는 팀이 있습니다.
예를 들어 인터넷에서 데이터를 크롤링하는 경우, 사람들은 논쟁에 대한 추측을 좋아하기 때문에 버락 오바마가 케냐에서 태어났다는 것과 하와이에서 태어났다는 것의 횟수는 똑같습니다. 따라서 무엇을 훈련할지 결정해야 합니다. 사실이라고 믿지 않기 때문에 일부 정보를 걸러내기로 결정해야 합니다. 따라서 어떤 데이터를 사용할지, 어떤 데이터가 존재할지를 결정할 때는 그 결정을 내리는 사람들의 영향을 많이 받습니다. 저작권이 있는 것과 불법적인 것을 결정하는 법무팀이 있습니다. 비윤리적인 콘텐츠와 표시해서는 안 되는 콘텐츠를 결정하는 '윤리팀'도 있습니다.
따라서 어떤 면에서는 이러한 필터링과 조작이 많이 이루어지고 있습니다. 이러한 모델은 통계 모델입니다. 데이터에서 원하는 것을 골라 선택합니다. 데이터에 특정 콘텐츠가 없으면 답을 알 수 없습니다. 데이터에 어떤 내용이 있으면 이를 사실로 받아들일 가능성이 높습니다. AI로부터 답을 얻으면 걱정스러울 수 있습니다. 맞아요. 이제 모델로부터 답을 얻어야 하지만 보장할 수 없습니다. 결과가 어떻게 생성되었는지 알 수 없으니까요. 회사가 실제로 결과를 변경하기 위해 특정 세션을 가장 높은 입찰자에게 판매할 수도 있습니다. 어떤 차를 사야 할지 물어보러 갔는데 도요타가 도요타를 선호하는 결과가 나왔다고 판단하고 도요타가 그 회사에 10센트를 지불한다고 상상해 보겠습니다.

따라서 이러한 모델을 중립적이고 데이터를 대표해야 하는 지식 기반으로 사용하더라도 실제로는 결과에 도달하기 전에 매우 특정한 방식으로 결과를 편향시키는 많은 일이 일어납니다. 그리고 이로 인해 많은 문제가 발생했죠? 대기업과 언론 간의 소송, 증권거래위원회(SEC), 그리고 지금은 거의 모든 사람들이 서로를 고소하려고 하고 있습니다. 왜냐하면 이러한 모델은 불확실성과 권력을 너무 많이 가져다주기 때문입니다. 그리고 앞으로 내다본다면 문제는 대형 기술 기업은 항상 수익을 계속 늘리고자 하는 인센티브가 있다는 것입니다. 예를 들어 상장 기업이라면 수익을 보고해야 하고 계속 성장해야 합니다.
이를 위해 이미 목표 시장을 확보했다면 20억 명의 사용자가 있다고 가정해 보겠습니다. 더 이상 인터넷에 신규 사용자가 그렇게 많지 않습니다. 평균 수익을 극대화하는 것 외에는 선택의 여지가 많지 않으므로, 가치가 전혀 없는 사용자로부터 더 많은 가치를 끌어내거나 사용자의 행동을 바꿔야 합니다. 특히 모든 지식 지능의 형태라고 생각하면, 생성형 AI는 사용자의 행동을 조작하고 변화시키는 데 매우 능숙합니다. 따라서 우리는 많은 규제 압력이 있고 규제 당국이 이 기술이 어떻게 작동하는지 완전히 이해하지 못하는 매우 위험한 상황에 처해 있습니다. 조작으로부터 사용자를 보호할 수 있는 수단이 거의 없습니다.

조작 콘텐츠, 오해의 소지가 있는 콘텐츠, 광고가 없더라도 스크린샷을 찍어 제목만 바꿔서 트위터에 올리면 사람들은 열광합니다. 금전적 인센티브가 있기 때문에 지속적으로 수익을 극대화할 수 있습니다. 그리고 실제로 구글 내에서 악을 행하는 것도 아니죠? 어떤 모델을 출시할지 결정할 때 어떤 모델이 더 많은 수익을 가져다주는지 A 또는 B 테스트를 수행합니다. 결과적으로 사용자로부터 더 많은 가치를 창출하여 지속적으로 수익을 극대화할 수 있습니다. 그리고 사용자와 커뮤니티는 모델이 무엇인지, 어떤 데이터를 사용하는지, 실제로 무엇을 달성하려고 하는지에 대해 전혀 알 수 없습니다. 이것이 바로 앱 사용자에게 일어나는 일입니다. 그것은 조건부입니다.

웹 3.0은 탈중앙화된 형태로 더 나은 소프트웨어와 제품을 생산하도록 인센티브를 제공하면서도 새로운 방식으로 인센티브를 제공하는 중요한 도구가 될 수 있습니다. 이것이 전체 웹 3.0 AI 개발의 일반적인 방향이며, 이제 세부적인 이해를 돕기 위해 첫 번째 부분인 콘텐츠 평판부터 시작하여 구체적인 부분에 대해 간략하게 이야기하겠습니다.

다시 말하지만, 언어 모델이 사람들이 정보를 조작하고 사용하는 방식에 큰 영향력과 규모를 가져왔지만 이것은 순수한 AI 문제는 아닙니다. 여러분이 원하는 것은 다양한 콘텐츠를 볼 때 스스로 드러나는 추적 가능하고 추적 가능한 암호화 평판입니다. 따라서 실제로 암호화되어 모든 웹사이트의 모든 페이지에서 찾을 수 있는 커뮤니티 노드가 있다고 상상해 보세요. 이제 이러한 모델이 거의 모든 콘텐츠를 읽고 개인화된 요약과 개인화된 결과물을 제공하기 때문에 이러한 모든 배포 플랫폼은 혼란을 겪게 될 것입니다.

따라서 재창조를 시도하는 대신 실제로 새로운 창의적인 콘텐츠를 만들 수 있는 기회를 갖고, 기존 콘텐츠에 블록체인과 NFT를 추가하여 모델 훈련과 추론 시간을 중심으로 새로운 크리에이터 경제를 구축하여 사람들이 새로운 출판물, 사진, 유튜브, 음악 등 자신이 만든 데이터가 모델 훈련에 기여하는 정도에 따라 네트워크에 들어가게 될 것입니다. 따라서 이를 기반으로 콘텐츠에 따라 전 세계적으로 일정 금액이 지급될 수 있습니다. 따라서 우리는 이제 시선을 끄는 광고 네트워크에 의해 주도되는 경제 모델에서 혁신과 흥미로운 정보를 제공하는 경제 모델로 전환하고 있습니다.
한 가지 중요한 점은 많은 불확실성이 부동소수점 연산에서 비롯된다는 점입니다. 이 모든 모델에는 많은 부동소수점 연산과 곱셈이 포함됩니다. 이러한 연산은 불확실성 연산입니다.

이제 서로 다른 아키텍처의 GPU에서 곱셈을 한다고 가정해 보겠습니다. 따라서 A100과 H100을 사용하면 결과가 달라집니다. 따라서 암호 경제학이나 낙관주의와 같이 결정론에 의존하는 많은 접근 방식은 실제로 많은 어려움에 부딪히며 이를 실현하기 위해서는 많은 혁신이 필요합니다. 마지막으로 흥미로운 아이디어가 있는데, 프로그래밍 가능한 통화와 프로그래밍 가능한 자산을 구축해 왔지만 여기에 지능을 추가하면 코드가 아닌 자연어 능력으로 세상과 상호 작용하는 스마트 자산을 가질 수 있다고 상상할 수 있지 않나요? 여기서 우리는 흥미로운 수익률 최적화, 디파이, 트레이딩 전략 등 많은 것을 할 수 있습니다.

문제는 현재 모든 시사 이슈가 강건한 행동을 하지 않는다는 것입니다. 훈련의 목적이 다음 토큰을 예측하는 것이기 때문에 적대적이고 강력하게 훈련되지 않았기 때문에 원하는 모든 돈을 주도록 모델을 설득하는 것이 더 쉽습니다. 계속 진행하기 전에 이 문제를 실제로 해결하는 것이 매우 중요합니다. 그래서 저는 지금 우리가 기로에 서 있다는 생각을 남기겠습니다. 제품을 출시하면 많은 수익을 창출하고 그 수익을 제품 개발에 투입하기 때문에 극도의 인센티브와 플라이휠이 있는 폐쇄적인 AI 생태계가 존재합니다. 그러나 그 제품은 본질적으로 회사의 수익을 극대화하고 사용자로부터 가치를 창출하도록 설계되었습니다. 또는 사용자가 제어권을 갖는 개방형 사용자 소유 접근 방식이 있습니다.

이러한 모델은 실제로 사용자의 이익을 극대화하는 데 유리하게 작용합니다. 이러한 모델은 인터넷에서 발생할 수 있는 많은 위험으로부터 사용자를 보호할 수 있는 방법을 제공합니다. 그렇기 때문에 인공지능과 암호화폐가 더 많이 개발되고 적용되어야 합니다. 모두 감사합니다.
면책 조항 : 블록체인 정보 플랫폼으로서 이 사이트에 게시된 기사는 작성자 및 게스트의 개인적인 견해를 나타내며 Web3Caff의 입장과는 무관합니다. 기사의 정보는 참고용으로만 제공되며 투자 조언이나 제안을 구성하지 않으므로 해당 국가 또는 지역의 관련 법률 및 규정을 준수하시기 바랍니다.




