인터뷰 | 빅테크, AI를 정크 데이터로 훈련시키고 있다: 직관

이 기사는 기계로 번역되었습니다
원문 표시

Intuition의 창립자인 빌리 루트케는 AI 모델은 점점 더 강력해지고 있지만, 이를 훈련하는 데 사용되는 데이터는 점점 나빠지고 있다고 말했습니다.

요약
  • Intuition의 창립자인 Billy Luedtke는 AI는 우리가 제공하는 데이터만큼만 좋다고 말합니다.
  • AI가 재귀적으로 변하면서 우리는 "slop-in, slop-out" 시대에 살고 있습니다.
  • 분산형 모델은 기술과 사용자 경험 측면에서 우위를 점합니다.

AI 시스템이 더욱 보편화됨에 따라 사용자들은 해결하기 어려운 한계에 점점 더 직면하고 있습니다. 모델은 향상되지만, 이러한 모델이 학습하는 데 사용되는 기본 데이터는 동일하게 유지됩니다. 더욱이, 재귀 또는 다른 AI가 생성한 데이터를 기반으로 학습하는 AI 모델은 오히려 상황을 악화시킬 수 있습니다.

AI의 미래에 대해 논의하기 위해 crypto.news는 검증 가능한 속성, 평판, 그리고 데이터 소유권을 AI에 제공하는 데 중점을 둔 탈중앙화 프로토콜인 Intuition의 창립자 빌리 루트케와 인터뷰를 진행했습니다. 루트케는 현재 AI 데이터 세트가 근본적으로 결함이 있는 이유와 이를 해결하기 위해 무엇을 할 수 있는지 설명합니다.

Crypto.news: 지금 모두가 GPU, 에너지, 데이터 센터 등 AI 인프라에 집중하고 있습니다. 사람들은 AI에서 신뢰 계층의 중요성을 과소평가하고 있는 걸까요? 왜 중요한가요?

빌리 루트케: 100%입니다. 사람들은 분명히 그것을 과소평가하고 있습니다. 그리고 그것은 여러 가지 이유로 중요합니다.

첫째, 저는 "슬롭인, 슬롭아웃" 시대라고 부르는 시대로 접어들고 있습니다. AI는 소비하는 데이터만큼만 가치가 있습니다. 하지만 그 데이터, 특히 오픈 웹에서 수집된 데이터는 대부분 오염되어 있습니다. 깨끗하지도 않고, 인간의 의도를 반영하지도 않습니다. 그 중 상당 부분은 온라인에서 게임화된 행동, 즉 '좋아요', '리뷰', '참여 유도'와 같은 행동에서 비롯되며, 이 모든 것은 주의 최적화 알고리즘을 통해 필터링됩니다.

그래서 AI가 인터넷을 스크래핑할 때, 우리가 누구인지에 대한 전체적인 그림을 보는 것이 아닙니다. 플랫폼을 이용하는 사람들을 보는 것이죠. 저는 트위터에서 현실에서처럼 행동하지 않습니다. 우리 중 누구도 그렇지 않습니다. 우리는 알고리즘을 최적화할 뿐, 진정한 생각을 표현하지 않습니다.

재귀적이기도 합니다. 플랫폼이 우리를 훈련시키고, 우리는 더 왜곡된 행동을 다시 피드백합니다. 이는 피드백 루프, 즉 나선형을 만들어내며, AI가 인간을 인식하는 방식을 더욱 왜곡합니다. 우리는 AI에게 우리가 생각하는 것을 가르치는 것이 아니라, '좋아요'를 받을 만한 것을 가르치는 것입니다.

일반 사용자는 구글 검색을 하거나, 자료를 비교하거나, 비판적으로 생각하지 않습니다. 그들은 ChatGPT나 다른 모델에 질문하고 그 답변을 액면 그대로 받아들일 뿐입니다.

위험합니다. 모델이 불투명하고, 블랙박스처럼 되어 있고, 이를 관리하는 회사가 사용자에게 어떤 정보를 보여주고 어떤 정보를 보여주지 않을지까지 통제한다면, 그것은 완전한 내러티브 통제입니다. 중앙집중화되고, 책임을 묻지 않으며, 극도로 강력합니다.

그록에게 최고의 팟캐스트를 물어봤는데, 일론에게 가장 많은 돈을 준 사람이 누구냐는 대답이 돌아왔다고 상상해 보세요. 그건 지능이 아니라, 위장된 광고일 뿐입니다.

CN: 그렇다면 어떻게 해결해야 할까요? 참여보다는 진실과 가치를 우선시하는 시스템을 어떻게 구축해야 할까요?

BL: 인센티브를 바꿔야 합니다. 이러한 시스템은 기관이나 주주, 광고주가 아닌, 사람들에게 도움이 되어야 합니다. 즉, 인터넷에 새로운 계층, 즉 신원 및 평판 기반을 구축하는 것을 의미합니다. Intuition에서 바로 그 일을 하고 있습니다.

검증 가능한 속성이 필요합니다. 누가, 언제, 어떤 맥락에서 무엇을 말했는지가 중요합니다. 또한, 특정 데이터 출처를 얼마나 신뢰할 수 있는지 판단하는 데 도움이 되는 이동 가능하고 분산된 평판이 필요합니다. 이는 단순히 분위기에 근거하는 것이 아니라 실제 맥락적 기록을 기반으로 합니다.

Reddit이 완벽한 예입니다. 모델 학습 데이터의 가장 큰 소스 중 하나죠. 하지만 사용자가 "그냥 자살해"라고 비꼬는 말을 하면, 그 말이 스크랩되어 의학적 조언을 구하는 사람에게 모델이 추천하는 내용에 나타날 수 있습니다.

정말 끔찍한 일입니다. 모델에 맥락, 귀속, 또는 평판 가중치가 없을 때 발생하는 일입니다. 우리는 이 사람이 의학계에서 신뢰할 만한 사람인지, 금융계에서 평판이 좋은 사람인지, 신뢰할 만한 출처인지, ​​아니면 그저 평범한 댓글인지 알아야 합니다.

다음도 마음에 드실 수 있습니다: AI의 맹점: 기계는 진실과 소음을 구분할 수 없습니다 | 의견

CN: 귀속 및 평판에 대해 이야기할 때, 이 데이터는 어딘가에 저장되어야 합니다. 인프라 측면에서, 특히 저작권이나 보상과 같은 문제에 대해 어떻게 생각하시나요?

BL: Intuition에서 바로 그 문제를 해결하고 있습니다. 검증 가능한 속성 기반이 있으면 누가 어떤 데이터를 생성했는지 알 수 있습니다. 이를 통해 지식에 대한 토큰화된 소유권이 가능해지고, 그에 따라 보상도 가능해집니다.

따라서 데이터가 Google 서버나 OpenAI API에 저장되는 대신, 분산된 지식 그래프에 저장됩니다. 모든 사람은 자신이 기여한 것에 대한 소유권을 갖습니다. 데이터가 AI 출력에 사용되거나 탐색될 때, 그 데이터가 생성하는 가치의 일부를 받게 됩니다.

이 점이 중요한 이유는 지금 우리가 디지털 노예이기 때문입니다. 우리는 가장 귀중한 자원인 시간, 관심, 그리고 창의력을 다른 누군가가 수익을 창출하는 데이터를 생성하는 데 쏟습니다. YouTube는 동영상을 호스팅하기 때문에 가치가 있는 것이 아니라, 사람들이 동영상을 큐레이션하기 때문에 가치가 있습니다. 좋아요, 댓글, 구독이 없다면 YouTube는 아무 의미가 없습니다.

그래서 우리는 인플루언서나 외향적인 사람이 아니더라도 누구나 자신이 창출하는 가치에서 수익을 얻을 수 있는 세상을 원합니다. 예를 들어, 꾸준히 새로운 아티스트를 발굴한다면, 당신의 취향은 가치가 있습니다. 이를 바탕으로 명성을 쌓고 수익을 창출할 수 있어야 합니다.

CN: 하지만 투명성을 확보하더라도 이러한 모델은 여전히 ​​해석하기 매우 어렵습니다. OpenAI 자체도 모델이 어떻게 결정을 내리는지 완벽하게 설명할 수 없습니다. 그러면 어떻게 될까요?

BL: 좋은 지적입니다. 모델 동작을 완전히 해석할 수는 없습니다. 너무 복잡하거든요. 하지만 우리가 제어할 수 있는 건 훈련 데이터입니다. 바로 그것이 우리의 지렛대죠.

예를 들어 보겠습니다. 한 AI는 올빼미에 푹 빠져 있고, 다른 AI는 수학에 매우 능숙하다는 연구 논문을 들은 적이 있습니다. 두 AI는 수학 관련 과제에 대해서만 함께 훈련했습니다. 하지만 결국 수학 AI도 올빼미를 좋아하게 되었는데, 상대방의 패턴을 그대로 흡수했기 때문입니다.

이러한 패턴이 얼마나 무의식적이고 미묘하게 드러나는지 정말 놀랍습니다. 따라서 유일한 방어 수단은 의도입니다. 우리는 이러한 모델에 어떤 데이터를 입력할지 신중하게 결정해야 합니다. 온라인에서 더욱 진실되고 건설적인 모습을 보여주기 위해 어떤 식으로든 "스스로를 치유"해야 합니다. AI는 항상 개발자의 가치관과 왜곡을 반영할 것이기 때문입니다.

CN: 사업 얘기를 해 봅시다. OpenAI는 현금을 소진하고 있습니다. 인프라 비용이 엄청나게 비싼데, Intuition과 같은 탈중앙화 시스템이 재정적으로나 기술적으로 어떻게 경쟁할 수 있을까요?

BL: 우리에게는 두 가지 핵심적인 장점이 있습니다. 구성 가능성과 조정입니다.

탈중앙화된 생태계, 특히 암호화폐 생태계는 협력에 매우 뛰어납니다. 전 세계에 분산된 팀들이 동일한 더 큰 문제의 다양한 구성 요소를 해결하기 위해 노력하고 있습니다. 한 회사가 수십억 달러를 낭비하며 전 세계를 상대로 싸우는 대신, 수백 명의 협력자가 상호 운용 가능한 도구를 개발하고 있습니다.

마치 모자이크 같아요. 한 팀은 에이전트 평판을 담당하고, 다른 팀은 분산형 스토리지를 담당하고, 또 다른 팀은 신원 기본 요소를 담당하는데, 이 모든 것을 하나로 엮어낼 수 있죠.

그것이 바로 초능력이에요.

두 번째 장점은 사용자 경험입니다. OpenAI는 자사의 강점에 갇혀 있습니다. ChatGPT에서 Grok이나 Anthropic으로 컨텍스트를 포팅하는 것을 허용할 수 없습니다. 그렇게 되면 OpenAI의 방어력이 약화될 것입니다. 하지만 OpenAI는 벤더 종속에는 관심이 없습니다.

저희 시스템을 사용하면 고객님의 상황을 직접 파악하고, 원하는 상담원에게 연결하여 이용하실 수 있습니다. 이를 통해 더 나은 경험을 제공하고, 고객들이 저희 시스템을 선택하게 될 것입니다.

다음도 마음에 드실 수 있습니다: 비트코인에서 AI까지: HPC에 뛰어든 5명의 암호 채굴자

CN: 인프라 비용은 어떻게 되나요? 대형 모델을 운영하는 데는 엄청난 비용이 듭니다. 소규모 모델이 지역적으로 운영되는 세상을 상상하시나요?

BL: 네, 100% 그렇습니다. 사실 저는 우리가 향하는 방향이 바로 그 방향이라고 생각합니다. 여러 개의 작은 모델이 지역적으로 실행되고, 마치 분산된 스웜(Swarm) 속의 뉴런처럼 연결되는 것이죠.

하나의 거대한 모놀리식 데이터 센터 대신 수십억 개의 소비자 기기가 컴퓨팅에 기여합니다. 암호화의 강점인 이들을 조율할 수 있다면, 이는 더 나은 아키텍처가 될 것입니다.

이것이 바로 저희가 에이전트 평판 계층을 구축하는 이유입니다. 요청을 해당 업무에 적합한 전문 에이전트에게 라우팅할 수 있습니다. 모든 것을 처리하기 위해 하나의 거대한 모델이 필요한 것이 아닙니다. 수백만 명의 에이전트를 아우르는 API 계층처럼, 업무 라우팅을 위한 스마트 시스템만 있으면 됩니다.

CN: 결정론은 어떤가요? LLM은 수학과 같이 정확한 답이 필요한 과제에는 적합하지 않습니다. 결정론적 코드를 AI와 결합할 수 있을까요?

BL: 제가 원하는 건 바로 그거예요. 루프에 결정론을 다시 도입해야 해요.

우리는 완전히 결정론적인 상징적 추론으로 시작했고, 그 후 비결정론적인 딥러닝으로 과감하게 전환했습니다. 그 덕분에 지금 우리가 목격하고 있는 폭발적인 발전을 이루었습니다. 하지만 미래는 신경상징적 추론, 즉 두 가지의 장점을 모두 결합한 것입니다.

AI가 퍼지 추론을 처리하도록 하세요. 하지만 정밀성이 필요한 경우에는 스크립트, 함수, 논리 엔진 등 결정론적 모듈을 작동시키도록 하세요. "내 친구 중 누가 이 식당을 좋아할까?"라고 생각해 보세요. 이 질문은 100% 결정론적이어야 합니다.

CN: 좀 더 자세히 살펴보면, 기업들이 운영 전반에 AI를 통합하는 모습을 볼 수 있었습니다. 하지만 결과는 엇갈렸습니다. 현 세대의 LLM이 생산성을 진정으로 향상시킨다고 생각하십니까?

BL: 물론이죠. 특이점은 이미 존재해요. 다만 불균등하게 분포되어 있을 뿐이죠.

워크플로, 특히 코드나 콘텐츠 제작에 AI를 활용하지 않는다면 다른 사람들보다 훨씬 더 빠른 속도로 작업하게 됩니다. AI 기술은 현실이며, 효율성 향상 효과는 엄청납니다. 혁신은 이미 진행 중이지만, 사람들이 아직 완전히 깨닫지 못했을 뿐입니다.

CN: 마지막 질문입니다. 많은 사람들이 이것이 거품이라고 말하고 있습니다. 벤처 자본 고갈되고 있고, OpenAI는 자금을 소진하고 있으며, Nvidia는 자사 고객사에 자금을 지원하고 있습니다. 이 상황은 어떻게 끝날까요?

BL: 네, 거품이 있긴 합니다. 하지만 기술은 실재합니다. 모든 거품은 터지지만, 그 뒤에 남는 건 기반 기술들입니다. AI도 그중 하나일 겁니다. 진정한 혁신 없이 그저 래퍼 앱만 만드는 데 쓰는 돈, 즉 멍청한 돈들이 사라지고 있죠. 하지만 딥 인프라 팀은 어떨까요? 살아남을 겁니다.

사실, 이는 두 가지 방향 중 하나로 진행될 수 있습니다. 우리는 약간의 조정을 받고 현실로 돌아오지만, 발전은 계속될 것입니다. 또는 생산성 향상이 엄청나게 일어나 AI가 경제에 디플레이션을 유발하는 요인이 될 것입니다. GDP는 산출량 기준으로 10배 또는 100배 증가할 수 있습니다. 만약 그렇게 된다면, 지출은 그만한 가치가 있었고, 우리 사회는 한 단계 더 도약할 것입니다.

어느 쪽이든 저는 낙관적입니다. 혼란과 일자리 감소는 분명 있겠지만, 우리가 제대로 된 기반을 구축한다면 빈곤에서 벗어나 풍요로운 세상이 도래할 가능성도 있습니다.

다음도 마음에 드실 수 있습니다: AI가 당신을 대체하지는 않겠지만, AI를 중심으로 구축한 엄격한 시스템은 당신을 대체할 수도 있습니다 | 의견

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트