종종 신랄한 비판으로 '토렌트 킬러'로 알려진 암호화폐 분석가 에릭 월이 X 플랫폼에서 잘 알려진 AI 컨셉 코인 프로젝트인 비텐서(TAO)에 대해 사실상 가치가 없는 프로젝트라는 신랄한 비판을 또다시 게시했습니다. 이 게시물은 이미 180만 건 이상의 노출과 4,000건 이상의 좋아요 및 즐겨찾기 수를 기록했습니다.
Original post: https: //twitter.com/ercwl/status/1773796070012649569
다음은 Followin에서 정리한 내용입니다:
TAO 토큰의 '쓸모없음'은 정말 놀라운 일이며, 현재 이 '인공지능 코인'의 시가총액은 100억 달러에 달합니다.
그렇다면 TAO의 요점은 무엇일까요?
TAO의 메커니즘은 다양한 서브넷을 실행하는 것입니다. 서브넷이란 무엇인가요?
간단히 말해, 텍스트 프롬프트 도구이므로 이해하기 쉽습니다.
실제 원리는 무엇인가요? 이 공식 문서 (https://github.com/opentensor/prompting )에서 확인할 수 있습니다.
서브넷의 채굴자는 제퍼와 위키 프록시라는 두 가지 다른 LLM을 실행합니다.
그러나 대부분의 경우 기본 모델인 Zephyr(현재는 Solar로 전환)만 실행합니다.
전체 원리는 간단합니다:
사용자가 프롬프트를 보내면 채굴자가 실행하는 대규모 모델(LLM)이 ChatGPT와 마찬가지로 답변으로 답장을 보냅니다.
채굴자는 응답에 대한 보상을 TAO 토큰으로 받습니다. 이것이 TAO 토큰이 생성되는 방식입니다.
하지만 이는 각 단서 단어에 대해 실제로 정확히 동일한 작업을 중복해서 수행하는 수천 명의 마이너가 있다는 것을 의미합니다.
그런 다음 네트워크는 이러한 답변이 서로 얼마나 유사한지 확인하여 검증합니다. 채굴자가 이상값에 해당하는 답변을 제공하면 TAO 토큰을 받지 못합니다.
여기서 문제가 발생합니다. "물이란 무엇인가요?"라는 힌트를 제공한다고 가정해 보겠습니다.
채굴자들은 "물은 분자식이 H2O인 화합물입니다"라고 답할 것이고, 여러분만 이상값으로 답하면 불이익을 받게 되므로 모두 동일한 LLM을 학습하도록 동기를 부여받게 됩니다.
그 결과 수천 명의 채굴자가 같은 답을 수천 번 반복하게 됩니다.
모델이 실제로 효과적으로 작동하는지 검증할 수 있는 AI 마법은 없습니다. 채굴자들이 서로의 응답을 복사하고 서로를 속이기 위해 수정하는 것을 막을 수 있는 방법은 없습니다.
검증 메커니즘 자체는 매우 기본적입니다:
현재 버전에서는 검증자가 하나 이상의 참조 답변을 생성하고, 모든 채굴자의 응답을 해당 참조 답변과 비교합니다. 참조 답변과 가장 유사한 답변이 가장 높은 보상을 받게 되며, 궁극적으로 가장 큰 인센티브를 받게 됩니다.
부정 행위가 얼마나 쉬운지는 잠시 제쳐두고, 이 시스템이 얼마나 비효율적인지 생각해보면 알 수 있습니다. 힌트 하나당 1000명의 채굴자가 같은 일을 한다고요? 이것이 바로 '탈중앙화된 지능'의 수준인가요?
제 친구들을 보세요. 탄자니아에 광부를 배치해 보세요. 힌트를 주세요. 작동이 멈추거나 잘못된 데이터를 출력한다고 판단되면 다른 마이너를 다른 곳으로 옮기면 됩니다. 답을 복사하고 수정하여 작업을 위조하는 것조차 막을 수 없다면 이러한 기본 언어 모델을 병렬로 실행하기 위해 1000개의 서로 다른 중복 LLM이 필요하지 않습니다.
이러한 "분산형" 모델을 실행하는 목적은 무엇일까요? Zephyr, Solar 및 위키 에이전트에는 ChatGPT와 동일한 유형의 콘텐츠 필터가 있습니다. 심지어 Zephyr는 ChatGPT의 대화 출력에 대해 학습을 받기도 했습니다. 따라서 1000명의 마이너가 동일한 기본 답변을 제공하지만 중앙 집중식 마이너보다 1000배나 효율이 떨어지고 유사성 검사만 수행하면 되기 때문에 1000개의 개별 답변이 생성되었는지 확인할 수 없습니다.
이제, 이 왕관을 쓴 쓰레기와 관련된 문제의 사실은 일반 사용자로서 이 힌트 네트워크를 사용할 수도 없다는 것입니다.
믿기 어렵다면 직접 사용해 보세요. 실제로 이 네트워크에 사용자로 접속하여 1,000명의 채굴자로부터 제퍼가 생성한 응답을 받아보세요.
결과는 불가능하다는 것입니다.
이 서브넷에서 일어나는 일은 내부에서 일어나고, 검증자는 챌린지 프롬프트를 생성하며, 1000명의 채굴자는 동일한 기본 LLM 응답과 화이트잭 TAO 토큰을 생성합니다.
그런 다음 이 TAO 토큰은 시가총액 100억 달러의 FDV 소매업자에게 판매되며, 이 멍청한 AI 멤코인을 구매하여 "탈중앙화된 AI"에 접근하려는 바보 구매자에게 판매됩니다.
만약 고등학생이 AI 코인 프로젝트를 만든다면, 그는 거의 틀림없이 비텐서(TAO)를 떠올릴 것입니다. "힌트를 기반으로 답을 생성하는 데 채굴자가 1,000명만 필요하니 탈중앙화라고 할 수 있겠네요?"
"좋아요, 그럼 답을 어떻게 확인하나요? 어떻게 검증하나요?"
"어, 아마도 이 네트워크가 이 답변들이 비슷한지 아니면 엉터리인지 확인할 수 있을 것 같은데요?"
이는 "분산형 AI"와 막연하게 비슷한 것을 목표로 하는 의미 없는 분산형 훈련으로, 물론 멋진 밈이지만 실제로는 자신의 질문에만 답변할 수 있는 1000배나 덜 효율적인 ChatGPT 봇 외에는 어떤 보장이나 유용성도 제공하지 않습니다. ChatGPT 봇은 토큰을 인쇄하여 개인 투자자에게 덤핑할 수 있다는 핑계를 대고 있습니다.
그러니 다 집어치우세요.
TAO에 대한 비판은 많은 관심과 토론을 불러일으켰고, 비트센서 설립자 @const_reborn을 비롯한 많은 사람들이 채굴자 간의 참조 답변 공유 문제에 대해 반박했습니다. 그는 이렇게 말했습니다.
"검증자는 하나 이상의 참조 답변을 생성하고, 모든 채굴자의 답변은 해당 답변과 비교됩니다."
한 가지 주목할 점은 검증자가 먼저 파일을 검색하여 이러한 참조 답변을 구성한다는 것입니다. 채굴자는 이러한 추가 컨텍스트가 없으므로 정답을 얻기 위해 RAG를 사용해야 합니다.
이는 최고의 검색 설계에 보상을 제공하는 인센티브 시스템을 만듭니다. 이를 정확하게 측정하기 위해 중복성이 사용되며, 네트워크의 추론은 중복 쿼리를 수행하지 않습니다.
머신 러닝을 이해하는 사람들에게는 자동 인코더 또는 단방향 함수와 동형화된 인센티브 시스템이라는 심오한 설계가 이해될 것입니다.
검증자가 참조 답변을 구성할 때 실제 참조를 가지고 있다는 점에 유의하세요. 즉, 질문이 참조하는 특정 문서를 보고 있는 것입니다.
반면에 마이너는 질문부터 시작하여 어떤 데이터를 검색할지 파악한 다음 답변을 컴파일해야 합니다. 검증의 비대칭성 때문에 채굴자는 지능적인 검색을 더 잘할 수 밖에 없습니다. 또한 보상의 속도 요소는 이를 위해 빠른 인프라를 실행하도록 강요합니다.



