저자: 황실량
"데이터는 새로운 석유다"라는 말은 인공지능 분야에서 지나치게 남용되고 있습니다. 하지만 주류 담론에서는 마치 우리 같은 일반인과는 아무런 관련이 없는 것처럼, 기술 대기업들의 자본 싸움, 그래픽 카드와 수조 개의 매개변수를 둘러싼 경쟁처럼 여겨집니다.
하지만 곰곰이 생각해 보니, 이 비유는 인공지능에 적용할 수 있는 아주 좋은 나침반이라는 것을 깨달았습니다.
I. 심각하게 오해받는 은유
"데이터는 새로운 석유다"라는 말은 이제 인공지능 시대의 거의 바이블이 되었습니다.
하지만 솔직히 말해서, 대부분의 사람들은 이 말을 듣고 "이건 대기업의 사업인데, 나 같은 평범한 사람들과 무슨 상관이 있지?"라고 생각할 겁니다.
주류 담론에서 말하는 "데이터"는 인터넷 전체, 위키피디아, 그리고 페타바이트 규모의 자료들을 의미하고, "석유 정제 기술"은 수만 개의 H100 그래픽 카드와 연봉 수백만 달러를 받는 과학자 집단을 가리키며, "최종 산물"은 GPT-5와 같은 전지전능한 신의 모델을 의미합니다.
이러한 논리는 비즈니스에서는 분명히 타당하지만, 문제는 본질적으로 "개입하지 마라, 협상 테이블에 앉을 자격도 없다"라고 말하는 것과 같다는 점입니다.
우리 같은 일반 사람들은 곧바로 쫓겨납니다.
더욱 암울한 것은 이 이야기에 대한 또 다른 버전이 있는데, 그것을 생각하면 생각할수록 더욱 분노가 치밀어 오른다는 점입니다.
데이터는 새로운 석유입니다. 우리 소비자 데이터는 베네수엘라의 유전과 같고, 메이투안, 알리바바, 틱톡은 미국의 트럼프와 같습니다.
그들은 우연히 (혹은 고의로) 이곳에 와서 석유를 추출하기 위해 파이프를 설치하고, 우리의 데이터를 공짜로 가져가서 "옥탄가 98의 고급 휘발유"(정밀한 알고리즘과 빅데이터를 이용한 가격 차별)로 정제한 다음, 우리에게 그것을 다시 그들에게 팔도록 강요했습니다.
결과적으로 우리는 호구 신세가 되었습니다. 원자재를 무료로 제공했을 뿐만 아니라, 모든 것을 팔아넘기고 그들의 플랫폼이 돈을 세는 것을 도와야 했습니다.
이 이야기 버전에서는 거대 기업들만이 유일한 플레이어입니다. 우리는 방대한 데이터도 자본도 없고, 대규모 모델을 훈련시키는 것도 불가능합니다. 그래서 "데이터는 새로운 석유"라는 말은 그럴듯하게 들리지만 개인에게는 완전히 쓸모없고, 심지어 약간 역겹기까지 한 슬로건이 되어버립니다.
둘째, 다른 관점에서 이해하려고 노력하면 해결책을 찾을 희망이 있을 겁니다.
저는 이러한 합의가 문제가 있다고 생각합니다. 다른 관점에서 바라볼 필요가 있습니다.
만약 우리가 "데이터는 새로운 석유"라는 개념을 일반인들에게 굳이 적용하려 한다면, 문제는 더 이상 "이 비유가 옳은가?"가 아니라 "이 개념이 내 업무에 구체적으로 어떤 도움을 줄 수 있는가?"가 되어야 할 것이다.
석유 산업이 그토록 강력한 이유는 매우 명확하고 피할 수 없는 논리적 연결 고리를 가지고 있기 때문입니다.
유전을 발견(탐사) → 정유 시설 건설(처리) → 제품 표준화(휘발유) → 유통망 구축(주유소) → 사용자에게 판매.
우리 같은 평범한 사람들에게 있어 AI 시대의 "데이터 오일"은 이러한 단계에 따라 꼼꼼하게 분해되어야 합니다. 만약 어느 한 단계라도 빠진다면, AI에 대한 불안감은 결코 생산성으로 이어지지 못하고, "뉴스 검색 + 링크 저장 + 남들이 부자가 되는 것을 구경하기"라는 정신적 소모로만 남게 될 것입니다.
자, 이제 이 논리에 따라 일반 사람들이 어떻게 일을 처리해야 하는지 자세히 설명해 드리겠습니다.
세 번째, 첫 번째 단계: 유전은 어디에 있을까요? — 주변의 "미니 금광"을 찾아보세요.
전통적인 산업에서는 석유를 찾으려면 사우디아라비아나 러시아 같은 곳으로 가야 합니다. 하지만 저희 방식에서는 유전이 말 그대로 손끝에 있습니다. 크게 두 가지 범주로 나눌 수 있다고 생각합니다.
1. 개인 정보: 당신의 뒷마당
이는 가장 쉽게 간과되지만 가장 안정적인 데이터 유형입니다. 규모가 클 필요는 없지만, 순도가 매우 높습니다.
예를 들어, 업무 프로세스, 의사 결정의 논리, 겪었던 어려움(실패 사례 검토), 그리고 업계에서 수년간 쌓아온 암묵적인 규칙 등이 있습니다.
예를 들어, 여러분의 디지털 발자국, 즉 지난 10년간 작성한 메모, 코드베이스, 초안, 이메일 등 모든 것이 포함됩니다.
이것의 가치는 전적으로 당신에게 속한다는 사실에 있습니다. 이 데이터로 학습된 "개인 디지털 트윈" 또는 "도메인 전문가 에이전트"는 어떤 범용 대형 모델로도 대체될 수 없습니다.
지난 5년간 업무나 생활에서 컴퓨터를 거의 사용하지 않고 오로지 휴대폰에만 의존해 왔다면, 인공지능 생산자로 성장할 가능성은 낮고 인공지능 소비자로 남을 가능성이 큽니다.
인공지능으로 돈을 벌고 싶다면 컴퓨터를 사야 할 것 같아요. 왜냐하면요?
컴퓨터가 없다면 체계적인 데이터 축적이 불가능해져서 완전히 "석유 빈곤국"이 될 것입니다. 휴대폰 앨범에 있는 몇 장의 사진이나 위챗에 있는 수십 기가바이트의 음성 메시지와 잡담으로는 의미 있는 결과를 얻을 수 없을 겁니다. 불순물이 너무 많고 구조가 제대로 잡히지 않아서 92옥탄 휘발유까지 정제할 수 없기 때문입니다. 운이 좋아야 29옥탄 휘발유를 얻을 수 있을 겁니다.
2. 방대한 공개 데이터: "탐색팀"을 구성하세요
두 번째 범주는 누구나 볼 수 있지만 99%의 사람들이 '탐색'보다는 '소비'에 그치는 데이터입니다. X.com, 위챗 공식 계정, arXiv, 유튜브 등이 여기에 해당하며, 데이터 시대의 '공개된 바다'라고 할 수 있습니다.
인터넷, 특히 소셜 미디어는 너무 빠르게 악화되고 있습니다. 감히 말하자면, 콘텐츠의 50% 이상, 어쩌면 90% 이상이 AGRC(인공지능이 생성한 쓰레기 콘텐츠)일 것입니다.
이 사람들은 인공지능을 이용해 말도 안 되는 것들을 대량 생산하고 있으며, 이는 지질 구조를 직접적으로 오염시키고 있습니다. 지질 탐사를 할 때 이 사실을 인지하지 못하면 쓰레기만 파내게 될 것입니다.
더 심각한 것은, 두뇌나 인공지능에 쓰레기를 입력하면 쓰레기만 나올 뿐이며, 심지어 정유 시설을 막아버릴 수도 있다는 점입니다.
그러므로 AGRC를 파헤치지 않으려면 엄격하게 선별된 **"영감 소스 조합"**을 만드는 것이 좋습니다. 하지만 명심하세요. 단순히 보는 것만으로는 충분하지 않습니다. 그것은 원유를 비축하는 것과 같습니다. 원유 정제에 대해 배워야 합니다. 각 소스를 AI를 사용하여 기계가 읽을 수 있는 연료로 변환해야 합니다.
깊은 퇴적암(책): 이것들은 균형추 역할을 합니다. 전문 분야의 고전과 문학 작품을 포함하여 매년 읽을 책 목록을 만드세요.
AI를 활용한 학습법: 단순히 생각 없이 읽기만 하지 마세요. 항상 Gemini나 ChatGPT와 같은 AI 도구를 활용하여 읽기를 도와주세요. 한 챕터를 읽고 나면, 해당 내용에 대한 토론을 진행하고 AI가 생성해 주는 질문들을 살펴보세요. 독서 후에는 전자 형식의 독서 노트를 작성하여 AI에 입력하세요. 이렇게 하면 자신만의 지식 기반을 구축할 수 있습니다.
새로운 연구 분야 탐색(논문 및 보고서): 여가 시간에는 arXiv나 Google Scholar를 검색해 보세요. 매주 "논문 점심 모임"을 열고 논문 한 편을 끝까지 읽도록 노력하세요.
AI 기반 접근 방식: 원문이 이해하기 어려우신가요? PDF 파일을 NotebookLM이나 ChatGPT에 업로드하기만 하면 핵심 주장과 데이터를 요약해 드립니다. 복잡한 내용을 이해하기 쉽게 정리하여 저장하실 수 있도록 도와드립니다.
지표 유출(뉴스): RSS 또는 맞춤형 뉴스 피드를 활용하세요. 저는 뉴스를 읽을 때 헤드라인만 훑어보고, 정말 중요한 내용만 저장합니다.
AI 기반 접근 방식: 링크만 저장하지 마세요. 콘텐츠를 복사하고 AI가 태그를 지정하고 키워드를 추출하며 메모 앱에 저장할 수 있도록 카테고리를 분류하도록 하세요. 그렇지 않으면 먼지만 쌓이고 잊혀질 뿐입니다.
관련 활동(팟캐스트 및 강연): 출퇴근길에 TED 라디오 아워를 듣기. 매달 오프라인 모임에 한두 번 참석하려고 노력하기.
AI 기반 접근 방식: 좋은 관점 들었을 때, 단순히 고개만 끄덕이지 마세요. Whisper를 사용하여 녹음 내용을 텍스트로 변환한 다음, AI가 구조화된 메모로 정리하도록 하세요. 오디오 파일은 복구할 수 없지만 텍스트는 복구 가능합니다.
고수익 유정(소셜 미디어): 트위터/X에서 진정한 전문가 그룹을 팔로우하세요. 팔로우 목록을 정기적으로 정리하고 스팸이나 부정적인 정서 게시하는 사람들을 언팔로우하세요.
AI 통합 방법: 훌륭한 게시글을 발견하면 간단히 복사하여 AI에 입력하세요. AI는 해당 게시글 작성자의 논리적 오류를 분석하거나, 작성자의 관점 지식 시스템에 통합할 수 있습니다.
현장 연구(생활 관찰, 현장 조사): 의도적으로 "질문을 염두에 두고 삶을 바라보는" 연습을 하세요. 이는 AI 웹 크롤러가 전혀 수집할 수 없는 직관적인 데이터 유형입니다.
AI 기반 접근 방식: 영감이 떠오르면 타이핑하지 말고 말만 하세요. 그러면 AI가 그 내용을 일기 형식으로 정리해 줍니다. AI가 당신의 두서없는 생각을 논리적인 통찰력으로 바꿔줄 것입니다.
우리는 언제든 휴대폰을 집어 들고 횡설수설하는 습관을 들여야 한다.
이 여섯 가지 원천이 바로 "혼합 유전"입니다. 입력값이 충분히 다양하고, 인공지능을 통한 사전 처리를 모두 거쳤을 때 비로소 최종 결과물이 진부함을 피할 수 있습니다.
넷째, 두 번째 단계: 석유 정제 설비는 어디에 있습니까? — 큰 모형에만 집중하지 마십시오.
석유를 발견했다면 다음 단계는 정제하는 것입니다. 주류 언론은 끊임없이 그래픽 카드를 사라고 부추기지만, 개인에게 있어 진정한 정제소는 바로 자신의 소프트웨어 스택과 사고 과정입니다.
1. 큰 모델은 그냥 "보일러"입니다.
ChatGPT Plus 멤버십에 가입한다고 해서 우리가 더 나아지는 건 아닙니다. 마치 보일러를 사놓고 옆에서 반짝이는 모습만 바라보는 것과 같죠. 실제로 사용하지는 않으니까요.
ChatGPT나 DeepSeek 같은 대형 모델은 기본적으로 에너지 생산의 기초와 같습니다. 연소는 가능하지만, 그렇다고 석유를 생산할 수 있는 것은 아닙니다.
2. 실제 석유 정제소는 "개인용 도구 시스템"입니다.
효율적인 개인용 석유 정제 시설에는 다음과 같은 구성 요소가 필요합니다.
파이프라인(툴체인): VS Code, Python, 스킬 등.
프로세스 흐름(방법론): 이것이 핵심적인 장벽입니다. 프롬프트를 작성하는 방법, RAG 지식 기반을 구축하는 방법, 그리고 여러 에이전트(스킬)를 함께 작동시키는 방법에 관한 것입니다.
핵심은 "모델이 얼마나 강력한가"가 아니라, 인공지능과 어떻게 상호작용하는지, 그리고 마음속에 있는 암묵적인 경험을 인공지능이 이해할 수 있는 지침으로 어떻게 변환하는지에 있습니다.
이 "개인 맞춤형 엔지니어링 시스템"이 바로 당신의 정제소이지, 모델 자체가 아닙니다.
다섯 번째, 세 번째 단계: 제품 자체가 최종 목표가 아닙니다. 제품을 판매하는 것이 진정한 싸움입니다.
이것이 전체 공급망에서 가장 잔혹한 고리입니다. 페트로차이나는 주유소에 석유를 운송하기만 하면 운전자들이 자연스럽게 줄을 서서 기다릴 것입니다. 하지만 AI 시대에는 제품화와 판매가 엄청나게 어려워집니다.
1. AI가 정제한 "휘발유"는 매우 비표준적입니다.
"개인 데이터"와 "대규모 모델"을 사용하여 만들어내는 것은 제너럴 모터스의 휘발유가 아니라, 오히려 다음과 같은 것일 가능성이 높습니다.
- 오직 당신만 사용할 수 있는 파이썬 스크립트입니다.
- 독특한 스타일의 기사
- 의사의 진찰 후 AI가 처리한 보고서.
- 개인 맞춤형 법률 자문
이러한 것들은 보편적이지 않고 표준화되어 있지 않으며, 특히 상황에 따라 크게 달라집니다.
2. 진짜 중요한 질문: 누구에게 팔아야 할까요?
시작하기 전에 스스로에게 이 질문을 던져야 합니다. "이걸 누구에게 팔 건가요?" 사실 이것은 우리가 어떤 종류의 석유를 정제할지 알아내는 방법이기도 합니다.
(개인적인 용도로) 스스로에게 판매하는 것: 시간을 절약하는 것은 돈을 버는 것이며, 이는 가장 쉽게 달성할 수 있는 순환 구조입니다.
기업 대상 판매(B2B): 요청 사항이나 워크플로를 솔루션으로 구성합니다. 이를 위해서는 매우 뛰어난 사전 판매 능력(설득력)이 필요합니다.
일반 대중 대상 판매(B2C): 앱이나 콘텐츠 칼럼으로 전환하세요. 이는 트래픽을 분산시키는 능력에 달려 있습니다.
사실 AI 시대에는 석유 정제(콘텐츠 생성)는 점점 쉬워지고 있지만, 주유소 건설(유통 및 판매)은 그 어느 때보다 어려워지고 있습니다.
6. 환경 보호를 잊지 마세요: 쓰레기가 당신을 덮치지 않도록 하세요.
전통적인 석유 정제 과정에서는 폐기물, 폐수, 폐가스가 발생합니다. 이러한 것들을 처리하지 않으면, 정유 공장은 이윤을 남기기도 전에 유해 가스로 인해 사람들이 목숨을 잃게 됩니다.
데이터 정제에도 마찬가지로 적용됩니다. **"사이버 오염"**은 매우 심각하며, 이를 정기적으로 정화하기 위한 **"환경 보호 부서"**가 필요합니다.
1. 유효기간이 지난 "공구 잔여물"을 정리하십시오.
인공지능이 발전하는 속도는 엄청나게 빠르고, 말도 안 되게 빠릅니다.
지난달에 즐겨찾기에 추가했던 "2025년에 꼭 사용해야 할 AI 내비게이션 사이트 TOP 10" 목록에 있는 사이트 중 5개가 이번 주에 서비스를 종료할 수도 있고, 오늘 공들여 작업 중인 AI 드로잉 매개변수가 내일이면 "원클릭 생성" 기능에 밀려 쓸모없어질 수도 있습니다.
쓸모없는 도구를 버리지 못하고 쌓아두는 "사이버 고물상"이 되지 마세요. 필요하면 삭제하고, 필요 없으면 팔로우를 해제하세요. 도구는 사용하기 위해 만들어진 것이지 숭배하기 위해 만들어진 것이 아닙니다.
시대에 뒤떨어진 공구를 쌓아두는 것은 마치 집에 녹슨 고철을 가득 채워놓는 것과 같습니다. 결국 작업 속도만 늦출 뿐입니다.
2. 완전히 짜낸 데이터의 "빈 껍데기"를 버리십시오.
많은 사람들이 '다람쥐 증후군'에 시달립니다. PDF 파일이 보이면 무조건 다운로드하고, 동영상이 보이면 무조건 수집하며, 하드 드라이브에 수 테라바이트의 데이터를 가득 채워 마치 세상을 다 가진 듯한 기분을 느낍니다.
그건 지식이 아니라 쓰레기 매립지일 뿐입니다.
진정으로 환경 친화적인 접근 방식은 AI를 사용하여 PDF, 비디오 및 긴 기사에서 "핵심"을 추출하는 것입니다. 즉, 요약을 생성하고, 주요 인용구를 클레임, 이를 메모로 변환하는 것입니다.
파일에서 필요한 정보를 모두 추출했으면 원본 파일은 삭제하거나 콜드 스토리지에 보관하세요. 여러분의 집중력은 매우 귀중하고 한정된 자원입니다. 이러한 미처리 파일에 시간을 낭비하지 마세요.
고효율 정유 시설은 정제된 연료만 보유하고 원유 껍질은 버려야 합니다.
3. 그 "뱀파이어 좀비 법안"들을 없애버리세요.
AI에 대한 불안감은 우리로 하여금 많은 어리석은 행동을 하게 만들었는데, 그중 가장 어리석은 것은 안전감을 사기 위해 돈을 펑펑 쓰는 것입니다.
수업 등록, 강좌 구매, 행사 참석, 플러스 멤버십 구매... 이 모든 비용은 결코 적지 않습니다. 더 나쁜 것은, 여러 가지 구독 서비스(특히 월 구독료가 부과되는 서비스)에 가입하고 나면 해지를 잊어버리는 경우가 많다는 것입니다.
전에 테스트용으로 서버를 하나 샀는데, 벌써 3년은 넘었네요. 매달 제 계좌에서 몰래 일정 금액이 빠져나가는데, 각종 청구서 사이에 숨겨져 있는 것 같아요. 테스트 당일에만 사용했기 때문에 전혀 몰랐어요.
저도 충동적으로 ChatGPT, Gemini, Claude, Perplexity 같은 서비스들의 자동 갱신 구독권을 잔뜩 샀고, API도 몇 개 구매했어요. 그런데 어떻게 됐냐고요? 대부분 그냥 먼지만 쌓인 채로 방치되어 있더라고요.
젠장, 너무 아까워!
이 모든 것들은 "환경 보호"가 다뤄야 할 문제들입니다. 그렇지 않으면, 판매할 수 있는 석유를 정제하기도 전에 이러한 오염으로 인해 자원이 완전히 고갈될 것입니다.
VII. 마지막으로 몇 마디 덧붙이자면: 행동 지도
"데이터는 새로운 석유"라는 거창한 허울을 벗겨내면, 그것은 더 이상 도달할 수 없는 자본주의적 이야기가 아니라, 평범한 사람들을 위한 냉혹한 로드맵이 됩니다.
이 시대에 승리하고 싶다면, "재무제표"를 빠르게 확인하세요.
- 저장 공간: 아직도 틱톡을 스크롤하며 시간을 보내고 계신가요? 아니면 "영감의 원천"과 AI 지원을 통해 의식적으로 양질의 데이터를 축적하고 계신가요? (AGRC 스팸은 피해주세요)
- 생산 능력: 귀사는 (정유 시설에 필요한) 자체적인 도구와 방법론을 보유하고 있습니까? 그리고 어떤 종류의 원유를 정제하십니까?
- 판매 채널: 충분히 생각해 보셨나요? 정제한 비표준 제품을 정확히 누구에게 판매할 계획이신가요? 이는 92옥탄가 오일을 정제하든 98옥탄가 오일을 정제하든 생산 능력을 결정하는 데 사용할 수 있습니다.
- 환경 문제: 혹시 디지털 쓰레기를 잔뜩 쌓아두셨나요? 신용카드 명세서를 확인하고, 더 이상 필요 없는 구독 서비스들을 해지하셨나요?
마지막으로 조언 하나 드리겠습니다. 수십억 개의 변수를 다루는 뉴스 기사는 잊어버리세요. 오늘 당장 시작하세요. 컴퓨터를 구입하고, 영감의 원천을 찾고, 첫 번째 소규모 유정을 시추하고, 먼저 스스로에게 그 결과물을 팔아보고, 인공지능이 주도하고 당신은 보조적인 역할을 하는 자동화 도구를 개발하여 당신의 작업을 체계화하세요.
솔직히 저도 잘 모르겠습니다. 3년 넘게 인공지능을 연구해 왔지만, 이렇다 할 성과를 내지 못했거든요. 겨우 할 일 목록을 관리해주는 인공지능이랑 독서 노트를 정리해주는 인공지능 하나 만들었어요. 앞으로 뭘 더 개발할 수 있을지 아직도 고민 중입니다.



