중국의 인공지능 개발이 이토록 빠른 이유는 무엇일까요? 그 해답은 연구실 안에 있습니다.

이 기사는 기계로 번역되었습니다

원문 표시

편집자 주: 중국의 AI 연구소들은 대규모 AI 모델 개발을 위한 글로벌 경쟁에서 점점 더 막강한 영향력을 행사하고 있습니다. 이들의 강점은 풍부한 인재, 강력한 엔지니어링 역량, 빠른 개발 속도뿐만 아니라 매우 실용적인 조직 운영 방식에서도 비롯됩니다. 즉, 개념 논의보다는 모델 구축에 집중하고, 개별 스타보다는 팀 실행에 중점을 두며, 외부 서비스에 대한 의존도를 낮추고 핵심 기술 스택을 자체적으로 숙달하는 것을 선호합니다.

저자 네이선 램버트는 중국의 여러 주요 AI 연구소를 방문한 후, 중국의 AI 생태계가 미국과 완전히 동일하지는 않다는 것을 발견했습니다. 미국은 독창적인 패러다임, 자본 투자, 그리고 최고 과학자들의 개인적 영향력을 더 중시하는 반면, 중국은 기존 분야에서 빠르게 따라잡고 오픈 소스, 엔지니어링 최적화, 그리고 대량 젊은 연구자들의 투자를 통해 모델 기능을 신속하게 발전시키는 데 더 능숙합니다.

가장 주목할 만한 점은 중국의 AI가 미국의 AI를 넘어섰는지 여부가 아니라, 두 가지 서로 다른 발전 경로가 나타나고 있다는 점입니다. 미국은 자본과 스타 연구소를 중심으로 한 첨단 기술 경쟁에 가까운 반면, 중국은 엔지니어링 역량, 오픈 소스 생태계, 그리고 기술적 자율성을 바탕으로 한 산업 경쟁에 더 가깝습니다.

이는 미래의 AI 경쟁이 단순히 모델 순위 싸움이 아니라 조직 역량, 개발자 생태계, 그리고 산업 실행력의 경쟁이 될 것임을 의미합니다. 중국 AI의 진정한 변화는 더 이상 실리콘 밸리를 모방하는 데 그치지 않고, 독자적인 방식으로 세계 최전선에 참여하고 있다는 점입니다.

다음은 원문입니다.

항저우에서 상하이로 향하는 새 고속 열차에 앉아 창밖을 보니, 풍력 터빈이 촘촘히 박힌 구릉들이 석양을 배경으로 실루엣처럼 펼쳐져 있었다. 산들은 배경을 이루고 있었고, 앞쪽으로는 고층 건물들이 드문드문 자리 잡은 광활한 들판이 펼쳐져 있었다.

중국에서 돌아온 후 저는 깊은 겸손함을 느꼈습니다. 낯선 곳에서 그토록 따뜻한 환영을 받으니 정말 감동적이고 인간미 넘치는 경험이었습니다. 그동안 멀리서만 알고 지냈던 AI 생태계의 많은 분들을 직접 만날 수 있는 특권을 누렸습니다. 그분들의 환한 미소와 열정은 제가 하는 일, 그리고 AI 생태계 전체가 세계적인 것이라는 사실을 다시 한번 일깨워주었습니다.

중국 연구자들의 사고방식

언어 모델을 개발하는 중국 기업들은 이러한 기술의 "빠른 추종자"가 되기에 매우 적합합니다. 이들은 중국의 오랜 교육 및 직업 문화 전통을 기반으로 하면서도 서구와는 다소 다른 접근 방식으로 기술 기업을 구축하고 있습니다.

최신 대형 모델과 이를 통해 구현되는 에이전트 기반 워크플로우와 같은 결과물과, 최고 수준의 과학자, 방대한 데이터, 가속화된 컴퓨팅 자원과 같은 투입 요소만 놓고 보면 중국과 미국의 연구소는 대체로 비슷해 보입니다. 하지만 진정한 차이점은 이러한 요소들이 어떻게 조직되고 형성되는지에 있습니다.

저는 중국 연구소들이 그토록 빠르게 따라잡고 최첨단 기술을 유지하는 이유 중 하나가 그들의 문화가 그러한 연구에 완벽하게 적합하기 때문이라고 늘 생각해 왔습니다. 하지만 직접 사람들과 이야기를 나누기 전에는 이러한 직감이 어떤 중요한 사회적 영향에 의한 것인지 확신할 수 없었습니다. 중국 유수의 연구소에서 일하는 훌륭하고 겸손하며 열린 마음을 가진 과학자들과 이야기를 나누면서 제 생각이 훨씬 더 명확해졌습니다.

오늘날 최고의 대규모 언어 모델을 구축하는 것은 데이터 및 아키텍처 세부 사항부터 강화 학습 알고리즘 구현에 이르기까지 전체 기술 스택에 걸쳐 세심한 작업에 크게 의존합니다. 모델의 각 부분은 성능 향상의 잠재력을 가지고 있으며, 이러한 개선 사항들을 결합하는 것은 복잡한 과정입니다. 이 과정에서 다목적 최적화에서 전체 모델의 성능을 극대화하기 위해 매우 뛰어난 개인의 작업이 잠시 중단될 수도 있습니다.

미국 연구자들 역시 개별 구성 요소와 관련된 문제를 해결하는 데 매우 능숙하지만, 미국은 "자신의 연구 결과를 적극적으로 알리는" 문화가 더 강합니다. 과학자로서 자신의 연구에 대한 관심을 적극적으로 추구할수록 성공할 가능성이 높아지는데, 현대 문화는 "최고의 AI 과학자"가 되는 새로운 명예의 길을 제시하고 있습니다. 이는 직접적인 갈등을 야기합니다.

널리 알려진 바에 따르면, 라마(Llama) 조직은 이러한 이해관계가 위계 구조에 깊숙이 자리 잡으면서 정치적 압력으로 붕괴했습니다. 다른 연구소에서도 때때로 최고 연구원을 "달래서" 그들의 아이디어가 최종 모델에 반영되지 않았다는 불만을 잠재워야 할 필요가 있다는 이야기를 들었습니다. 이것이 전적으로 사실인지 아닌지는 알 수 없지만, 요점은 분명합니다. 자기 인식과 경력 발전 욕구는 실제로 사람들이 최상의 모델을 구축하는 데 방해가 될 수 있다는 것입니다. 미국과 중국 간의 이처럼 사소하지만 방향성을 띤 문화적 차이조차도 최종 결과물에 상당한 영향을 미칠 수 있습니다.

차이점 중 하나는 중국에서 실제로 누가 이러한 모델을 구축하고 있느냐에 있습니다. 모든 연구소에서 공통적으로 나타나는 현실은 핵심 기여자 중 상당수가 여전히 학생이라는 점입니다. 이 연구소들은 역사가 짧은 편인데, 이는 Ai2의 조직 구조를 떠올리게 합니다. 당시에도 학생들은 동료로 대우받으며 대규모 언어 모델 팀에 직접 통합되었습니다.

이는 미국의 최고 연구소들과는 매우 다릅니다. 미국에서는 OpenAI, Anthropic, Cursor 같은 회사들이 인턴십 프로그램을 아예 운영하지 않습니다. 구글 같은 회사들은 명목상으로는 제미니 프로젝트와 관련된 인턴십을 제공하기도 하지만, 많은 사람들이 그 인턴십이 실제 핵심 업무와는 동떨어져 있을 것을 우려합니다.

요약하자면, 이러한 미묘한 문화적 차이는 다음과 같은 방식으로 모델 구축 능력을 향상시킬 수 있습니다. 사람들은 최종 모델을 개선하기 위해 덜 화려한 작업에도 더 적극적으로 참여할 의향이 있습니다. AI 개발에 새로 참여하는 사람들은 이전 AI 열풍에 덜 영향을 받아 새로운 현대 기술 방식에 더 빠르게 적응할 수 있습니다. 실제로 제가 이야기를 나눈 한 중국 과학자는 이를 명시적으로 장점으로 여겼습니다. 자기 인식 수준이 낮으면 사람들이 시스템을 조작하려는 시도를 덜 하기 때문에 조직 구조를 어느 정도 더 쉽게 확장할 수 있습니다. 또한, 이미 다른 곳에서 개념 증명이 이루어진 문제를 해결하는 데 적합한 인재 대량 존재합니다.

이처럼 현대적인 언어 모델을 구축하려는 경향은 중국 연구자들이 창의적이고 획기적인 "0에서 1로 가는" 학술 연구를 덜 한다는 기존의 고정관념과 대조를 이룹니다.

이번 출장 중 여러 연구실을 방문하면서 많은 책임자들이 더욱 야심찬 연구 문화를 조성하고 있다고 언급했습니다. 하지만 일부 기술 책임자들은 이러한 과학 연구 방법의 변화가 단기간에 가능할지에 대해 회의적인 반응을 보였습니다. 교육 및 인센티브 시스템의 전면적인 재설계가 필요한데, 현재의 경제 상황에서는 너무 큰 변화이기 때문입니다.

이러한 문화는 "대규모 언어 모델 구축 게임"에 매우 능숙한 학생과 엔지니어 집단을 양성하는 것으로 보입니다. 그리고 당연히 그 수는 엄청나게 많습니다.

이 학생들은 중국도 미국과 마찬가지로 인재 유출 현상을 겪고 있다고 말했습니다. 이전에는 학계 진출을 고려했던 많은 사람들이 이제는 산업계에 남을 계획이라는 것입니다. 가장 흥미로운 발언 중 하나는 원래 교수가 되고 싶었던 한 연구원의 말이었습니다. 그는 교육 시스템에 더 가까이 있고 싶어서 교수가 되려 했다고 했지만, 곧이어 "대규모 언어 교육 모델이 이미 교육 문제를 해결해 버렸는데, 학생들이 왜 굳이 저에게 와서 이야기를 나누려 하겠어요?"라고 반문했습니다.

새로운 관점을 가지고 대규모 언어 모델 분야에 진입하는 학생들은 큰 이점입니다. 지난 몇 년 동안 대규모 언어 모델 분야에서는 MoE 확장부터 강화 학습 확장, 그리고 지능형 에이전트 지원에 이르기까지 중요한 패러다임 변화가 있었습니다. 이러한 작업들을 제대로 수행하려면 광범위한 문헌과 회사 내 기술 스택을 포함한 대량 배경 정보를 매우 빠르게 습득해야 합니다.

학생들은 이런 종류의 일에 익숙하며 "무엇이 효과가 있어야 한다"는 선입견을 겸손하게 버릴 의향이 있습니다. 그들은 모델을 개선할 기회를 얻기 위해 온 힘을 다해 몰두합니다.

이 학생들은 놀라울 정도로 직설적이었고, 과학자들을 산만하게 할 수 있는 철학적인 세부 사항에 얽매이지 않았습니다. 제가 그들에게 자신들의 모델이 가져올 경제적 함의나 장기적인 사회적 리스크 대해 어떻게 생각하는지 물었을 때, 복잡한 관점 가지고 이러한 문제에 영향력을 행사하려는 중국 연구자는 훨씬 적었습니다. 그들은 자신들의 역할을 단순히 가능한 한 최상의 모델을 만드는 것으로 여겼습니다.

이러한 차이는 미묘해서 쉽게 간과될 수 있습니다. 하지만 유창하고 지적인 영어 실력을 갖춘 연구자와 긴 대화를 나눌 때 가장 분명하게 드러납니다. 인공지능에 대한 철학적인 질문을 던지면, 이러한 근본적인 질문들은 허공에 맴돌고 상대방은 그저 당황한 기색을 보입니다. 그들에게는 이것이 범주적 오류로 느껴지는 것입니다.

한 연구자는 심지어 댄 왕의 유명한 발언을 인용하며, 변호사가 주도하는 미국과 달리 중국은 엔지니어가 주도한다고 말했습니다. 그는 이러한 비유를 통해 중국 과학자들의 발전 욕구를 강조했습니다. 중국에는 드와르케시나 렉스 같은 주류 팟캐스트와는 달리, 과학자들의 스타성을 체계적으로 육성하는 시스템이 없습니다.

나는 중국 과학자들에게 인공지능으로 인한 경제적 불확실성, 단순한 일반 인공지능(AGI)의 한계를 넘어서는 문제들, 또는 모델의 작동 방식에 대한 윤리적 논쟁에 대해 의견을 들어보려 했다. 이러한 질문들은 궁극적으로 이 과학자들의 배경과 교육 수준을 드러냈다(편집 1). 그들은 자신의 연구에 매우 몰두했지만, 사회가 어떻게 조직되고 어떻게 변화해야 하는지에 대한 토론과 의견 표명을 장려하지 않는 환경에서 성장했다.

좀 더 넓은 시각으로, 특히 베이징에서는 샌프란시스코 만 지역과 매우 비슷한 느낌이었습니다. 경쟁력 있는 연구소가 걸어서 몇 분, 택시로 몇 분 거리에 있는 경우가 많았습니다. 도착 후 호텔로 가는 길에 알리바바 베이징 캠퍼스에 들렀습니다. 이후 36시간 동안 Zhipu AI, Lunar Dark Side, 칭화대학교, 메이투안, 샤오미, 그리고 01.ai를 방문했습니다.

중국에서는 디디추싱(차량 호출 앱)을 이용하는 것이 매우 편리합니다. XL 모델을 선택하면 마사지 의자가 있는 소형 전기 밴이 배정되는 경우가 많습니다. 연구원들에게 인재 전쟁에 대해 물어보니 미국에서 겪는 상황과 매우 비슷하다고 했습니다. 연구원들은 이직이 잦고, 어디로 갈지는 주로 그 당시 분위기가 가장 좋은 곳에 달려 있다고 합니다.

중국에서는 방대한 언어 모델 커뮤니티가 서로 싸우는 부족이라기보다는 하나의 생태계처럼 느껴집니다. 여러 차례 비공개 대화를 나눠본 결과, 동료들에 대한 존중이 거의 유일한 공통된 의견이었습니다. 모든 중국 연구소는 바이트댄스와 그들의 인기 있는 더우바오(Doubao) 모델을 경계하는데, 이는 바이트댄스가 중국에서 유일하게 최첨단 기술을 보유한 비공개 소스 연구소이기 때문입니다. 반면, 모든 연구소는 딥시크(DeepSeek)를 매우 존경하며, 경영진 차원에서 가장 연구 역량이 뛰어난 연구소로 여깁니다. 미국에서는 연구소 구성원들과 비공개 대화를 나누다 보면 감정적인 충돌이 순식간에 일어나는 경우가 많습니다.

중국 연구자들의 겸손함에서 가장 인상 깊었던 점은 사업 문제는 자기 일이 아니라고 대수롭지 않게 여기는 태도였습니다. 반면 미국에서는 데이터 판매자부터 해시레이트, 융자 에 이르기까지 다양한 생태계의 산업 동향에 모두가 몰두하는 것처럼 보였습니다.

중국 인공지능 산업과 서구 연구소 간의 차이점과 유사점

오늘날 AI 모델 구축이 흥미로운 이유는 단순히 뛰어난 연구원들을 한 건물에 모아 공학적 걸작을 만들어내는 것만으로는 충분하지 않기 때문입니다. 물론 과거에는 그런 방식이 더 일반적이었지만, AI 업무 지속하기 위해서는 대규모 언어 모델 구축은 구축, 배포, 융자, 그리고 그 결과물의 활용을 촉진하는 것까지 아우르는 복합적인 양상을 띠게 되었습니다.

선도적인 AI 기업들은 복잡한 생태계 내에 존재합니다. 이러한 생태계는 자금, 해시레이트, 데이터 등을 제공하여 최첨단 개발을 지속적으로 촉진합니다.

서구 생태계에서는 대규모 언어 모델을 구축하고 유지하는 데 필요한 다양한 입력 요소의 통합이 비교적 잘 개념화되고 체계화되어 있습니다. Anthropic과 OpenAI가 대표적인 예입니다. 따라서 중국 연구소들이 이러한 문제에 대해 생각하는 방식에 유의미한 차이가 있다면, 각 기업이 미래에 어떤 중요한 가치에 투자하고 있는지를 엿볼 수 있을 것입니다. 물론 이러한 미래는 융자 및 해시레이트 제약 조건에도 크게 영향을 받을 것입니다.

제가 "AI 산업 수준"의 연구소들과 나눈 대화에서 얻은 가장 중요한 핵심 내용을 다음과 같이 요약했습니다.

첫째, 인공지능에 대한 국내 수요의 초기 징후가 나타나고 있습니다.
널리 논의되는 가설 중 하나는 중국 기업들이 일반적으로 소프트웨어 구매에 소극적이기 때문에 중국 AI 시장 규모가 작을 것이며, 따라서 연구소를 지원할 만큼 충분히 큰 추론 시장을 개척할 수 없을 것이라는 점입니다.

하지만 이러한 평가는 SaaS 생태계에 해당하는 소프트웨어 지출에만 적용됩니다. 그리고 중국의 SaaS 생태계는 역사적으로 규모가 매우 작았습니다. 반면, 중국은 여전히 거대한 클라우드 시장을 보유하고 있습니다.

핵심적이면서도 아직 답을 찾지 못한 질문은 중국 기업들의 AI 투자 규모가 소규모 SaaS 시장과 유사할지, 아니면 기본적인 투자 형태인 클라우드 시장과 유사할지 여부입니다. 이 질문은 중국 연구소 내부에서도 논의되고 있습니다. 전반적으로 AI는 클라우드 시장에 더 가까워지고 있으며, 새로운 도구를 둘러싼 시장이 성장하지 않을 것이라고 진정으로 걱정하는 사람은 아무도 없을 것 같습니다.

둘째, 대부분의 개발자들은 클로드의 영향을 크게 받았습니다.
클로드(Claude)가 중국에서 명목상 금지되었음에도 불구하고, 중국의 AI 개발자들은 대부분 클로드에 매료되어 있으며, 클로드가 소프트웨어 개발 방식을 어떻게 변화시켰는지에 대해 큰 관심을 가지고 있습니다. 중국이 역사적으로 소프트웨어 구매에 소극적이었다는 사실이 앞으로 추론 기술에 대한 수요가 급증하지 않을 것이라는 의미는 아닙니다.

중국 기술 인력들은 매우 실용적이고 겸손하며 의욕적입니다. 이는 "소프트웨어를 구매하지 않는" 과거의 습관보다 훨씬 더 강하게 제게 각인되었습니다.

일부 중국 연구원들은 Kimi나 GLM의 명령줄 도구와 같은 자체 개발 도구를 사용한다고 언급했지만, 모든 연구원들이 Claude를 사용한다고 답했습니다. 놀랍게도, 샌프란시스코 베이 지역에서 빠르게 인기를 얻고 있는 Codex를 언급한 사람은 거의 없었습니다.

셋째, 중국 기업들은 기술 소유권을 중시하는 사고방식을 가지고 있습니다.
중국 문화가 급성장하는 경제와 융합되면서 예측할 수 없는 결과들이 나타나고 있습니다. 제가 받은 깊은 인상 중 하나는 수많은 AI 모델들이 이곳의 많은 기술 기업들 사이에서 실용적인 균형을 반영하고 있다는 것입니다. 단 하나의 포괄적인 계획이 있는 것은 아닙니다.

이 업계는 바이트댄스와 알리바바 같은 거대 기업들에 대한 존경심으로 특징지어지는데, 이들은 상당한 시장 점유율을 확보할 자원을 보유한 것으로 인식됩니다. 딥시크는 기술적으로는 존경받는 선두 기업이지만, 시장 선두 기업과는 거리가 멉니다. 딥시크는 업계의 방향을 제시하지만, 시장을 장악할 만한 경제적 구조를 갖추고 있지 않습니다.

이로 인해 메이투안이나 앤트 그룹 같은 기업들이 남게 되었습니다. 서구인들은 이들 기업들도 이러한 모델을 구축하고 있다는 사실에 놀랄 수도 있겠지만, 사실 이들은 대규모 언어 모델을 미래 기술 제품의 핵심으로 보고 있으며, 따라서 탄탄한 기반이 필요하다고 판단하고 있는 것입니다.

기업들이 견고하고 범용적인 모델을 세밀하게 조정할 때, 오픈 소스 커뮤니티의 피드백은 기술 스택을 강화하는 동시에 내부적으로 수정된 제품 버전을 유지할 수 있도록 해줍니다. 업계의 이러한 "오픈 소스 우선" 사고방식은 실용주의에 기반을 두고 있습니다. 즉, 모델이 강력한 피드백을 받을 수 있도록 돕고, 오픈 소스 커뮤니티에 기여하며, 자체적인 사명을 달성할 수 있도록 지원합니다.

넷째, 정부 지원은 분명히 존재하지만 그 규모는 불분명하다.
중국 정부가 오픈 대규모 언어 모델링 대회(OLLM)를 적극적으로 지원하고 있다는 주장이 흔히 제기되지만, 이는 여러 계층으로 구성된 비교적 탈중앙화 정부 시스템이며, 각 계층마다 책임 범위를 명확히 규정한 운영 지침이 부족한 실정입니다.

베이징의 각 지역들은 첨단 기술 기업들을 유치하기 위해 경쟁하고 있습니다. 이러한 기업들에게 제공되는 "지원"에는 면허 갱신과 같은 관료주의적 절차를 간소화하는 것이 거의 확실시됩니다. 하지만 이러한 지원은 어디까지 미칠 수 있을까요? 정부 차원에서 인재 유치를 도울 수 있을까요? 반도체 칩 밀수를 묵인할 수는 없을까요?

방문 기간 내내 정부의 관심이나 지원에 대한 언급은 많았지만, 관련 정보는 제가 세부 사항을 확신 있게 보고하기에는 턱없이 부족했고, 정부가 중국의 인공지능 개발 방향을 실제로 어떻게 바꿀 수 있을지에 대한 확신 있는 견해를 형성하기에도 충분하지 않았습니다.

물론 중국 정부 최고위층이 해당 모델과 관련된 기술적 결정에 영향을 미쳤다는 증거는 전혀 없습니다.

다섯째, 데이터 산업은 서구에 비해 훨씬 덜 발달되어 있습니다.
이전에 앤트로픽(Anthropic)이나 오픈AI(OpenAI)가 강화 학습 분야 발전을 위해 단일 환경에 1천만 달러 이상을 투자하고, 연간 누적 지출액이 수억 달러에 달한다는 소식을 접했습니다. 따라서 중국 연구소들도 미국 기업으로부터 이와 유사한 환경을 구매하고 있는지, 아니면 미국 기업과 유사한 국내 생태계가 구축되어 있는지 궁금합니다.

데이터 산업 자체가 존재하지 않는다는 것이 아니라, 경험에 비추어 볼 때 해당 산업의 데이터 품질이 상대적으로 떨어진다는 것입니다. 따라서 많은 경우 자체적으로 환경이나 데이터를 구축하는 것이 더 낫습니다. 연구원들은 강화 학습 훈련 환경을 직접 구축하는 데 대량 시간을 투자하는 반면, 바이트댄스나 알리바바 같은 대기업은 이를 지원하기 위해 사내 데이터 주석 팀을 운영할 수 있습니다. 이 모든 것은 앞서 언급한 "사느니 차라리 직접 만들라"는 사고방식을 반영합니다.

여섯째, 엔비디아 칩에 대한 수요가 매우 강합니다.
엔비디아의 해시레이트 학습 분야에서 최고 수준이며, 모든 연구 개발의 진전은 해시레이트 부족에 의해 제한됩니다. 공급이 충분하다면 당연히 모두 구매할 것입니다. 화웨이 제품을 포함한 다른 가속기 도 추론 성능에서 긍정적인 평가를 받고 있으며, 수많은 연구실에서 화웨이 칩을 사용하고 있습니다.

이러한 핵심 사항들은 매우 다른 AI 생태계를 보여줍니다. 서구 연구소의 운영 방식을 중국 연구소에 성급하게 적용하는 것은 종종 오분류로 이어집니다. 중요한 질문은 이러한 서로 다른 생태계가 실질적으로 다른 유형의 모델을 만들어낼 것인지, 아니면 중국 모델이 항상 3~9개월 전의 최첨단 미국 모델과 유사하게 해석될 것인지입니다.

결론: 지구 균형

이번 여행 전에는 중국에 대해 아는 것이 거의 없었습니다. 여행을 마치고 돌아올 때, 저는 이제 막 배우기 시작한 기분이었습니다. 중국은 규칙이나 조리법으로 설명할 수 있는 곳이 아니라, 매우 독특한 역동성과 화학 작용이 있는 곳입니다. 그 문화는 매우 오래되고 심오하며, 동시에 자국에서 개발된 기술과도 완벽하게 융합되어 있습니다. 저는 아직도 배울 것이 너무나 많습니다.

현재 미국 권력 구조의 많은 부분은 중국에 대한 기존의 관점을 의사 결정 과정에서 중요한 심리적 도구로 활용하고 있습니다. 중국의 거의 모든 주요 AI 연구소와 공식적 또는 비공식적으로 직접 만나 교류한 결과, 중국은 서구의 의사 결정 방식으로는 모델링하기 어려운 많은 특성과 본능을 가지고 있다는 것을 알게 되었습니다.

내가 이 연구소들에게 왜 가장 강력한 모델을 공개하는지 직접 물어본다 해도, "소유 의식"과 "생태계에 대한 진정한 지원" 사이의 연관성을 완전히 파악하기는 여전히 어렵다.

이곳 연구소들은 매우 실용적입니다. 반드시 오픈소스를 맹목적으로 옹호하는 것은 아니며, 개발하는 모든 모델을 공개하는 것도 아닙니다. 하지만 개발자들을 지원하고 생태계를 육성하며, 개방성을 통해 자신들이 개발한 모델을 더욱 심층적으로 이해하려는 깊은 의지를 가지고 있습니다.

거의 모든 주요 중국 IT 기업들이 자체적인 범용 빅 언어 모델을 구축하고 있습니다. 메이투안과 같은 플랫폼 서비스 기업이나 샤오미와 같은 대형 소비재 IT 기업들이 개방형 가중치 모델을 출시한 것을 볼 수 있습니다. 반면, 미국 기업들은 일반적으로 서비스를 구매하는 데 그칩니다.

이 회사들이 대규모 언어 모델을 구축하는 이유는 단순히 이슈 새로운 분야에서 이름을 알리기 위해서가 아니라, 자신만의 기술 스택을 통제하고 당대의 가장 중요한 기술을 개발하고자 하는 깊고 근본적인 열망 때문입니다. 노트북에서 눈을 들어 지평선 너머로 보이는 수많은 크레인들을 보면, 중국의 전반적인 건설 문화와 에너지가 고스란히 느껴집니다.

중국 연구자들의 인간미, 매력, 그리고 진심 어린 따뜻함은 정말 감동적입니다. 개인적인 차원에서, 미국에서 흔히 접하는 냉혹한 지정학적 논쟁은 그들에게서 전혀 찾아볼 수 없습니다. 세상에는 이런 소소한 긍정성이 더 많아져야 합니다. AI 커뮤니티의 일원으로서, 저는 이제 국적을 중심으로 구성원들과 그룹 간에 벌어지는 갈등이 더욱 우려스럽습니다.

인공지능 기술 스택의 모든 분야에서 미국 연구소들이 명실상부한 선두주자가 되기를 바라지 않는다고 말하면 거짓말일 것입니다. 특히 제가 대량 시간을 투자해 온 오픈 모델 분야에서는 미국 연구소가 되는 것이 제 솔직한 바람입니다.

동시에, 저는 개방형 생태계 자체가 전 세계적으로 번성하기를 바랍니다. 왜냐하면 그러한 생태계는 세상에 더 안전하고, 더 접근하기 쉽고, 더 유용한 인공지능을 만들어낼 수 있기 때문입니다. 이제 관건은 미국 연구소들이 이러한 선도적 위치를 차지하기 위해 행동에 나설 것인가 하는 점입니다.

이 글을 마무리하는 시점에서, 이번 행정명령이 개방형 모델에 미칠 영향에 대한 소문이 더욱 확산되고 있습니다. 이는 미국의 리더십과 글로벌 생태계 간의 시너지 효과를 더욱 복잡하게 만들 수 있으며, 제게는 전혀 안심을 주지 못합니다.

Lunar Dark Side, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, AntLight, 01.ai 등 여러 기관에서 만나 뵐 기회를 주신 모든 분들께 감사드립니다. 모두 열정적으로 시간을 내어 주셔서 정말 감사했습니다. 앞으로 제 아이디어가 구체화됨에 따라 중국에 대한 제 생각과 더불어 폭넓은 문화적 측면과 AI 분야 자체에 대한 제 의견을 계속해서 공유하겠습니다.

이러한 지식은 최첨단 인공지능 개발의 전개 과정과 직접적인 관련이 있을 것이 분명합니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트