중국텔레콤, 국내 칩에 1조개 매개변수 탑재한 AI 모델 훈련

avatar
AI News
10-10
이 기사는 기계로 번역되었습니다
원문 표시

중국의 국유 통신 대기업 중 하나인 차이나텔레콤은 국내에서 생산된 칩에 대해서만 교육하는 두 개의 LLM을 만들었습니다.

이번 획기적인 성과는 중국이 AI 기술에서 자립하고자 하는 지속적인 노력에 있어 중요한 진전을 나타냅니다. 특히, 미국이 경쟁업체의 첨단 반도체 접근을 제한하는 상황이 심화되는 상황에서 더욱 그렇습니다.

회사의 AI 연구소에 따르면, 모델 중 하나인 TeleChat2-115B와 이름이 없는 또 다른 모델은 수만 개의 중국산 칩에서 훈련되었습니다. 이 성과는 중국이 Nvidia 와 다른 외국 기업으로부터 고급 프로세서를 구매할 수 있는 능력을 제한한 더욱 엄격한 미국 수출 규정을 감안할 때 특히 주목할 만합니다. WeChat에서 공유한 성명에서 AI 연구소는 이 성과가 중국이 LLM을 독립적으로 훈련할 수 있는 역량을 보여주었으며 AI 기술에서 혁신과 자립의 새로운 시대를 알렸다고 주장했습니다.

이러한 모델의 규모는 놀랍습니다. China Telecom은 이름 없는 LLM에 1조 개의 매개변수가 있다고 밝혔습니다. AI 용어로 매개변수는 훈련 중에 모델이 학습하는 데 도움이 되는 변수입니다. 매개변수가 많을수록 AI는 더 복잡하고 강력해집니다.

중국 기업들은 해외에 있는 AI 분야의 글로벌 리더들과 보조를 맞추기 위해 노력하고 있습니다. 워싱턴이 A100과 H100과 같은 Nvidia의 최신 AI 칩에 대한 수출 제한을 가하면서 중국은 대안을 모색해야 했습니다. 그 결과, 중국 기업들은 서구 기술에 대한 의존도를 줄이기 위해 자체 프로세서를 개발했습니다. 예를 들어, TeleChat2-115B 모델은 약 1,000억 개의 매개변수를 가지고 있어 주류 플랫폼만큼 좋은 성능을 낼 수 있습니다.

China Telecom은 모델을 훈련하는 데 사용된 국내 설계 칩을 공급한 회사가 어디인지 구체적으로 밝히지 않았습니다. 그러나 이 페이지에서 이전에 논의했듯이 Huawei의 Ascend 칩은 국가의 AI 계획에서 핵심적인 역할을 합니다.

최근 몇 년 동안 미국의 처벌을 받은 Huawei도 인공지능 분야에서 노력을 기울이고 있습니다. 이 회사는 최근 최신 AI 프로세서인 Ascend 910C를 테스트하기 시작했으며, 국내 시장에서 잠재 고객이 기다리고 있습니다. 이전에 Nvidia 칩을 사용했던 대형 중국 서버 회사와 인터넷 거대 기업은 새로운 칩의 성능을 테스트하고 있는 것으로 보입니다. Nvidia 하드웨어에 대한 몇 안 되는 실행 가능한 대안 중 하나인 Huawei의 Ascend 프로세서는 외국 기술에 대한 의존도를 줄이는 중국의 전략의 핵심 구성 요소로 간주됩니다.

화웨이 외에도 China Telecom은 AI 프로세서를 전문으로 하는 중국 스타트업인 Cambricon과 같은 다른 국내 칩 제조업체와 협력하고 있습니다. 이러한 파트너십은 중국 기술 산업에서 AI 솔루션의 국내 생태계를 구축하려는 더 광범위한 경향을 반영하여 미국 수출 통제의 영향으로부터 국가를 더욱 보호합니다.

중국은 자체 AI 칩과 기술을 개발함으로써 외국산 하드웨어, 특히 엔비디아의 수요가 많고 따라서 비싼 GPU에 대한 의존도를 점차 줄이고 있습니다. 미국의 제재로 인해 중국 기업이 최신 엔비디아 하드웨어를 얻기 어려운 반면, 외국 칩에 대한 암시장이 생겨났습니다. 많은 중국 기업은 회색 시장에서 운영할 위험을 감수하기보다는 이전 세대 모델과 같은 저전력 대안을 구매하여 엔비디아의 공식 지원 및 서비스에 대한 액세스를 유지하는 것을 선호합니다.

중국의 성과는 AI와 반도체 기술에 대한 접근 방식에서 더 광범위한 전환을 보여주며, 점점 더 경쟁이 치열해지는 세계 경제와 미국의 보호무역 정책에 맞서 자립하고 회복력 있는 기업이라는 점을 강조합니다.

(사진: Mark Kuiper )

또한 참고하십시오: Huawei는 AI 경쟁에서 Apple보다 더 똑똑했을까?

업계 리더로부터 AI와 빅데이터에 대해 더 알아보고 싶으신가요? 캘리포니아 암스테르담과 런던에서 열리는 AI & Big Data Expo를 확인해 보세요. 이 포괄적인 이벤트는 Intelligent Automation Conference , BlockX , Digital Transformation Week , Cyber Security & Cloud Expo 를 포함한 다른 주요 이벤트와 함께 진행됩니다.

여기에서 TechForge가 제공하는 다른 기업 기술 이벤트와 웨비나를 확인해 보세요.

중국텔레콤, 국산 칩에 1조 개의 매개변수를 갖춘 AI 모델 훈련이라는 제목의 기사가 AI 뉴스 에 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트