마이크로소프트, 1비트 AI 모델 개발

이 기사는 기계로 번역되었습니다
원문 표시

마이크로소프트의 새로운 비트넷(BitNet) b1.58 2B4T 모델은 2억 개의 매개변수로 동일 크기의 다른 모델보다 훨씬 뛰어난 성능을 달성하고, 동시에 메모리 사용량도상당히 줄였습니다.

마이크로소프트의 연구원들이 지금까지 가장 큰 1비트 AI 모델(일명 "비트넷")을 성공적으로 개발했습니다.

BitNet b1.58 2B4T 모델은 MIT 라이선로 시되었으며 일반 CPU�, Apple M2 칩을 포함한 다양한 환경에서 실행할 수 있습니다.

경량 AI를 위한 혁명

비트넷은 경량 하드웨어에서 실행할 수 있도록 압축된 AI 모델입니다. 현재 표준 모델들이 가개중치를 현 위은 트를 사용하는하 , 비트넷은 가중치를 -1, 0, 1의 세 가지 값으로 양자화합니다. 이를 통해 비트넷은 대부분의 현재보다 메모리와 컴퓨팅 자원을 상당히 절약할 수 있습니다.

BitNet b1.58 2B4T는 마이크로소프트의 첫 20억 개 매개변수를 가진 비트넷 모모델입니다. 이 모델은 4천억 토큰 규모의 방대한 데이터셋(약만 권의책에 해로 훈련되었으며,로소프트에 따르면 동일 의존 모델 보다 우수합니 니>

성능 테스트에서 Bitb1.58 2B4T는 메타의 Llama 3.2 1B, 구글의 Gemma 3 1B, 알리바바의 Qwen 2.5 1.5B를 GSM8K(초등학교 수준 문제셋)와 (리계 추론 능력 와 스같은 주요 벤치마크에서 능가했습니다.

특히 인상한 점은 BitNet b1.58 2B4T의 속도로, 일부 경우 동일 크기의 모타델 두 배 빠르며 동시에 경쟁 모 비메모리 아주 적 합습니다.

그러나 최적의 성능을 얻기 위해서는 마이크로소프트의 bitnet.cpp 프레임워크를 사용해야 하며, 현재 특정 하드웨어에서만 호환� 주목할 는점은 이 목록에 현재 AI 인프라를 지배하고 있는 GPU 가가 포는 것입니다.

비트넷은 제한된 자원을 가진 장치에 매우 유망해 보이지만, 호환성 문제는 여전히 큰 장� 가까운래 계속 존재할 것 것입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트