포어사이트뉴스(Foresight News) 소식에 따르면, 탈중앙화 AI 프로토콜 Prime Intellect가 추론 스택 미리보기를 발표했습니다. 추론 스택은 자기회귀 디코딩의 계산 활용률 과제, KV 캐시 메모리 병목 현상 및 공용 네트워크 지연 문제를 해결하는 것을 목표로 합니다. 이는 파이프라인 병렬 설계를 채택하여 높은 계산 밀도와 비동기 실행을 지원합니다. 동시에 Prime Intellect는 세 가지 오픈소스 코드 라이브러리를 발표했습니다: PRIME-IROH(피어 투 피어 통신 백엔드), PRIME-VLLM(공용 네트워크 파이프라인 병렬을 지원하는 vLLM 통합) 및 PRIME-PIPELINE(연구 샌드박스). 사용자는 3090/4090 등의 GPU를 활용하여 대규모 모델을 실행할 수 있습니다.
Prime Intellect가 탈중앙화 형 추론 스택 미리보기를 출시했습니다.
이 기사는 기계로 번역되었습니다
원문 표시
출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유




