1. 이는 대규모 학습이 극적인 성능 향상을 가져온다면, 일리야가 "레시피(사전 학습)를 확장하는 단계에서 사고 과정(추론)을 확장하는 단계로 넘어가고 있다"고 예측한 것이 틀렸을 수도 있음을 의미합니다. 2. 다른 연구소에서 이를 복제하는 데 드는 비용을 고려하면, 현재는 일반 대중이 가장 발전된 모델에 접근할 수 있는 가장 좋은 기회일 가능성이 높습니다. 이 시점부터 비용은 K 곡선으로 분산되어 일반 소비자는 오픈 소스 수준의 모델을 사용하게 될 것입니다.
이 기사는 기계로 번역되었습니다
원문 표시

Andrew Curran
@AndrewCurran_
03-29
Three weeks ago there were rumors that one of the labs had completed its largest ever successful training run, and that the model that emerged from it performed far above both internal expectations and what people assumed the scaling laws would predict. At the time these were
Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유




