작성자|첸 스타
편집|윙 이 탕
한 주간의 리뷰
이번 주는 큰 행사들로 가득했습니다. 가장 큰 이벤트는 엔비디아의 GTC 컨퍼런스였습니다. 엔비디아는 창립자 젠슨 황이 자사 역사상 가장 성공적인 제품이라고 칭한 차세대 AI 칩인 블랙웰 B200을 공식 출시했습니다.
다른 플레이어들도 가만히 있지 않았습니다. 머스크의 AI 스타트업인 xAI는 3,410억 개의 파라미터를 가진 대형 모델 Grok-1을 오픈소스화했습니다. 한편, OpenAI는 드디어 새로운 소식을 전하며 올해 중반에 GPT-5를 출시할 것이라는 소문이 돌고 있습니다. 더 무거운 소식은 하드웨어 업체인 애플이 이 대형 모델을 아이폰에 도입하기 위해 구글 및 OpenAI와 적극적으로 협의하고 있다는 것입니다.
인플렉션 AI의 창업자이자 구글 딥마인드 공동 창업자가 마이크로소프트의 AI 캠프에 합류하는 등 실리콘밸리의 AI 유니콘들이 혼란을 겪고 있으며, 스테이블리티 AI는 핵심 기술팀이 집단으로 이탈한 후 CEO가 이번 주 퇴사한다고 발표하는 등 여전히 혼란스러운 상황입니다.
이번 주 국내 상황은 "긴 맥락"(긴 맥락)에 속합니다. 달의 어두운면은 공식적으로 키미 지능형 비서가 200만 단어의 초장문맥을 지원한다고 발표해 시장의 광범위한 관심을 끌었고, 알리통이첸첸 업데이트, 1000만 단어의 장문 처리 기능을 무료로 개방하고, 바이두, 360브레인도 200만~500만 단어의 장문 처리 기능을 곧 출시할 예정이라고 발표했습니다. 주말에는 일반 빅 모델 스타트업 기업인 스텝스타가 공식적으로 대중에게 데뷔하여 2조 개 매개변수 MoE 언어 빅 모델의 프리뷰 버전을 출시했습니다.
주요 포인트
- OpenAI는 올해 중반까지 GPT-5를 출시할 예정입니다.
- 애플, 구글, OpenAI와 협력 논의 중, 아이폰에 빅 모델 출시 예정
- 머스크 그로크-1 오픈 소스, 3410억 개의 매개변수 제공
- Colossal-AI, 소라를 복제하는 오픈소스 프로젝트 '오픈소라' 출시
- Stability.ai, 안정적인 비디오 3D 출시
- 200만 단어의 문맥을 지원하는 지능형 비서 '키미'의 인기가 폭발적으로 증가하고 있습니다.
- 대형 모델 제작자 "Stability.ai" 데뷔, 대형 모델을 위한 수조 개의 파라미터 학습 완료
- 엔비디아, 가장 강력한 AI 칩 출시
- Microsoft의 '고용을 위한' 인플렉션 AI 인수, 창업자 Microsoft 합류
- Stability AI의 핵심 팀 충돌, CEO 사임
- 애플, 미국 법무부로부터 반독점 소송 당하다
- 유엔, 첫 글로벌 AI 결의안 채택
- 엔비디아, 이스라엘 AI 스타트업 런:ai 인수 검토 중
- 사우디 아라비아, AI에 투자하기 위해 400 억 달러 기금 계획
- '리틀 엔비디아' 아스테라 랩스, 상장, 6억 달러 투자 유치
- Suno, V3 음악 생성 모델 공식 출시
- Adobe의 새로운 연구 : 스케치에서 이미지를 생성하는 데 0.11 초
대형 모델의 첫 번째 라인
OpenAI, 연내 GPT-5 출시 예정
비즈니스 인사이더는 이 문제에 정통한 익명의 소식통을 인용해 OpenAI가 올해 중반으로 예상되는 여름에 GPT-5의 출시를 준비할 계획이라고 보도했습니다. 또한 일부 기업 고객들은 이미 최신 모델의 데모와 그에 따른 ChatGPT 개선 사항을 미리 체험해 볼 수 있었다고 이 소식통은 전했습니다. GPT-5 버전을 경험한 한 CEO는 "성능이 매우 우수하고 상당한 개선이 이루어졌다"며 그 성능을 높이 평가했습니다.
애플, 구글, OpenAI와 협력 논의, 아이폰에 대형 모델 출시 가능성 시사
블룸버그의 새로운 보고서에 따르면, 애플은 구글 및 OpenAI와 활발하고 심도 있는 논의를 진행 중이며, 두 회사의 대규모 생성 언어 모델을 아이폰의 새로운 AI 기능에 통합하여 향후 iOS 18 시스템을 위한 강력한 기본 프레임워크를 마련하는 것을 목표로 하고 있습니다. 공식적인 발표는 올여름 이후에나 가능할 것으로 예상됩니다. 한편, 3월 23일 월스트리트 저널에 따르면 애플은 바이두와 중국 기기에서 자사의 생성 AI 기술을 사용하는 것에 대해 예비 협의를 진행했습니다. 애플이 다른 중국 제너레이티브 AI 회사와도 협력하고 있는지는 확실하지 않습니다.
머스크 그로크-1 오픈소스, 참여자 수 341억 명 돌파
3월 18일, 머스크의 AI 스타트업 xAI는 자사가 개발한 그랜드 모델인 Grok-1이 공식 오픈소스로 공개되어 사용자가 마그네틱 링크를 통해 기본 모델 가중치와 네트워크 아키텍처 정보를 직접 다운로드할 수 있다고 발표했습니다. grok-1은 2023년 10월 xAI가 JAX와 Rust 기반의 맞춤형 훈련 스택을 사용하여 처음부터 훈련한 3,140억 개의 파라미터 하이브리드입니다. 전문가(MOE) 모델에 기반한 맞춤형 트레이닝 스택을 사용하여 처음부터 학습된 하이브리드 모델로서 OpenAI의 GPT 모델을 훨씬 능가합니다. 그러나 이 오픈 소스 버전은 Grok-1의 사전 학습 단계의 원래 기본 모델이며, 특정 애플리케이션(예: 대화)에 맞게 미세 조정되지 않았습니다.
소라를 모방한 Colossal-AI, 오픈 소스 프로젝트인 Open-Sora 출시
46%의 직접적인 비용 절감으로 소라 훈련 추론 재현 프로세스를 출시한 데 이어, Colossal-AI 팀은 데이터 처리, 모든 훈련 세부 사항 및 모델 가중치를 포함한 전체 훈련 과정을 포괄하는 세계 최초의 소라 유사 아키텍처 비디오 생성 모델인 'Open-Sora 1.0'을 완전히 오픈소스화하여 다음과 같은 사람들과 손을 맞잡았습니다. 전 세계 AI 전문가들과 손을 잡고 새로운 동영상 제작 시대를 열었습니다.
Open-Sora 1.0은 분주한 도시의 한 단면을 보여줍니다.
Stability.ai, 안정적인 비디오 3D 출시
Stability.ai는 멀티뷰 일관성을 활용하여 3D NeRF(신경 방사 필드)와 메시 표현을 최적화하여 새로운 뷰에서 직접 생성된 3D 메시의 품질을 개선하고 능숙한 일반화를 통해 어떤 각도에서도 일관된 뷰를 제공하는 Stable Video 3D를 출시합니다. Zero 123XL과 같은 이전에 출시된 다른 오픈 소스 대안보다 개선되고 성능이 뛰어납니다.
안정적인 비디오 3D 생성 결과
'키미 지능형 어시스턴트', 문맥에서 200만 단어 지원, 아웃오브더루프 폭발적 증가
지난 18일 다크사이드오브더문은 키미 지능형 어시스턴트가 200만 단어의 초대형 비파괴 문맥을 지원한다고 공식 발표하고 이날부터 제품 내부 테스트를 시작했는데, 21일 오후 키미 앱과 다크사이드오브더문의 대규모 모델 애플리케이션 애플릿이 정상적으로 사용할 수 없는 현상이 발생했습니다. 다크사이드오브더문은 키미의 시스템 트래픽이 예상했던 리소스 계획을 훨씬 초과하는 비정상적인 증가세가 지속되는 것을 확인했다고 밝혔습니다. 키미의 열기에 힘입어 화제 영화 및 텔레비전, 팜리더 테크놀로지, 중광천지, 폭싯 소프트웨어와 관련된 콘셉트 주식의 주가는 계속 상승했습니다.
대형 모델 제작사 '스텝스타' 데뷔, 수조 개의 파라미터 대형 모델 훈련 완료
2024년 3월 23일, 글로벌 개발자 파이오니어 컨퍼런스에서 일반 대형 모델 스타트업 스텝스타가 공식적으로 대중에게 데뷔했습니다. 스텝스타가 개발한 1단계 1,000억 개 파라미터 복합 모델은 중국의 권위 있는 대규모 모델 평가 플랫폼인 '시난(西南)'의 복합 모델 평가 목록에서 1위에 올랐습니다(오픈컴파스). Step-Star의 설립자이자 CEO인 장다신 박사는 MoE 아키텍처를 채택하고 심층 지능 탐색에 중점을 둔 2단계 2조 개 매개변수 매크로 언어 모델의 프리뷰 버전을 공식적으로 출시하고 일부 파트너가 사용해 볼 수 있는 API 인터페이스를 제공했습니다.
주요 이벤트
NVIDIA, 차세대 AI 칩 출시
3월 18일부터 21일까지 미국 산호세에서 열린 GTC 컨퍼런스에서 엔비디아는 차세대 칩 아키텍처 블랙웰을 발표하고, 젠슨 황의 말에 따르면 엔비디아 역사상 가장 성공적인 제품이라고도 불리는 GPU 플랫폼인 블랙웰을 공개했습니다. 소개에 따르면, 수학자 데이비드 해롤드 블랙웰의 이름을 딴 블랙웰 GPU는 이전에 엔비디아가 출시한 호퍼 아키텍처와 동일하며, 블랙웰 GPU는 2080억 개의 트랜지스터를 포함하고 있으며 최대 10조 개의 AI 모델 파라미터를 지원할 수 있습니다.
Microsoft의 인플렉션 AI '고용' 인수, 창업자가 Microsoft에 합류합니다.
3월 19일, Microsoft는 AI 스타트업 Inflection AI의 무스타파 술레이만과 카렌 시모니안이 다른 직원들과 함께 소비자 대상 AI 제품 및 연구에 집중하기 위해 Microsoft AI에 합류한다고 공식 발표했습니다.3월 22일, 이 문제를 잘 아는 소식통에 따르면 Microsoft는 Inflection AI에 약 650만 달러를 지불하기로 합의했다고 합니다. 약 6억 5,000만 달러는 대부분 Azure 클라우드 서비스에서 Inflection AI의 모델을 판매할 수 있는 라이선스 계약의 형태입니다. 즉, 핵심 팀원 고용과 '모델 라이선스 비용'이라는 명목으로 Microsoft는 한때 AI 차트에서 OpenAI와 Anthropic에 이어 3위였던 Inflection의 인수를 사실상 완료한 것에 불과합니다.
안정성 AI 핵심팀 돌발 사고, CEO 사임
현지 시간으로 3월 23일, 유니콘 AI 기업인 Stability AI는 소셜 미디어 플랫폼 X를 통해 탈중앙화 AI를 연구하기 위해 떠난다고 밝힌 에마드 모스타크 CEO가 사임을 발표했다고 밝혔습니다. 이번 주 초에 핵심 R&D 팀이 일괄 사임했으며, 빈센느 그래픽 매크로 모델인 스테이블 디퓨전 개발로 유명한 스테이블리티 AI는 2020년 말에 설립되어 한때 2022년 10억 달러의 가치를 평가받았습니다.
미국 법무부 반독점 소송에 따른 Apple의 시장 가치 1,100억 달러 증발
로이터 통신은 3월 21일(현지시간) 메릭 갈랜드 미국 법무장관이 같은 날 기자회견에서 미국 법무부와 12개 이상의 주 법무장관이 애플이 애플 제품의 하드웨어와 소프트웨어에 대한 통제권을 이용해 휴대폰 시장을 독점해 소비자, 개발자 및 경쟁사의 이익을 해쳤다며 애플을 상대로 반독점 소송을 제기했다고 밝혔다고 보도했습니다. 이 소식으로 애플의 주가는 이날 4.09% 급락해 시장 가치 1,100억 달러(약 800억 루피) 이상이 증발했으며, 총 시장 가치는 2조 6,500억 달러로 다시 하락했습니다.
유엔, 첫 글로벌 AI 결의안 채택
3월 21일(현지 시간), 유엔 총회는 새로운 기술이 모든 국가에 혜택을 주고 인권을 존중하며 "안전하고 안전하며 신뢰할 수 있는" 인공지능(AI)을 보장하기 위한 첫 번째 결의안 초안을 채택하기로 의결했습니다. 미국은 결의안 초안의 후원국이며 중국이 공동 후원하는 것으로 알려져 있습니다.
펀딩 뉴스
NVIDIA, 이스라엘 AI 스타트업 Run:ai 인수 고려 중
3월 17일 이스라엘 이코노미스트는 NVIDIA가 최대 10억 달러의 가치가 있는 이스라엘 AI 인프라 플랫폼 Run:ai를 인수하기 위한 협상을 진행 중이라고 보도했습니다. Run:ai는 2018년 CEO Omri Geller와 CTO Ronen Dar 박사가 설립한 회사입니다. 2022년 3월, Run:ai는 타이거 글로벌 매니지먼트와 인사이트 파트너스가 주도한 시리즈 C 라운드에서 7,500만 달러를 조달했습니다.
사우디 아라비아, AI 투자를 위한 400억 달러 규모의 펀드 조성 계획
사우디아라비아 정부가 인공지능(AI) 기술에 투자하기 위해 약 400억 달러 규모의 펀드를 조성할 계획이라고 뉴욕타임스가 계획에 대해 잘 아는 3명의 관계자를 인용해 보도했습니다. 이 펀드가 성공적으로 조성되면 사우디아라비아는 세계 최대의 AI 투자국이 될 것입니다. 최근 몇 주 동안 사우디 공공투자펀드(PIF) 대표들은 실리콘밸리에서 가장 성공적인 벤처 캐피털 회사인 안드레센 호로위츠(a16z)와 같은 금융 기관과 펀드의 운영 방식과 역할 등을 주제로 잠재적 파트너십을 논의했다고 이 문제에 정통한 사람들이 말했다.
'리틀 엔비디아' 아스테라 랩스, 상장, 6억 달러 조달
3월 20일, 칩 제조업체인 Astera Labs가 나스닥에 상장하여 6억 달러를 모금했습니다. 인공지능의 바람을 타고 투자은행들은 아스테라 랩스를 '작은 엔비디아'라는 콘셉트로 포장해 시장의 높은 관심을 받았습니다. 아스테라 랩스의 핵심 제품 중 하나인 데이터 및 메모리 연결 반도체는 하드웨어와 소프트웨어 간의 연결 효율과 속도를 효과적으로 향상시킬 수 있으며, 아마존과 마이크로소프트 같은 업계 대기업을 고객으로 두고 있습니다. 아마존, 마이크로소프트와 같은 업계 대기업을 고객사로 두고 있습니다. 거래 첫날 종가는 62.03달러로 공모가 대비 72.31% 상승했으며, 종가 기준 시가총액은 약 94억 5,900만 달러에 달했습니다.
새로운 가젯.
Suno, V3 음악 생성 모델 공식 출시
AI 음악 생성 스타트업인 Suno가 2분짜리 곡을 단 몇 초 만에 완성하는 빈센트 음악 생성 모델 v3를 공식 출시했습니다. 이 도구는 무료 독립형 웹사이트를 통해 액세스하거나 Suno의 타사 플러그인인 Microsoft Copilot을 활성화하여 사용할 수 있습니다. 사용자는 간단한 텍스트 설명만으로 전문가 수준의 음악을 만들 수 있습니다.
Suno 인터페이스
https://app.suno.ai 에서 체험해 보세요.
최첨단 연구
새로운 Adobe 연구: 스케치에서 이미지를 생성하는 데 0.11초 단축
3월 19일, CMU와 Adobe의 연구팀이 이미지 추론 방법을 제안하는 논문을 arXiv에 발표했습니다. 이 논문은 기존 조건부 확산 모델의 두 가지 한계, 즉 반복적인 노이즈 제거 프로세스로 인한 추론 속도 저하와 페어링된 데이터에 대한 모델 미세 조정에 의존하는 문제를 해결합니다. 이러한 문제를 해결하기 위해 저자는 적대적 학습 목표를 통해 단일 단계 확산 모델을 새로운 작업과 도메인에 적용하는 일반적인 접근 방식을 도입하여 사전 학습된 확산 모델의 내부 지식을 활용하면서도 효율적인 추론이 가능하도록 합니다. 512*512 이미지의 경우, 생성 시간은 A6000에서 0.29초, A100에서 0.11초입니다.
논문 스크린샷
논문 주소:
https://arxiv.org/pdf/2403.12036.pdf
평가판 주소:
https://huggingface.co/spaces/gparmar/img2img-turbo-sketch
👇🏻 扫码加入「智涌AI交流群」👇🏻
팔로우 환영




