Chuyện gì xảy ra trong thế giới AI tuần này | GPT-5 dự kiến ​​tung ra vào giữa năm; Google Gemini có thể vào iPhone; Microsoft mua lại Inflection AI “kiểu việc làm”

avatar
36kr
03-27
Bài viết này được dịch máy
Xem bản gốc

Văn bản Chen Sida |

Biên tập|Anita Tang

Tổng quan hàng tuần

Các sự kiện lớn đang diễn ra trong tuần này. Điểm nóng nhất chắc chắn là hội nghị NVIDIA GTC. NVIDIA chính thức ra mắt chip AI thế hệ mới “Blackwell B200” , được nhà sáng lập Huang Renxun gọi là sản phẩm thành công nhất trong lịch sử.

Những người chơi khác cũng không nhàn rỗi. Công ty khởi nghiệp AI xAI của Musk đã mã nguồn mở mô hình lớn Grok-1 , có 341 tỷ thông số. Mặt khác, OpenAI cuối cùng cũng có tin mới và có tin đồn rằng họ sẽ ra mắt GPT-5 vào giữa năm nay. Tin tức quan trọng hơn đến từ những người chơi phần cứng - Apple đang tích cực đàm phán với Google và OpenAI, với hy vọng giới thiệu những mẫu iPhone cỡ lớn.

Những con kỳ lân AI ở Thung lũng Silicon khá hỗn loạn. Người sáng lập Inflection AI và đồng sáng lập Google DeepMind sắp gia nhập trại AI của Microsoft. Sự ổn định của AI vẫn đang trong tình trạng hỗn loạn . Sau sự từ chức tập thể của đội ngũ kỹ thuật cốt lõi, tuần này Giám đốc điều hành cũng thông báo rằng ông đã rời đi.

Sân khấu trong nước tuần này thuộc về “Long Context”. Dark Side of the Moon chính thức thông báo rằng trợ lý thông minh Kimi của họ đã hỗ trợ 2 triệu từ ngữ cảnh không mất dữ liệu cực dài , điều này đã thu hút sự chú ý rộng rãi trên thị trường. Sau đó, Alibaba Tongyi Qianwen đã cập nhật nó, mở ra quá trình xử lý tài liệu dài 10 triệu từ. chức năng miễn phí, Baidu và 360 Intelligence cũng liên tiếp thông báo rằng khả năng xử lý văn bản dài từ 2 triệu đến 5 triệu từ sẽ sớm ra mắt. Cuối tuần qua, công ty khởi nghiệp mô hình lớn Step Star đã chính thức ra mắt và phát hành phiên bản xem trước của mô hình lớn ngôn ngữ MoE tham số nghìn tỷ Step-2.

Những điểm Key

  • OpenAI dự kiến ​​ra mắt GPT-5 vào giữa năm nay
  • Apple bàn hợp tác với Google và OpenAI, mẫu lớn có thể vào iPhone
  • Musk Grok-1 mã nguồn mở với 341 tỷ thông số
  • Xuất hiện trở lại Sora, Colossal-AI phát hành dự án mã nguồn mở"Open-Sora"
  • Stability.ai phát hành Video ổn định 3D
  • Trợ lý thông minh Kimi hỗ trợ 2 triệu từ ngữ cảnh và trở nên phổ biến trong cộng đồng
  • Nhà sản xuất mô hình lớn "Step Star" ra mắt và đào tạo một mô hình lớn với hàng nghìn tỷ tham số
  • Nvidia ra mắt chip AI mạnh nhất
  • Microsoft mua lại "phong cách làm việc" AI của Inflection, người sáng lập gia nhập Microsoft
  • Đội ngũ cốt lõi AI ổn định sụp đổ, CEO từ chức
  • Apple bị Bộ Tư pháp Mỹ kiện chống độc quyền
  • Liên Hợp Quốc thông qua nghị quyết toàn cầu đầu tiên về AI
  • Nvidia xem xét mua lại công ty khởi nghiệp AI Run:ai của Israel
  • Ả Rập Saudi có kế hoạch thành lập quỹ 40 tỷ USD để đầu tư vào AI
  • Astera Labs "Little Nvidia" IPO, huy động được 600 triệu USD
  • Suno chính thức ra mắt mẫu máy phát nhạc V3
  • Nghiên cứu mới của Adobe: Tạo hình ảnh từ bản phác thảo trong 0,11 giây

Dòng đầu tiên của mô hình lớn

OpenAI dự kiến ​​ra mắt GPT-5 vào giữa năm nay

Theo The Business Insider dẫn nguồn nặc danh, OpenAI đang có kế hoạch ra mắt GPT-5 vào giữa năm nay, dự kiến ​​là vào mùa hè. Ngoài ra, những người quen thuộc với vấn đề này còn tiết lộ rằng một số khách hàng doanh nghiệp đã trải nghiệm phiên bản trình diễn mô hình mới nhất và các cải tiến ChatGPT đi kèm. Một CEO từng trải nghiệm phiên bản GPT-5 đã đánh giá cao về hiệu năng của nó: “Nó hoạt động rất tốt và mang lại những cải tiến đáng kể”.

Apple bàn hợp tác với Google và OpenAI, mẫu lớn có thể vào iPhone

Theo báo cáo mới nhất từ ​​Bloomberg, Apple đang tích cực tham gia các cuộc đàm phán độ sâu với Google và OpenAI, nhằm mục đích tích hợp các mô hình ngôn ngữ quy mô lớn của hai công ty vào các chức năng trí tuệ nhân tạo mới của iPhone, tạo nền tảng vững chắc cho khung hệ thống iOS 18 trong tương lai. Thông báo chính thức dự kiến ​​​​sẽ không được đưa ra cho đến sau mùa hè này. Đồng thời, vào ngày 23 tháng 3, theo Wall Street Journal, Apple và Baidu đã tổ chức các cuộc đàm phán sơ bộ về việc sử dụng công nghệ AI của Baidu trong các thiết bị Trung Quốc của họ. Không rõ liệu Apple có hợp tác với các công ty AI khác của Trung Quốc hay không.

Musk Grok-1 mã nguồn mở với 341 tỷ thông số

Vào ngày 18 tháng 3, xAI, một công ty khởi nghiệp về AI thuộc sở hữu của Musk, đã thông báo rằng mô hình lớn Grok-1 mà hãng phát triển đã chính thức mở cửa cho mã nguồn mở . Người dùng có thể tải trực tiếp tỷ trọng mô hình cơ bản và thông tin kiến ​​trúc mạng thông qua Chuỗi nam châm. Grok-1 là mô hình chuyên gia kết hợp tham số (MOE) trị giá 314 tỷ tham số được xAI đào tạo từ đầu vào tháng 10 năm 2023 bằng cách sử dụng hệ thống đào tạo tùy chỉnh dựa trên JAX và Rust, vượt xa mô hình GPT của OpenAI. Tuy nhiên, phiên bản mã nguồn mở lần là mô hình cơ bản ban đầu của giai đoạn tiền đào tạo Grok-1 và chưa được tinh chỉnh cho bất kỳ ứng dụng cụ thể nào (chẳng hạn như đối thoại).

Xuất hiện trở lại Sora, Colossal-AI phát hành dự án mã nguồn mở Open-Sora

Sau khi ra mắt quy trình tái tạo suy luận đào tạo Sora, giúp giảm chi phí 46%, đội ngũ Colossal-AI đã mã nguồn mở hoàn toàn cho mô hình tạo video kiến ​​trúc giống Sora đầu tiên trên thế giới "Open-Sora 1.0", bao gồm toàn bộ quá trình đào tạo quy trình, bao gồm xử lý dữ liệu, tất cả các chi tiết đào tạo và tỷ trọng mô hình, đồng thời hợp tác với những người đam mê AI trên toàn cầu để thúc đẩy kỷ nguyên mới của việc tạo video.

Ảnh chụp nhanh đô thị nhộn nhịp do Open-Sora 1.0 tạo ra

Stability.ai phát hành Video ổn định 3D

Stability.ai phát hành Stable Video 3D, tận dụng tính nhất quán của nhiều chế độ xem để tối ưu hóa Trường bức xạ thần kinh 3D (NeRF) và biểu diễn lưới nhằm cải thiện chất lượng của các lưới 3D được tạo trực tiếp từ các chế độ xem mới, mang lại sự mạch lạc từ bất kỳ chế độ xem góc nhất định nào và có khả năng khái quát hóa thành thạo kỹ năng. Chất lượng Video 3D ổn định và nhiều chế độ xem được cải thiện đáng kể, vượt trội so với các lựa chọn thay thế mã nguồn mở khác như Zero 123XL đã phát hành trước đó.

Hiệu ứng tạo video 3D ổn định

"Trợ lý thông minh Kimi" hỗ trợ 2 triệu từ ngữ cảnh và trở nên phổ biến trong vòng kết nối

Vào ngày 18 tháng 3, nhà sản xuất mô hình lớn "Dark Side of the Moon" đã chính thức thông báo trợ lý thông minh Kimi của họ đã hỗ trợ 2 triệu từ ngữ cảnh siêu dài lossless và sẽ bắt đầu thử nghiệm sản phẩm nội bộ kể từ bây giờ. Chiều ngày 21, APP và các chương trình nhỏ của Kimi, một ứng dụng mô hình lớn thuộc sở hữu của Dark Side of the Moon, không thể sử dụng bình thường. The Dark Side of the Moon cho biết họ quan sát thấy lưu lượng truy cập hệ thống của Kimi tiếp tục tăng bất thường, vượt xa kế hoạch tài nguyên dự kiến. Được xúc tác bởi sự nổi tiếng của Kimi, giá cổ phiếu của Huace Film and Television, Zhangyue Technology, Zhongguang Tianze và các cổ phiếu khái niệm liên quan đến Foxit Software tiếp tục tăng.

Nhà sản xuất mô hình lớn "Step Star" ra mắt và đào tạo một mô hình lớn với hàng nghìn tỷ thông số

Vào ngày 23 tháng 3, tại Hội nghị tiên phong dành cho nhà phát triển toàn cầu năm 2024, công ty khởi nghiệp mô hình lớn nói chung Step Star đã chính thức ra mắt. Mô hình lớn đa phương thức Step-1V 100 tỷ tham số do Step Star phát triển được xếp hạng đầu tiên trong danh sách đánh giá mô hình đa phương thức của "OpenCompass", nền tảng đánh giá mô hình quy mô lớn có thẩm quyền của Trung Quốc. Tiến sĩ Jiang Daxin, người sáng lập và Giám đốc điều hành của Stepstar, đã chính thức phát hành phiên bản xem trước của mô hình ngôn ngữ lớn tham số Step-2 nghìn tỷ tại hội nghị. Mô hình này áp dụng kiến ​​trúc MoE, tập trung vào việc khám phá trí thông minh độ sâu và cung cấp giao diện API cho. một số đối tác để thử.

Sự kiện lớn

NVIDIA ra mắt chip AI thế hệ mới

Từ ngày 18 đến ngày 21 tháng 3, NVIDIA đã tổ chức hội nghị GTC tại San Jose, Mỹ để ra mắt kiến ​​trúc chip thế hệ tiếp theo Blackwell. Nền tảng GPU này cũng là sản phẩm thành công nhất trong lịch sử của NVIDIA theo Huang Renxun. Theo báo cáo, GPU Blackwell được đặt theo tên của nhà toán học David Harold Blackwell và cũng sử dụng kiến ​​trúc Hopper do Nvidia ra mắt trước đó. GPU Blackwell chứa 208 tỷ bóng bán dẫn và có thể hỗ trợ các mô hình AI với thông số lên tới 10 nghìn tỷ.

Microsoft mua lại "phong cách làm việc" AI của Inflection, người sáng lập gia nhập Microsoft

Vào ngày 19 tháng 3, Microsoft đã chính thức thông báo Mustafa Suleyman và Karén Simonyan của công ty khởi nghiệp trí tuệ nhân tạo Inflection AI cùng hầu hết các nhân viên khác sẽ gia nhập Microsoft AI để tập trung vào nghiên cứu và sản phẩm AI hướng tới người tiêu dùng. Vào ngày 22 tháng 3, theo những người quen thuộc với vấn đề này, Microsoft đã đồng ý trả khoảng 650 triệu USD cho Inflection AI, chủ yếu dưới dạng thỏa thuận cấp phép, để các mô hình của Inflection AI có thể được bán trên các dịch vụ đám mây Azure. Điều này có nghĩa là dưới danh nghĩa thuê các thành viên đội ngũ cốt lõi cộng với "phí cấp phép mô hình", Microsoft về cơ bản chỉ hoàn thành việc định giá Inflection, vốn từng đứng thứ ba trong bảng xếp hạng AI (lần OpenAI và Anthropic của các công ty).

Đội ngũ cốt lõi AI ổn định sụp đổ, CEO từ chức

Vào ngày 23 tháng 3, giờ địa phương, công ty kỳ lân AI Stability AI cho biết họ đã thông báo về việc CEO công ty Emad Mostaque từ chức. Emad Mostaque tuyên bố trên nền tảng truyền thông xã hội X rằng ông sẽ tập trung phi tập trung(Decentralized AI) sau khi từ chức. Đầu tuần này, đội ngũ R&D cốt lõi đã từ chức hàng loạt. Stability AI có tiếng với việc phát triển Stable Diffusion, một mô hình lớn về đồ thị Vincentian. Nó được thành lập vào cuối năm 2020 và được định giá 1 tỷ USD vào năm 2022.

Apple bị Bộ Tư pháp Hoa Kỳ kiện chống độc quyền, làm bốc hơi 110 tỷ USD giá trị vốn hóa thị trường

Theo Reuters, ngày 21/3 theo giờ địa phương, Bộ trưởng Tư pháp Mỹ Merrick Garland cho biết trong cuộc họp báo ngày hôm đó rằng Bộ Tư pháp Mỹ và tổng chưởng lý của hơn chục bang đã đệ đơn kiện chống độc quyền chống lại Apple, cáo buộc Apple vi phạm pháp luật. Công ty đã sử dụng quyền kiểm soát phần cứng và phần mềm của sản phẩm Apple để độc quyền thị trường điện thoại di động, gây bất lợi cho người tiêu dùng, nhà phát triển và các công ty đối thủ. Bị ảnh hưởng bởi tin tức này, giá cổ phiếu của Apple đã giảm 4,09% vào ngày hôm đó, giá trị vốn hóa thị trường bốc hơi hơn 110 tỷ đô la Mỹ (khoảng 800 tỷ nhân dân tệ) và tổng giá trị vốn hóa thị trường của nó giảm xuống còn 2,65 nghìn tỷ đô la Mỹ.

Liên Hợp Quốc thông qua nghị quyết toàn cầu đầu tiên về AI

Ngày 21/3 theo giờ địa phương, Đại hội đồng Liên hợp quốc đã bỏ phiếu thông qua dự thảo nghị quyết đầu tiên về trí tuệ nhân tạo (AI) để đảm bảo rằng công nghệ mới này có thể mang lại lợi ích cho tất cả các quốc gia, tôn trọng nhân quyền và là công nghệ "an toàn, đáng tin cậy". Được biết, Hoa Kỳ là nhà tài trợ cho dự thảo nghị quyết này và Trung Quốc đã tham gia đồng Đề án.

Động lực tài chính

Nvidia xem xét mua lại công ty khởi nghiệp AI Run:ai của Israel

Theo Nhà kinh tế Israel, vào ngày 17 tháng 3, có thông tin tiết lộ rằng Nvidia đang đàm phán để mua lại Run: ai, nền tảng cơ sở hạ tầng trí tuệ nhân tạo của Israel, với giá trị giao dịch có thể lên tới 1 tỷ USD. Run:ai được thành lập vào năm 2018 bởi Giám đốc điều hành Omri Geller và CTO Tiến sĩ Ronen Dar. Vào tháng 3 năm 2022, Run:ai đã huy động được 75 triệu USD trong Series C, dẫn đầu bởi Tiger Global Management và Insight Partners.

Ả Rập Saudi có kế hoạch thành lập quỹ 40 tỷ USD để đầu tư vào AI

Chính phủ Ả Rập Saudi có kế hoạch tạo ra một quỹ trị giá khoảng 40 tỷ USD để đầu tư vào công nghệ trí tuệ nhân tạo (AI), theo ba người quen thuộc với kế hoạch này. Nếu thành lập thành công, quỹ này sẽ đưa Saudi Arabia trở thành nhà đầu tư AI lớn nhất thế giới. Trong những tuần gần đây, đại diện Quỹ đầu tư công (PIF) của Ả Rập Xê Út đã thảo luận về mối quan hệ hợp tác tiềm năng với các tổ chức tài chính như công ty đầu tư mạo hiểm thành công nhất Thung lũng Silicon Andreessen Horowitz(a16z), bao gồm cả cách thức hoạt động của quỹ và vai trò của a16z, mọi người quen thuộc với vấn đề này cho biết.

Astera Labs "Little Nvidia" IPO, huy động được 600 triệu USD

Vào ngày 20 tháng 3, nhà sản xuất chip Astera Labs niêm yết trên sàn Nasdaq ở Hoa Kỳ, huy động được 600 triệu USD. Tận dụng lợi thế của AI, các ngân hàng đầu tư đã đóng gói Astera Labs thành khái niệm "Little Nvidia", khiến Astera Labs được thị trường săn đón rất nhiều. Một trong những sản phẩm cốt lõi của Astera Labs là chất bán dẫn kết nối dữ liệu và bộ nhớ, có thể cải thiện hiệu quả và tốc độ kết nối giữa phần mềm và phần cứng. Khách hàng của Astera Labs bao gồm những gã khổng lồ trong ngành như Amazon và Microsoft. Giá đóng cửa của nó vào ngày đầu tiên niêm yết là 62,03 USD, tăng 72,31% so với giá phát hành. Dựa trên giá đóng cửa, giá trị vốn hóa thị trường của công ty là khoảng 9,459 tỷ USD.

tiện ích mới

Suno chính thức ra mắt mẫu máy phát nhạc V3

Công ty khởi nghiệp thế hệ âm nhạc AI Suno đã chính thức phát hành Vincent Music Model v3, có thể tạo ra một bài hát hoàn chỉnh dài hai phút chỉ trong vài giây. Công cụ này có thể được truy cập thông qua trang web độc lập miễn phí hoặc thông qua Microsoft Copilot, một plug-in hỗ trợ Suno của bên thứ ba. Người dùng chỉ cần một dòng mô tả văn bản đơn giản là có thể tạo ra âm nhạc chất lượng chuyên nghiệp.

Giao diện Suno

Địa chỉ trải nghiệm: https://app.suno.ai

Nghiên cứu biên giới

Nghiên cứu mới của Adobe: Tạo hình ảnh từ bản phác thảo trong 0,11 giây

Vào ngày 19 tháng 3, đội ngũ từ CMU và Adobe đã xuất bản một bài báo trên arXiv, đề xuất một phương pháp suy luận hình ảnh. Theo báo cáo, phương pháp này giải quyết được hai hạn chế của các mô hình khuếch tán có điều kiện hiện có: suy đoán chậm do quá trình khử nhiễu lặp đi lặp lại và sự phụ thuộc vào việc tinh chỉnh mô hình trên dữ liệu được ghép nối. Để giải quyết những vấn đề này, các tác giả giới thiệu một phương pháp chung để điều chỉnh các mô hình khuếch tán một bước cho phù hợp với nhiệm vụ và lĩnh vực mới thông qua các mục tiêu học tập đối nghịch, không chỉ có thể khai thác kiến ​​thức nội bộ của các mô hình khuếch tán được đào tạo trước mà còn đạt được khả năng suy luận hiệu quả. Đối với hình ảnh 512*512, thời gian tạo là 0,29 giây trên A6000 và 0,11 giây trên A100.

Ảnh chụp màn hình của giấy

Địa chỉ giấy:

https://arxiv.org/pdf/2403.12036.pdf

Địa chỉ dùng thử:

https://huggingface.co/spaces/gparmar/img2img-turbo-sketch

👇🏻 Quét mã QR để tham gia "Nhóm trao đổi AI Zhiyong"👇🏻

Chào mừng bạn chú ý

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận