Microsoft gây tiếng vang lớn về AI tối qua: GPT-4o lên đám mây, Nadella tỏ tình ngay tại chỗ với OpenAI và Altman tiết lộ mẫu mới

avatar
36kr
05-22
Bài viết này được dịch máy
Xem bản gốc

Chỉ sau một đêm, vũ trụ AI của Microsoft đã thành hình.

Sáng sớm hôm nay, tại hội nghị Microsoft Build 2024 thường niên, Giám đốc điều hành Microsoft Satya Nadella đã công bố hơn 50 bản cập nhật khả năng AI trong một hơi thở, bao gồm di chuyển đám mây GPT-4o, chip Cobalt tự phát triển, Copilot phiên bản đội ngũ, mô hình nhỏ SOTA và nhiều phiên bản khác các khía cạnh.

Là “bữa tiệc dành cho nhà phát triển” trong giới AI, buổi ra mắt hội nghị Microsoft Build lần chủ yếu có những điểm nổi bật cốt lõi sau:

1. Thông báo rằng GPT-4o thường có sẵn trên Azure AI và giới thiệu nhiều mô hình lớn từ các công ty như Cohere, Databricks, Meta, Mistral và cộng đồng mã nguồn mởHugging Face . chú ý đến các mô hình của bên thứ ba và các mô hình mã nguồn mở.

Thư viện Windows Copilot sẽ được ra mắt ngay trong ngày 2 và tháng 6, bao gồm hơn 40 mô hình và nhiều API cục bộ có sẵn.

3. Ra mắt SLM đa phương thức (mô hình ngôn ngữ nhỏ) Phi-3-vision 4,2 tỷ tham số để hỗ trợ hiểu và tương tác hình ảnh; nó cũng cung cấp mô hình nhỏ Phi-3 7 tỷ tham số và mô hình trung bình Phi-3 14 tỷ tham số để hỗ trợ hoạt động trên nhiều hệ điều hành và biên đám mây.

Địa chỉ mã nguồn mở Phi-3-vision: https://huggingface.co/microsoft/Phi-3-vision-128k-instruct

4. Ra mắt mẫu máy nhỏ đầu cuối mới nhất Phi-Silica , được thiết kế đặc biệt cho NPU trong Copilot+PC và đạt được SOTA trong SLM.

5. Đã thông báo rằng nó sẽ cung cấp hỗ trợ riêng cho các khung PyTorch và WebNN thông qua Windows DirectML. Các nhà phát triển sẽ có một khung học máy gốc trên Web có thể truy cập trực tiếp vào GPU và NPU.

6. Giới thiệu các trình kết nối Copilot hỗ trợ kết nối dữ liệu việc kinh doanh , quy trình làm việc và các ứng dụng SaaS của bên thứ ba giúp doanh nghiệp xây dựng và tùy chỉnh Copilot.

7. Khởi chạy Team Copilot , có thể đóng nhiều nhân vật khác nhau như chủ trì cuộc họp, ghi lại ghi chú cuộc họp, tạo ra biểu đồ, quản lý dự án, v.v. và mở rộng khả năng của Tác nhân (thông minh) .

8. Nền tảng Azure AI Studio sẽ khởi chạy các chức năng mô hình tùy chỉnh và nền tảng phân tích dữ liệuMicrosoft Fabric sẽ bổ sung các chức năng thông minh thời gian thực mới.

9. Mở phiên bản xem trước của CPU Azure Cobalt tùy chỉnh chip tự phát triển của mình cho khách hàng, với hiệu suất tăng lên tới 40% .

10. Được thông báo rằng đây sẽ là nền tảng đầu tiên cung cấp GPU NVIDIA Blackwell và phát hành Copilot+PC được trang bị GPU RTX; với sự hợp tác mở rộng với AMD, Azure sẽ trở thành nền tảng đám mây đầu tiên cung cấp phiên bản chung của accelerator ND MI300X V5 .

Nadella đề cập rằng (xu hướng) nổi bật nhất trong năm qua là cách các nhà phát triển sử dụng sức mạnh của các mô hình lớn để thay đổi thế giới.

Hiện tại, Microsoft đã xây dựng ba nền tảng : thứ nhất là Microsoft Copilot , trở thành trợ lý hàng ngày của người dùng và giúp người dùng thực hiện các hành động; thứ hai là Copilot stack , giúp các nhà phát triển xây dựng các ứng dụng và giải pháp AI nhanh hơn; thứ ba là Copilot +PC ; PC AI đầu tiên (Microsoft đang nhắm vào Apple! Tất cả PC AI đều được trang bị GPT-4o, trò chuyện thời gian thực AI dạy bạn cách chơi game, Qualcomm thắng)

Điều đáng nói là vào giây phút cuối cùng của hội nghị kéo dài hơn 2 giờ, Giám đốc điều hành OpenAI Sam Altman đã xuất hiện. Ông tiết lộ rằng các mô hình mới và trí thông minh tổng thể sẽ là chìa khóa cho mô hình tiếp theo của OpenAI , trong khi tốc độ và chi phí cũng là yếu tố quan trọng. quan trọng.

01. Bản xem trước công khai của chip Cobalt tự phát triển sẽ được phát hành cùng với phiên bản GPU RTX Copilot+PC

Nadella cho biết hôm nay Microsoft sẽ phát hành hơn 50 bản cập nhật, các bản cập nhật này sẽ được diễn giải theo thứ tự cấu trúc của ngăn xếp Copilot.

Về cơ sở hạ tầng AI, Nadella cho biết để thực hiện phát triển bền vững, đến năm 2025, 100% năng lượng mà Microsoft sử dụng sẽ đến từ năng lượng không carbon.

Vào tháng 11 năm ngoái, Microsoft đã phát hành siêu máy tính AI dựa trên đám mây đầu tiên. Giờ đây, sức mạnh siêu máy tính của Azure đã được tăng lên gấp 30 lần.

Hợp tác với NVIDIA, hai bên đảm nhận toàn bộ quy trình từ nền tảng đám mây và AI đến các ứng dụng Ứng dụng.

Microsoft sẽ là một trong những nền tảng đầu tiên cung cấp GPU NVIDIA Blackwell và sẽ phát hành PC Copilot+ được trang bị GPU RTX trong những tháng tới, mang đến cho game thủ, người sáng tạo và nhà phát triển hiệu suất cao hơn để xử lý khối lượng công việc AI cục bộ, đồng thời cung cấp tính năng Copilot+ mới của Microsoft.

Microsoft đã công bố mở rộng hợp tác với AMD và Azure sẽ trở thành nền tảng đám mây đầu tiên cung cấp phiên bản chung của bộ tăng tốc ND MI300X V5 , phiên bản này sẽ mang lại tỷ lệ giá/hiệu suất GPT-4 tốt nhất.

Microsoft Azure Maia cũng đã được cập nhật liên tục. Cụm đầu tiên của nó đã ra mắt và đang cung cấp hỗ trợ tỷ lệ băm cho các dịch vụ như Copilot và Azure OpenAI.

CPU dựa trên Arm của Microsoft Azure Cobalt đã bước vào giai đoạn xem trước công khai, với hiệu suất được cải thiện lên tới 40%. Nadella cho biết Cobalt được sử dụng để xử lý video và quản lý quyền trong Microsoft 365, đã hỗ trợ hàng tỷ lần hội thoại trong các dịch vụ như Microsoft Teams và hiện đang phục vụ các công ty như Siemens và Snowflake.

02.GPT-4o được kết nối với mô hình nhỏ đa phương thức Azure Phi-3-vision và được ra mắt

Hơn 50.000 tổ chức hiện đang sử dụng Azure AI. Nadella cho biết tất cả bắt đầu từ sự hợp tác chiến lược với OpenAI.

Microsoft đã thông báo rằng GPT-4o thường có sẵn trên Azure AI bắt đầu từ hôm nay . Điều này có nghĩa là bất kỳ ứng dụng hoặc trang web nào giờ đây đều có thể được chuyển thành giao diện đàm thoại song công, đa phương thức.

Ví dụ: người dùng có thể nhận được dịch vụ yêu cầu tích cực của Đại lý trên trang web. Khi biết rằng người dùng đang chuẩn bị đi cắm trại, nó sẽ cung cấp cho anh ta các đề xuất và giúp anh ta chọn các mặt hàng cần thêm vào giỏ hàng.

Mới tuần trước, OpenAI đã ra mắt mẫu đa phương thức mới nhất GPT-4o. Hôm qua, Microsoft đã cho thấy cách Copilot có thể sử dụng GPT-4o trong video để hỗ trợ người dùng chia sẻ màn hình hoặc các phiên để nhận trợ giúp từ Copilot, cho dù đó là hỗ trợ trò chơi hay hỗ trợ. chỉnh sửa tài liệu vẫn có thể lập trình.

Ví dụ: nếu người dùng cố gắng tạo ra một thanh kiếm trong trò chơi, Copilot có thể nhận ra màn hình của người dùng, nói chuyện với người dùng và giúp anh ta hoàn thành nhiệm vụ trong trò chơi, chẳng hạn như nhắc nhở anh ta "cần một số nguyên liệu" hoặc "nhấn E trên bàn phím để mở thư viện thiết bị." , "Để thu thập gỗ, đá và các tài nguyên khác", v.v.

Tiếp theo, Microsoft cũng mang đến nhiều mô hình khác , bao gồm các mô hình của Cohere, Databricks, Meta, Mistral, Snowflake và các công ty khác, tất cả đều có sẵn trên Azure AI. Microsoft thông báo sẽ giới thiệu các model mới từ Core42, NTT DATA và các nền tảng khác.

Chúng ta cần cả OpenAI và Open AI . Microsoft tuyên bố sẽ tăng cường hợp tác với cộng đồng mã nguồn mở Hugging Face và sẽ giới thiệu thêm nhiều mô hình từ đó cho Azure AI Studio.

Microsoft không chỉ phát triển các mô hình ngôn ngữ lớn mà còn hy vọng sẽ dẫn đầu cuộc cách mạng mô hình ngôn ngữ nhỏ.

Microsoft hiện đang mở rộng phiên bản của sê-ri mô hình nhỏ Phi-3, công bố ra mắt Phi-3-vision, mô hình đa phương thức 4,2 tỷ tham số với khả năng ngôn ngữ và hình ảnh . Nó có thể suy luận về hình ảnh, tạo ra nhận xét và trả lời các câu hỏi liên quan đến hình ảnh.

Microsoft cũng sẽ cung cấp mô hình nhỏ Phi-3 7 tỷ tham sốmô hình trung bình Phi-3 14 tỷ tham số . Với Phi-3, người dùng có thể xây dựng các ứng dụng trên Web, Android, iOS, Windows và Edge và có thể nhanh chóng chuyển đổi giữa phần cứng cục bộ và đám mây.

Đánh giá từ các bài kiểm tra điểm chuẩn, mô hình mã nguồn mở mạnh nhất có thể sẽ được đổi chủ. Với thông số 14B, hiệu suất của Phi-3-Medium gần bằng mô hình chuyên gia lai Mixtral 8x22B và Llama 3 với thông số 70B.

Mẫu cốc siêu nhỏ đa phương thức Phi-3 Vision cũng hoạt động rất tốt Với ​​thông số chỉ 4.2B, hiệu năng của nó có thể sánh ngang với Gemini 1.0 Pro V và Claude-3 Haiku.

Hôm nay, Microsoft cũng đã công bố ra mắt Phi-Silica , một SOTA SLM được xây dựng từ sê-ri Phi-3 được thiết kế đặc biệt cho NPU và Copilot+PC , cung cấp khả năng suy luận thiết bị nhanh như chớp và khả năng phản hồi Token đầu tiên. Windows là nền tảng SLM đầu tiên có khả năng tùy chỉnh nâng cao nhất cho NPU.

03. Ra mắt thư viện Windows Copilot để hỗ trợ các framework như PyTorch

Để biến Windows trở thành nền tảng tốt nhất để xây dựng các ứng dụng AI, Microsoft sẽ ra mắt thư viện Windows Copilot vào tháng 6, trong đó nhiều API gốc và hơn 40 mô hình mô hình, bao gồm mọi thứ từ các công cụ mã nguồn thấp đến các quy trình phức tạp, đến nhiều phần của một mô hình đa phương thức đầy đủ.

Lấy trải nghiệm Recall làm ví dụ, dựa trên một mẫu thiết bị tích hợp độ sâu với Windows để nắm bắt bối cảnh trên màn hình, chuyển đổi dữ liệu thành nhúng và lập chỉ mục vector, cho phép người dùng trực tiếp quay lại vị trí trước đây của ứng dụng và thực hiện các thao tác . Cả ứng dụng Edge và Microsoft 365 đều đã hỗ trợ tính năng này và sắp tới, Recall sẽ rút ngữ cảnh trong sơ đồ Microsoft 365.

Thư viện Windows Copilot cũng cung cấp các khả năng RAG (Thế hệ tăng cường truy xuất) mà người dùng có thể sử dụng để xử lý dữ liệu cục bộ và sử dụng khả năng này trong các ứng dụng của riêng họ.

Microsoft đã thông báo rằng kể từ bây giờ, họ sẽ cung cấp hỗ trợ riêng cho các khung PyTorch và WebNN thông qua Windows DirectML, điều đó có nghĩa là các nhà phát triển web cuối cùng cũng có khung học máy gốc trên web có thể truy cập trực tiếp vào GPU và NPU.

04. Phát hành Copilot RuntimeAI để quay ngược thời gian và xem lại các trang PC bất cứ lúc nào

Ngoài ra, Microsoft còn thông báo rằng họ sẽ biến Microsoft Teams trở thành nơi tốt nhất để các nhà phát triển cộng tác với AI về lập trình và thông báo chính sách đầy đủ sẽ được đưa ra trong tuần này.

Các nhà phát triển sẽ có thể sử dụng và lấy mã nguồn trong Microsoft Teams và Microsoft đã công bố ra mắt tính năng "Gặp ngay" để hỗ trợ các thành viên đội ngũ Teams giải quyết các vấn đề trong vài giây. Ngoài ra, người dùng sẽ có thể sử dụng biểu tượng cảm xúc tùy chỉnh trong Teams.

Hôm qua Microsoft thông báo Copilot sẽ được kết nối với PC, nhưng việc xây dựng một nền tảng AI mạnh mẽ đòi hỏi nhiều thứ hơn là chỉ một con chip hay mô hình mà là phải tái cấu trúc toàn bộ hệ thống từ trên xuống dưới.

Thời gian chạy Windows Copilot mới là mở rộng của ngăn xếp Copilot cho các hệ thống Windows. Thời gian chạy Windows Copilot là một thành phần mới của Windows 11. Nó bao gồm các thư viện Windows Copilot , khung AI và Chuỗi và được xây dựng trên chip máy khách mạnh mẽ.

Windows Copilot Runtime Về phía hệ điều hành, người dùng có thể sử dụng Copilot Runtime để truy xuất bất kỳ thứ gì họ nhìn thấy trong hộp thư đến trên máy tính của họ; các ứng dụng ảnh và vẽ cho phép người dùng sử dụng tính năng tạo hình ảnh theo thời gian thực và một số hiệu ứng bộ lọc để biến ý tưởng thành hiện thực.

05.GitHub Copilot có thể mở rộng Copilot do nhà phát triển tùy chỉnh

Copilot là sản phẩm phổ biến đầu tiên trong kỷ nguyên Generative AI. Hiện tại, GitHub Copilot có hơn 1,8 triệu nhà phát triển. Microsoft đang cấp phép cho các nhà phát triển tiếp cận ngôn ngữ lập trình và kiến ​​thức bằng ngôn ngữ mẹ đẻ của họ.

GitHub Copilot WorkSpace có thể tạo các thông số kỹ thuật dựa trên sự hiểu biết sâu sắc về cơ sở mã, sau đó tạo một kế hoạch và người dùng có thể thực hiện kế hoạch tạo mã. Trong quá trình này, các nhà phát triển có thể chỉnh sửa từ kế hoạch sang mã. Một phương pháp mới để xây dựng phần mềm. Microsoft sẽ cung cấp rộng rãi công cụ này trong những tháng tới.

Đồng thời, Microsoft đang kết nối với hệ sinh thái rộng lớn hơn gồm các công cụ và dịch vụ dành cho nhà phát triển thông qua Copilot.

GitHub đang triển khai bộ bản xem trước riêng tư đầu tiên của mở rộng GitHub Copilot do Microsoft và các đối tác bên thứ ba phát triển. Những tính năng mới này cho phép các nhà phát triển và tổ chức tùy chỉnh trải nghiệm GitHub Copilot bằng Azure, Docker, Sentry, v.v. trực tiếp trong GitHub Copilot Chat.

Neha Batra, Phó Giám đốc Kỹ thuật tại GitHub, thể hiện khả năng của GitHub Copilot. Ví dụ: các nhà phát triển có thể yêu cầu nó viết bài kiểm tra số nguyên tố bằng Java nhưng lại sử dụng tiếng Tây Ban Nha để tương tác bằng giọng nói.

Các nhà phát triển có thể @Azure và hỏi nó xem các tài nguyên sẵn có ở đâu.

Trên trang web, các nhà phát triển cũng có thể yêu cầu Copilot giúp cập nhật tài liệu README.

06. Giới thiệu trình kết nối Copilot để kết nối các ứng dụng bên trong và bên ngoài và tùy chỉnh sự phát triển của các tác nhân thông minh

Giờ đây, các nhà phát triển có thể xây dựng các tiện ích mở rộng Copilot trong lớp dữ liệu và lớp trải nghiệmmở rộng tùy chỉnh thêm Copilot .

Nadella cho rằng Copilot đang thâm nhập vào mọi tầng lớp xã hội. Ví dụ, 68% nhân viên thị trường cho rằng Copilot đã giúp họ bắt đầu quá trình sáng tạo, 70% nhân viên tri thức cho rằng Copilot đã giúp họ nâng cao hiệu quả và trong các kịch bản dịch vụ khách hàng, Copilot đã giúp họ nâng cao hiệu quả. cải thiện tốc độ giải quyết vấn đề 12%…

Microsoft thông báo sẽ giới thiệu Copilot Connector (Copilot Connector) , có thể giúp doanh nghiệp xây dựng và tùy chỉnh Copilot bằng cách sử dụng dữ liệu việc kinh doanh , ứng dụng và quy trình làm việc. Các doanh nghiệp cũng có thể sử dụng công cụ này để kết nối với các ứng dụng SaaS của bên thứ ba, bao gồm các dịch vụ từ Adobe, Snowflake, ServiceNow và các dịch vụ khác.

Microsoft đã mở rộng Copilot từ trợ lý cá nhân thành trợ lý đội ngũ , thông báo ra mắt Team Copilot .

Nó có thể đóng bất kỳ nhân vật nào trong hoạt động cộng tác đội ngũ , chẳng hạn như đóng vai người chủ trì cuộc họp, ghi chú cuộc họp, tạo ra biểu đồ, quản lý dự án, v.v. Tính năng này sẽ ra mắt vào cuối năm nay.

Không chỉ vậy, Copilot còn sẽ mở rộng khả năng của Agent . Người dùng có thể sử dụng hướng dẫn bằng ngôn ngữ tự nhiên hoặc chọn các mẫu hiện có để biến Copilot thành chuyên gia trong các lĩnh vực khác nhau. Nadella nói: “Tôi cho rằng đây là một bước quan trọng sẽ tạo ra sự khác biệt thực sự trong năm tới”.

Microsoft có thể chuyển đổi giữa tất cả trải nghiệm Copilot và Microsoft Team. Nhà phát triển chỉ cần nhấp vào SharePoint và dữ liệu, ứng dụng, hoạt động, v.v. của nhà phát triển có thể được đồng bộ hóa.

Đồng thời, mở rộng Copilot có thể chạy trên mọi thiết bị ở mọi nơi. Copilot hoạt động bằng cách suy luận về lời nhắc của người dùng và ánh xạ chúng tới mở rộng chính xác hoặc sử dụng mở rộng để trò chuyện sâu hơn. Tiện mở rộng sẽ cung cấp các đề xuất vận hành nhanh chóng và hiển thị các chức năng liên quan cho người dùng, cho phép Copilot tiếp thu kiến ​​thức theo thời gian thực.

Mở rộng Copilot này cũng có thể được sử dụng trong nhiều tình huống khác nhau, chẳng hạn như cuộc họp đội ngũ và trò chuyện trực tiếp.

Ngoài ra, Microsoft còn thông báo rằng họ sẽ giới thiệu Windows Volumetric Apps cho tai nghe Meta Quest và Copilot cho không gian ảo 3D.

07. Cập nhật nền tảng công cụ end-to-end, chức năng thông minh thời gian thực của Microsoft Fabric ra mắt

Azure AI Studio cung cấp các giải pháp công cụ toàn diện để giúp các nhà phát triển xây dựng, đào tạo và tinh chỉnh các mô hình AI. Nó cũng cung cấp các công cụ đánh giá hiệu suất và chất lượng của các mô hình và ứng dụng AI, cũng như phát hiện và sắp xếp liệu có bị chèn hay không. các cuộc tấn công trong các từ nhắc nhở được bao gồm.

Mô hình sẽ có nhiều trường hợp sử dụng tùy chỉnh cụ thể và chức năng mô hình tùy chỉnh (mô hình tùy chỉnh) của Microsoft Azure sẽ sớm ra mắt, cho phép các nhà phát triển xây dựng các trường và mô hình dữ liệu tương ứng của riêng họ.

Nền tảng này có năm ưu điểm chính, bao gồm khả năng cho phép mọi người xây dựng các mô hình tùy chỉnh, kết quả đầu ra sẽ dành riêng cho từng miền, đa nhiệm vụ và các khả năng dành riêng cho ngôn ngữ, đa phương thức được xác định theo điểm chuẩn.

Về mặt dữ liệu, Microsoft đã bổ sung các khả năng thông minh thời gian thực mới cho nền tảng phân tích dữ liệu toàn diện Microsoft Fabric, hiện có sẵn ở dạng bản xem trước dành cho các nhà phát triển.

Ở cấp độ dữ liệu, để huấn luyện các mô hình tinh chỉnh, Microsoft đang xây dựng một nền tảng cung cấp trạng thái dữ liệu hoàn chỉnh từ vận hành, lưu trữ đến phân tích. Cốt lõi của trong đó là Microsoft Fabric, hiện có hơn 11.000 khách hàng.

Microsoft Fabric hợp nhất điện toán, lưu trữ, trải nghiệm và quản trị người dùng, đồng thời cho phép các nhà phát triển xử lý dữ liệu ở bất kỳ đâu ngoài Azure dựa trên nền tảng.

Khả năng thông minh theo thời gian thực có sẵn cho các nhà phân tích và nhà phát triển chuyên nghiệp có khả năng không cần mã. Trong nền tảng này, các nhà phát triển có thể nhận được nhận xét sâu sắc có thể hành động theo thời gian thực về các luồng dữ liệu và sử dụng nó để khám phá, quản lý và sử dụng dữ liệu sự kiện này, đồng thời cung cấp lượng lớn trải nghiệm được quản lý, các nhà phát triển có thể sử dụng các trình kết nối sẵn dùng từ Microsoft; Và giới thiệu dữ liệu trên nhiều đám mây, thao tác kéo và thả đơn giản có thể đưa dữ liệu liên quan vào mục lục Fabric.

Các nhà phát triển có thể phân tích, khám phá và hành động dựa trên dữ liệu trong thời gian thực. Microsoft cũng đã ra mắt Bộ công cụ phát triển khối lượng công việc Microsoft Fabric mới để cho phép các nhà cung cấp phần mềm độc lập (ISV) và các nhà phát triển mở rộng các ứng dụng trong Fabric để tạo ra trải nghiệm thống nhất cho người dùng.

Microsoft đang xây dựng một nền tảng ứng dụng mới thông qua Bộ công cụ phát triển khối lượng công việc Fabric tích hợp các chức năng phân tích không gian. Các nhà phát triển có thể sử dụng các công cụ và thư viện ESRI để phân tích dữ liệu của riêng họ.

08. Còn lâu mới đạt đến nút lợi nhuận cận biên giảm dần của mô hình AI và cần phải chế tạo những siêu máy tính lớn hơn.

CTO của Microsoft Kevin Scott cho biết trong năm qua, Microsoft lượng lớn rất nhiều công việc dựa trên Copilot stack, không chỉ tối ưu hóa hệ thống để làm cho nó có chi phí thấp hơn và mạnh mẽ hơn mà còn xây dựng toàn bộ chức năng, hệ thống xung quanh nền tảng AI cốt lõi. , dịch vụ và đám mây.

Tại sao điều này có thể được thực hiện? Ông cho biết điều này là do Microsoft triển khai các ứng dụng AI có tính tổng hợp cao nhất, có hệ thống Copilot riêng và xây dựng chúng theo cách an toàn và đáng tin cậy.

Một trong những thành tựu đáng kinh ngạc của GPT-4o là đáp ứng nhu cầu tương tác âm thanh và video của người dùng trong thời gian thực và đạt được hiệu suất tự nhiên và mượt mà. Đằng sau hậu trường, Microsoft và OpenAI đang theo đuổi mục tiêu hiệu quả bằng cách xây dựng các siêu máy tính lớn hơn để tạo ra thế hệ mô hình lớn tiếp theo.

Từ GPT-4 năm ngoái đến GPT-4o năm nay, giá trò chuyện đã rẻ hơn 12 lần và tốc độ phản hồi mã thông báo đầu tiên của mô hình cũng nhanh hơn 6 lần.

Phía sau hậu trường, Microsoft cũng đang thực hiện đầy đủ các biện pháp tối ưu hóa từ xây dựng chip mạng cho đến lặp lại trung tâm dữ liệu và đang thực hiện lượng lớn công việc phát triển phần mềm dựa trên những phần cứng này để thực sự giải phóng hiệu suất phần cứng.

Một điều Microsoft cho rằng là đáng kinh ngạc là không có dấu hiệu giảm dần lợi nhuận ở đây. Một trong những thông điệp mà Microsoft gửi tới mọi người ngày hôm nay là mọi thứ sẽ trở nên mạnh mẽ hơn và rẻ hơn theo thời gian với tốc độ cực nhanh .

Chúng ta hãy nhìn vào mô hình nhỏ. Các mô hình nhỏ yêu cầu ít chi phí tính toán hơn để chạy nhưng lại phù hợp hơn để chạy trên các thiết bị, điều này thường có nghĩa là chất lượng sẽ giảm. Nhưng Microsoft đã phát hiện ra một ranh giới hiệu quả (Efficient Frontier) trong năm qua, tức là chất lượng của các mô hình nhỏ được triển khai trong các cảnh đã trở nên khá cao.

Giáo sư Ethan Mollick của Wharton nhận xét: Vì Microsoft đang đào tạo mô hình nên ông ấy hiểu rõ tác động của nhiều phép tính hơn hầu hết mọi người, điều này thật đáng chú ý.

09. Altman xuất hiện trong đêm chung kết và cư dân mạng bấm vào hỏi Scarlett về sự cố lồng tiếng

Kết thúc hội nghị, CEO OpenAI Sam Altman xuất hiện với tư cách khách mời đặc biệt. Ông không dự đoán rõ ràng về thế hệ mô hình lớn tiếp theo, nhưng đề cập rằng "các mô hình sẽ ngày càng trở nên thông minh hơn, nói chung là hoàn toàn thông minh".

Altman tiết lộ rằng các mô hình mới và trí thông minh tổng thể sẽ là chìa khóa cho mô hình tiếp theo của OpenAI, trong khi tốc độ và chi phí cũng rất quan trọng.

Ông cũng đề cập rằng đội ngũ R&D của OpenAI đã làm lượng lớn việc để đảm bảo tính bảo mật của GPT-4, nhưng để đạt được sự liên kết thực sự, họ phải thiết lập các cài đặt khác nhau từ nghiên cứu và tạo mô hình cho đến hệ thống bảo mật, từ xây dựng chính sách cho đến cách giám sát. Đây là một khối lượng công việc khổng lồ đối với đội ngũ nhưng nó phải được triển khai và cung cấp cho người dùng. Altman rất tự hào về công việc đội ngũ đã cùng nhau hoàn thành.

Tuy nhiên, cư dân mạng có vẻ khá "chỉ trích" ngoại hình của Altman. Khi phóng viên truyền thông nước ngoài nhắc đến phần bình luận trên dòng tweet X của anh, hầu hết đều là những bình luận mang tính chế giễu hoặc "kỳ quặc" về việc OpenAI bị nghi sử dụng giọng nói của bà góa mà không được phép. (OpenAI lại gặp rắc rối lớn! Tôi bị buộc tội đạo văn giọng nói của người vợ góa của mình. Nếu không đồng ý, tôi sẽ sao chép.)

Một số cư dân mạng cho rằng: "Ai sẽ hỏi anh ấy về Scarlett Johansson?"

Những người khác đã thêm ảnh GIF của một chị góa bụa và nói: "Nào, hãy hỏi câu đó đi".

Một số cư dân mạng mỉa mai: "Đây là danh sách những người nổi tiếng mà chúng tôi đã sử dụng giọng nói mà không được phép".

10. Kết luận: Copilot tăng tốc triển khai Microsoft AI và toàn bộ vũ trụ xuất hiện.

Đúng như chủ đề của hội nghị Microsoft Build năm nay “AI sẽ định hình tương lai của bạn như thế nào?”, lần này Microsoft đã thực hiện được điều đó thông qua hơn 50 bản cập nhật về cơ sở hạ tầng, mô hình, Chuỗi công cụ phần mềm và ứng dụng. những thay đổi mà AI đã mang lại cho mọi tầng lớp xã hội, đẩy nhanh sự thâm nhập của nó vào cuộc sống con người.

Nadella nói rằng 70 năm trước ông có hai ước mơ: Máy tính có thực sự hiểu được chúng ta không? Máy tính có thể giúp chúng ta suy luận, lập kế hoạch và hành động hiệu quả với nhiều dữ liệu hơn không? Ông cho rằng rằng hiện nay những đột phá thực sự đã được thực hiện ở cả hai khía cạnh. Luật mở rộng, giống như Luật của Morris thúc đẩy cuộc cách mạng thông tin, sẽ hoạt động với kiến ​​trúc mô hình để thúc đẩy cuộc cách mạng thông minh này.

Nếu Microsoft ra mắt Windows Copilot và nhúng GPT-4 vào hệ điều hành Windows một năm trước, nó đánh dấu sự khởi đầu của vũ trụ AI của Microsoft; thì ngày nay, Microsoft đã biến vũ trụ AI này thành hiện thực thông qua nâng cấp Copilot và thực hành tích hợp vào các sản phẩm chính của vũ trụ đã thành hình ban đầu, và thông qua sê-ri biện pháp như tăng tốc, giảm giá và hợp tác sinh thái, ngành này đã được đẩy vào một giai đoạn cải tổ mới.

Bài viết này xuất phát từ tài khoản công khai WeChat "Zhidixi" (ID: zhidxcom) , tác giả: Ban biên tập Zhidixi, 36 Krypton được phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận