Mô hình AI mới của Google DeepMind hứa hẹn cách mạng hóa ngành công nghiệp robot với khả năng thực hiện đa dạng nhiệm vụ phức tạp thông qua giọng nói.

Mô hình AI mới của Google DeepMind hứa hẹn cách mạng hóa ngành công nghiệp robot với khả năng thực hiện đa dạng nhiệm vụ phức tạp thông qua điều khiển bằng giọng nói.Trong một bước tiến đáng chú ý cho lĩnh vực trí tuệ nhân tạo ứng dụng, <a href="https://phocapblockchain.net/google-tai-tro-10-trieu-usd-mo-rong-chuong-trinh-giao-duc-ai/" rel="nofollow">Google DeepMind</a> vừa công bố <a href="https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?utm_source=keywordsnippet&amp;utm_medium=referral" rel="nofollow">Gemini Robotics</a> – mô hình AI tiên tiến được thiết kế đặc biệt để điều khiển robot thực hiện các tác vụ phức tạp trong môi trường thực tế. Sự kiện này đánh dấu một bước ngoặt quan trọng trong nỗ lực của Google nhằm mở rộng khả năng ứng dụng của các mô hình ngôn ngữ lớn (LLM) vào lĩnh vực robotics.Theo thông báo được đưa ra vào thứ Tư, Gemini Robotics được phát triển với mục tiêu giúp các hệ thống robot có thể tương tác trực quan với các vật thể, di chuyển linh hoạt trong môi trường và hoàn thành nhiều nhiệm vụ đa dạng một cách tự nhiên. Các video demo được công bố cho thấy khả năng ấn tượng của mô hình khi điều khiển robot thực hiện các thao tác tinh vi như gấp giấy hay đặt vật dụng vào hộp thông qua chỉ dẫn bằng giọng nói.<h2>Tiềm năng đột phá cho ngành công nghiệp robot</h2>Điểm nổi bật của Gemini Robotics là khả năng tổng quát hóa (generalization) – một trong những thách thức lớn nhất của ngành robotics hiện đại. Mô hình được huấn luyện để kết nối linh hoạt giữa thông tin thị giác mà robot thu nhận được với các hành động cụ thể mà chúng có thể thực hiện, đồng thời hoạt động được trên nhiều nền tảng phần cứng robot khác nhau.“Chúng tôi đã chứng minh rằng Gemini Robotics có thể hoạt động hiệu quả ngay cả trong những môi trường chưa từng xuất hiện trong dữ liệu huấn luyện,” đại diện DeepMind cho biết. Đây là một bước tiến quan trọng so với các hệ thống trước đây, vốn thường gặp khó khăn khi đối mặt với môi trường mới hoặc nhiệm vụ chưa được lập trình sẵn.Song song với việc ra mắt mô hình chính, Google DeepMind cũng phát hành Gemini Robotics-ER – phiên bản thu gọn được thiết kế để các nhà nghiên cứu và phát triển có thể tích hợp vào các dự án robot của riêng họ. Động thái này cho thấy chiến lược mở của Google trong việc thúc đẩy sự phát triển của cộng đồng AI robotics.Để đảm bảo tính an toàn cho công nghệ mới, DeepMind cũng giới thiệu tiêu chuẩn Asimov – một framework đánh giá các rủi ro tiềm ẩn liên quan đến robot được điều khiển bằng AI. Điều này phản ánh mối quan tâm ngày càng tăng của ngành công nghiệp về các vấn đề an toàn và đạo đức khi triển khai công nghệ AI vào các hệ thống vật lý.

Google DeepMind ra mắt Gemini Robotics

谷歌DeepMind的新型AI模型有望透過語音實現複雜多樣的<任務>而革新機器人行業。

谷歌DeepMind的新AI模型有望透過語音控制來革新機器人行業,實現複雜多樣的任務。在人工智慧應用領域取得重大進展的一步,<a href="https://phocapblockchain.net/google-tai-tro-10-trieu-usd-mo-rong-chuong-trinh-giao-duc-ai/">谷歌DeepMind</a>剛剛釋出了<a href="https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?utm_source=keywordsnippet&amp;utm_medium=referral">Gemini Robotics</a> - 一種專門設計用於控制機器人執行復雜任務的先進AI模型。這標誌著谷歌努力將大型語言模型(LLM)的應用擴充套件到機器人領域的重要一步。根據週三釋出的公告,Gemini Robotics的目標是使機器人系統能夠與物體進行視覺互動、在環境中靈活移動,並自然完成多樣的任務。釋出的演示影片展示了該模型透過語音指令控制機器人執行精細操作如摺紙、放置物品等的出色能力。<h2>對機器人行業具有突破性潛力</h2>Gemini Robotics的亮點在於其泛化能力 - 這是當前機器人技術面臨的最大挑戰之一。該模型經過訓練,能夠靈活地將機器人獲取的視覺資訊與其可執行的具體動作相關聯,並在不同硬體平臺上執行。"我們已經證明,Gemini Robotics即使在從未出現在訓練資料中的環境中也能高效執行,"DeepMind代表表示。這與之前的系統相比是一個重要進步,後者通常難以應對新環境或未預先程式設計的任務。除了推出主要模型,谷歌DeepMind還發布了Gemini Robotics-ER - 一個精簡版本,供研究人員和開發者整合到自己的機器人專案中。這反映了谷歌在推動AI機器人社群發展方面的開放戰略。為確保新技術的安全性,DeepMind還推出了Asimov標準 - 一個評估AI驅動機器人潛在風險的框架。這反映了行業對於部署AI技術到物理系統時安全和倫理問題的日益關注。

Google DeepMind 與Gemini Robotics

Polymarket 上一玩家 1 年交易 61,793 次，狂賺 10.6 萬美元。

蚊子肉，滾出 10 萬美元利潤

身家千億，出獄後客廳還在漏水。

CZ 最新專訪：我不是傳奇，只是個普通人

比特幣和以太坊價格已從上週低點反彈，這讓人Optimism認為底部可能已經出現。與此同時，巨鯨們正在大量買入，而加密貨幣ETF也出現了顯著上漲……