Ngày 14 tháng 4, PANews đưa tin Google DeepMind đã phát hành Gemini Robotics-ER 1.6 , một mô hình suy luận thể hiện dành cho robot. So với Gemini Robotics-ER 1.5 và Gemini 3.0 Flash , phiên bản này cải thiện đáng kể nhiệm vụ suy luận không gian và vật lý như chỉ điểm và định vị, đếm đối tượng và phát hiện thành công đa góc nhìn, đồng thời bổ sung khả năng đọc các thiết bị công nghiệp. Mô hình này có thể đóng vai trò là trung tâm ra quyết định cấp cao cho robot, sử dụng các công cụ như Google Search và VLA một cách tự nhiên. Nó sử dụng thị giác máy tính để phóng đại các khu vực quan trọng, sau đó kết hợp chỉ điểm và tính toán mã để đạt được khả năng đọc thiết bị với độ chính xác cao. Chính thức cũng khẳng định rằng nó vượt trội hơn các mô hình trước đó về khả năng tuân thủ lệnh an toàn và đánh giá ràng buộc an toàn vật lý. Hiện tại, mô hình này đã có sẵn cho các nhà phát triển thông qua Gemini API và Google AI Studio .
Google ra mắt Gemini Robotics-ER 1.6, một mẫu được thiết kế dành cho các ứng dụng robot.
Bài viết này được dịch máy
Xem bản gốc
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan





