Thử nghiệm thực tế AI: Tính năng phân tích ảnh mới của Grok ra mắt, giúp bạn hiểu thế giới xung quanh chỉ với một cú nhấp chuột.

avatar
ABMedia
12-17
Bài viết này được dịch máy
Xem bản gốc

Công ty khởi nghiệp AI xAI của Musk tiếp tục bổ sung các tính năng mới cho Grok. Chính Musk đã giới thiệu các tính năng mới nhất của Grok trên nền tảng cộng đồng xAI, sử dụng camera để thực hiện phân tích hình ảnh theo thời gian thực. Chỉ cần hướng ống kính vào bất kỳ vật thể nào và hỏi Grok "Đây là gì?", Grok có thể ngay lập tức phân tích nội dung hình ảnh, cung cấp lời giải thích chi tiết, và thậm chí đưa ra các suy luận và diễn giải mở rộng hơn.

Ban đầu, Grok được định vị là "nói lên sự thật với một chút hài hước", và được xem là một phần quan trọng trong chiến lược của Musk để cạnh tranh với các sản phẩm AI chính thống. Không giống như các mô hình ngôn ngữ lớn khác, Grok nhấn mạnh tính tức thời và sự tích hợp độ sâu với nền tảng X và chatbot, cho phép nó tham khảo thông tin công khai và các cuộc thảo luận đang thịnh hành trên nền tảng này. Trước đây, các phương tiện truyền thông đã mô tả Grok như một trợ lý AI gần gũi hơn với nhịp đập cộng đồng và có phong cách phản hồi trực tiếp hơn.

Grok ra mắt tính năng phân tích ảnh tức thời

Tính năng phân tích ảnh tức thì của Grok đánh dấu bước đột phá của nó vào lĩnh vực ứng dụng trí tuệ nhân tạo đa phương thức. Theo Musk, người dùng có thể quét ghi chú, địa điểm, bản vẽ, tài liệu và thậm chí cả văn bản tiếng nước ngoài, sau đó Grok sẽ nhận dạng, phân tích và dịch chúng. Cho dù đang học tập, làm việc, du lịch, nấu ăn hay chỉ đơn giản là tò mò muốn hiểu điều gì đó, tính năng này đều có thể hữu ích ngay lập tức.

Kiểm tra thực tế các chức năng chụp ảnh và phân tích của Grok

Trong bài kiểm tra thực tế, tôi đã chụp ảnh một chai nước thông thường bằng điện thoại và hỏi Grok, "Đây là cái gì?". Thật ngạc nhiên, chỉ trong khoảng năm giây, Grok không chỉ nhận diện thành công đó là một chai nước uống bằng nhựa có thể tái sử dụng, mà còn suy luận được nguồn gốc thương hiệu của nó. Mặc dù không có logo thương hiệu trên chai, Grok vẫn phân tích và chỉ ra rằng chai nước này là sản phẩm được bán bởi chuỗi cửa hàng 100 yên Daiso của Nhật Bản, với dung tích khoảng 400 đến 500 mililit.

Chatbot Grok chia sẻ phản hồi chi tiết hơn với bạn.

Điều thú vị hơn nữa là Grok không chỉ dừng lại ở việc xác định sản phẩm; ông đã mở rộng phân tích của mình đến thiết kế chai và dòng chữ in trên chai. Trên chai có in chữ "earthiness" (sự mộc mạc), kèm theo khẩu hiệu tiếng Anh, "Life is only once. Live a wonderful life (Cuộc sống chỉ có một lần. Hãy sống một cuộc đời tuyệt vời). Grok chỉ ra rằng kiểu khẩu hiệu tiếng Anh khá đơn giản, thậm chí hơi cứng nhắc này khá phổ biến trong thiết kế sản phẩm phong cách sống Nhật Bản, thường được sử dụng để tạo ra một bầu không khí tích cực và truyền cảm hứng. Grok thậm chí còn cố gắng liên kết dòng chữ này với "thẩm mỹ phong cách sống Nhật Bản", đưa ra bình luận có yếu tố lý luận.

Trong phần mô tả sản phẩm, Grok cũng đề cập rằng bình nước này có thiết kế nắp vặn, kết hợp với vòi lật và tay cầm hoặc vòng treo ở phía trên để dễ dàng mang theo hoặc gắn vào ba lô. Kiểu thiết kế này khá phổ biến ở các bình nước dùng cho việc đi lại, thể thao hoặc các hoạt động ngoài trời nhẹ, phù hợp với tiêu chí thực dụng và giá trị đồng tiền tại các cửa hàng 100 yên.

Bài kiểm tra này cho thấy khả năng hiểu hình ảnh của Grok đã vượt xa việc chỉ đơn thuần "kể chuyện từ hình ảnh". Nó cố gắng kết hợp các đặc điểm của đối tượng, bối cảnh văn hóa và suy luận ngữ nghĩa để đưa ra lời giải thích đầy đủ hơn. Điều này cũng lặp lại tuyên bố nhất quán của Musk rằng trí tuệ nhân tạo không chỉ nên là một công cụ lạnh lùng, vô cảm, mà còn phải có khả năng quan sát, suy nghĩ và thậm chí bình luận về các chi tiết giống như con người.

Khi Grok tiếp tục phát triển, thế giới bên ngoài đang theo dõi xem liệu chatbot này, sự kết hợp giữa thông tin cộng đồng thời gian thực với khả năng đa phương thức, có thể tạo ra con đường riêng trong lĩnh vực trí tuệ nhân tạo đầy cạnh tranh khốc liệt hay không. Đối với người dùng thông thường, việc cầm điện thoại lên, hướng về thế giới và trực tiếp hỏi "Tôi đang thấy gì?" bằng giọng nói có thể chỉ là bước khởi đầu cho việc trí tuệ nhân tạo thực sự hòa nhập vào cuộc sống hàng ngày.

Bài viết này, "Thử nghiệm thực tế của AI: Tính năng phân tích ảnh mới của Grok ra mắt, giúp bạn hiểu thế giới trước mắt chỉ với một cú nhấp chuột," lần đầu tiên xuất hiện trên ABMedia .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận