OpenAI vừa công bố GPT Image 1.5, một mô hình AI mới chuyên về tạo và chỉnh sửa hình ảnh. Mô hình này được đánh giá là tối ưu cho cả người dùng thương mại và phổ thông, khắc phục những hạn chế của các khả năng tạo hình ảnh hiện có đồng thời tăng tốc độ xử lý và độ chính xác.
GPT Image 1.5, được phát hành cùng thời điểm với mô hình tạo ảnh "Nano Banana Pro" mà Google mới công bố gần đây, có những cải tiến đáng kể về khả năng hiển thị văn bản trong hình ảnh và hiểu các lệnh tiếp theo. OpenAI nhấn mạnh rằng mô hình này vượt trội trong việc chỉnh sửa hình ảnh chứa văn bản nhỏ và thông tin dày đặc, phù hợp với các tác vụ phức tạp như tạo infographic.
Người dùng thông thường có thể truy cập GPT Image 1.5 thông qua chức năng tạo ảnh trong ChatGPT, trong khi các nhà phát triển có thể truy cập thông qua giao diện lập trình ứng dụng (API). OpenAI đã giảm giá API này 20% so với các phiên bản trước và tuyên bố rằng hiệu quả tính toán được cải thiện của mô hình cũng giúp tốc độ tạo ảnh nhanh hơn gấp bốn lần. Điều này cũng sẽ giúp giảm chi phí máy chủ và mức tiêu thụ năng lượng, mang lại lợi thế đáng kể cho các doanh nghiệp.
Mẫu GPT Image 1.5 mới cũng thể hiện thế mạnh của mình trong việc chỉnh sửa hình ảnh phức tạp, nhiều bước. Ví dụ, nó thực hiện một cách liền mạch nhiệm vụ khó khăn là trích xuất các yếu tố từ ba hình ảnh khác nhau, ghép chúng thành một hình ảnh duy nhất, và sau đó thay đổi hàng loạt kiểu tổng thể. Bởi vì nó xác định chính xác những yếu tố nào cần thay đổi và những yếu tố nào cần giữ nguyên, nên nó cũng phù hợp với các ứng dụng thương mại yêu cầu chỉnh sửa hình ảnh thương hiệu hoặc logo mà không làm thay đổi cấu trúc gốc.
OpenAI cho biết mô hình này có thể có những hạn chế trong việc tạo ra hình ảnh yêu cầu phong cách cụ thể hoặc kiến thức khoa học, nhưng lưu ý rằng tỷ lệ lỗi của nó trong các nhiệm vụ liên quan đã giảm đáng kể so với các mô hình trước đây. Mô hình mới sẽ được truy cập thông qua một giao diện riêng biệt trong ChatGPT và cũng sẽ đi kèm với các đề xuất gợi ý được cá nhân hóa và bộ lọc hình ảnh.
Thông báo này được đưa ra ngay sau khi mô hình GPT-5.2 được phát hành, chứng minh khả năng giải quyết các bài toán khoa học và toán học cấp trung học, phá vỡ kỷ lục trên các bảng xếp hạng trí tuệ nhân tạo. Dựa trên thành tựu này, OpenAI gần đây đã ra mắt FrontierScience, bảng xếp hạng chuyên dụng của riêng mình, bao gồm hơn 700 câu hỏi về vật lý, hóa học và sinh học, để đánh giá khả năng ứng dụng khoa học của các thuật toán của họ.
Với sự phát triển nhanh chóng của công nghệ tạo ảnh bằng trí tuệ nhân tạo, việc phát hành GPT Image 1.5 thể hiện cam kết của OpenAI trong việc củng cố vị thế dẫn đầu của mình trong lĩnh vực xử lý ảnh. Mô hình này, đồng thời giải quyết ba mục tiêu chính: giảm chi phí, tăng tốc độ và cải thiện độ chính xác, rất có khả năng trở thành công cụ AI cốt lõi trong nhiều môi trường sản xuất nội dung thương mại khác nhau.
Nhận tin tức cập nhật liên tục... Tham gia nhóm Telegram của TokenPost
Bản quyền © TokenPost. Nghiêm cấm sao chép và phân phối lại trái phép.





