OpenAI đã công bố DALL-E 3 , phiên bản thứ ba của mô hình chuyển văn bản thành hình ảnh được hoan nghênh.
DALL-E 3 hứa hẹn những cải tiến đáng kể so với phiên bản tiền nhiệm và giới thiệu khả năng tích hợp liền mạch với ChatGPT.
Một trong những tính năng nổi bật của DALL-E 3 là khả năng hiểu và diễn giải tốt hơn ý định của người dùng khi gặp những lời nhắc chi tiết và dài dòng:
"Một người phụ nữ trung niên gốc Á, mái tóc sẫm màu có vệt bạc, trông như bị gãy và vỡ vụn, được nhúng một cách phức tạp trong một biển sứ vỡ. Đồ sứ lấp lánh với những họa tiết sơn bắn tung tóe trong sự pha trộn hài hòa giữa màu xanh lam bóng và mờ, xanh lục, … pic.twitter.com/QryQz0BtxB
– OpenAI (@OpenAI) Ngày 20 tháng 9 năm 2023
Ngay cả khi người dùng gặp khó khăn trong việc diễn đạt chính xác tầm nhìn của họ, ChatGPT vẫn có thể can thiệp để hỗ trợ tạo ra các lời nhắc toàn diện.
DALL-E 3 đã được thiết kế để vượt trội trong việc tạo ra các yếu tố mà những người tiền nhiệm và các trình tạo AI khác trong lịch sử đã phải vật lộn, chẳng hạn như hiển thị các mô tả phức tạp về bàn tay và kết hợp văn bản vào hình ảnh:
“Hình minh họa trái tim con người làm bằng thủy tinh mờ, đứng trên bệ giữa biển giông bão. Tia nắng xuyên qua mây, chiếu sáng trái tim, để lộ ra vũ trụ nhỏ bé bên trong. Câu nói 'Tìm vũ trụ trong bạn' được khắc trên đó chữ in đậm trên… pic.twitter.com/S3cKMkG67T
– OpenAI (@OpenAI) Ngày 20 tháng 9 năm 2023
OpenAI cũng đã triển khai các biện pháp bảo mật mạnh mẽ, đảm bảo hệ thống AI không tạo ra nội dung tục tĩu hoặc phản cảm bằng cách xác định và bỏ qua một số từ khóa nhất định trong lời nhắc.
Ngoài những tiến bộ kỹ thuật, OpenAI đã thực hiện các bước để giảm thiểu các vấn đề pháp lý tiềm ẩn.
Trong khi phiên bản DALL-E hiện tại có thể bắt chước phong cách của các nghệ sĩ còn sống thì DALL-E 3 sắp ra mắt đã được thiết kế để từ chối yêu cầu sao chép các tác phẩm có bản quyền của họ. Các nghệ sĩ cũng sẽ có tùy chọn gửi tác phẩm gốc của mình thông qua một biểu mẫu dành riêng trên trang web OpenAI, cho phép họ yêu cầu xóa nếu cần.
Kế hoạch triển khai DALL-E 3 của OpenAI liên quan đến việc phát hành lần đầu cho khách hàng ChatGPT 'Plus' và 'Enterprise' vào tháng tới. Sau đó, trình tạo hình ảnh nâng cao sẽ có sẵn cho các phòng thí nghiệm nghiên cứu và khách hàng API của OpenAI trong mùa thu sắp tới.
Khi OpenAI tiếp tục vượt qua các ranh giới của công nghệ AI, DALL-E 3 thể hiện một bước tiến lớn trong việc tạo văn bản thành hình ảnh.
(Tín dụng hình ảnh: OpenAI )
Xem thêm: Stability AI công bố mô hình 'Âm thanh ổn định' để tạo âm thanh có thể kiểm soát

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy xem AI & Big Data Expo diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với Tuần lễ Chuyển đổi Kỹ thuật số .
Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp tại đây.
Bài đăng OpenAI tiết lộ mô hình chuyển văn bản thành hình ảnh DALL-E 3 xuất hiện đầu tiên trên AI News .





