Hình ảnh thông báo phía trên được tạo ra bởi trí tuệ nhân tạo (AI).
Ngày 22 tháng 4, Zhidongxi đưa tin OpenAI đã chính thức phát hành mô hình tạo và chỉnh sửa hình ảnh được mong đợi từ lâu ChatGPT Images 2.0 vào rạng sáng nay. Mô hình này đã được ra mắt đầy đủ trong chatbot ChatGPT và các dịch vụ API.
Trong buổi phát sóng trực tiếp cuộc họp báo, Altman nhận xét: "Việc phát hành ChatGPT Images 2.0 là một bước tiến khổng lồ, tương đương với việc nhảy thẳng từ GPT3 lên GPT5 chỉ trong một lần."
Sau khi ra mắt, mẫu máy này nhanh chóng vươn lên dẫn đầu tất cả các bảng xếp hạng của Image Arena, bỏ xa Nano Banana 2 tới 242 điểm trong bảng xếp hạng ảnh thô đầy cạnh tranh.
Mô hình này nhanh chóng lan truyền trên mạng xã hội sau khi được phát hành, với một số cư dân mạng thốt lên: "Chuối không còn ngon như trước nữa, ChatGPT Images 2.0 đã giết chết cuộc chơi."
Lượng lớn cư dân mạng đã chia sẻ những hình ảnh được tạo ra bằng ChatGPT Images 2.0, tạo nên một làn sóng ảnh ấn tượng. Khả năng mạnh mẽ của ChatGPT Images 2.0 khiến những hình ảnh này trông không khác gì ảnh thật, và một số người thậm chí còn phát hiện ra rằng nó có thể tạo ra mã vạch có thể quét được.
Trong số các kết quả do cư dân mạng tạo ra và chia sẻ , có ảnh chụp màn hình từ các buổi phát trực tiếp, ảnh từ các cuộc họp báo, và thậm chí cả các bản ghi giao dịch – những hình ảnh trông rất chân thực và gần gũi với cuộc sống hàng ngày. Những hình ảnh do ChatGPT Images 2.0 tạo ra này chân thực đến mức có thể dễ dàng đánh lừa những người không cảnh giác trong nhiều trường hợp.
ZhiDongXi đã thu thập và thử nghiệm nhiều trường hợp khác nhau để xem liệu bạn có thể phân biệt được đâu là thật và đâu là giả hay không.
01. Phát sóng trực tiếp, chuyển tiền, họp báo: Hình ảnh do AI tạo ra rất khó phân biệt với hình ảnh thật.
Hình ảnh tiêu đề bài viết hiển thị thông báo phát hành DeepSeek V4 được tạo ra bằng ChatGPT Images 2.0, với nội dung sau: "Ảnh chụp màn hình một bài đăng trên Twitter về thông báo phát hành DeepSeek V4, được đăng bởi tài khoản chính thức của DeepSeek, giữ nguyên các yếu tố giao diện của bài đăng như ảnh đại diện, tên người dùng, lượt thích, lượt chia sẻ lại và bình luận."
Nhân tiện, Zhidongxi đã sử dụng ChatGPT Images 2.0 để tạo ảnh chụp màn hình một bài đăng trên WeChat Moments nhằm làm cho toàn bộ quá trình có vẻ khép kín hơn.
Nội dung yêu cầu như sau: "Ảnh chụp màn hình một bài đăng trên WeChat Moments cho thấy Sam Altman ca ngợi DeepSeek V4 là một mô hình đột phá, tiếp theo là lượt thích và bình luận từ Musk, Zuckerberg và Huang."
Nếu không có ảnh tham khảo, các ảnh chụp màn hình do ChatGPT Images 2.0 tạo ra khá chân thực. Tuy nhiên, các bức chân dung được tạo ra hơi lệch, và tên của Huang Renxun bị thiếu một vài nét.
Ngoài ra còn có việc sử dụng ChatGPT Images 2.0 để tạo trang phát trực tiếp. Phương pháp này gần đây đã lan truyền rộng rãi trong giai đoạn thử nghiệm beta. Có người đã sử dụng GPT Image 2 để tạo ảnh chụp màn hình Altman quảng cáo Doubao (một loại bánh bao hấp của Trung Quốc) trong một buổi phát trực tiếp, và nó trông hoàn toàn tự nhiên. Chiếc rút thăm bì đỏ trúng thưởng ở góc trên bên trái và các bình luận bên dưới trông rất thật. Nếu đó là hình ảnh của những nhân vật có tiếng trong nước khác, mọi người có thể thực sự bị đánh lừa.
Theo thông lệ kiểm thử mô hình xử lý ảnh thô, ZhiDongXi cũng yêu cầu nó tạo ra một bức ảnh văn bản viết tay và nhập lời nhắc: "Chụp ảnh bài tập toán trung học viết tay bằng điện thoại của bạn. Chữ viết gọn gàng và được viết trên giấy trắng. Nội dung là một bài toán đạo hàm."
Những bức ảnh được tạo ra trông gần như giống hệt với chữ viết tay gọn gàng trong bài tập của nhiều học sinh. Có giáo viên nào trong phần bình luận có thể phân biệt được ảnh thật và ảnh giả không?
Thậm chí có người còn nói đùa rằng Steve Jobs nên ra mắt chiếc xe của Xiaomi, nhưng sau khi xem xét kỹ lưỡng, họ không tìm thấy điểm nào đáng chê trách.
Nếu bạn thấy bức ảnh trước đó chưa đủ chân thực, hãy xem bức ảnh bên dưới:
Hình ảnh này, cũng được tạo ra bởi ChatGPT Images 2.0, có chú thích: "Tim Cook đang phát biểu tại sự kiện ra mắt iPhone 20 tại Apple Park. Ảnh chụp bằng iPhone nghiệp dư này được chụp từ xa xuyên qua đám đông."
Bức ảnh này phản ánh hoàn hảo quan điểm của giới truyền thông; nếu không có chiếc iPhone 20 lộ liễu và việc Cook từ chức, có lẽ nhiều người đã bị đánh lừa.
Nhìn lại hình ảnh này, đây là một bài báo khoa học do Zhidongxi tạo ra trong ChaGPT. Yêu cầu nhập liệu là: "Một bài báo từ Tạp chí Đại học Bắc Kinh về các vấn đề an ninh AI, với bố cục đẹp mắt và phong cách chặt chẽ."
Trang web của tạp chí đã hoàn thiện. Phong cách tổng thể hoàn toàn phù hợp với các tiêu chuẩn của các tạp chí học thuật chính thức — rất ngắn gọn, với văn bản tiếng Trung chính xác. Tiêu đề, tác giả, cơ quan, tóm tắt, từ khóa và phần giới thiệu chính của bài viết đều được bố trí hợp lý, với khoảng cách dòng và cấu trúc đoạn văn rõ ràng. Ngay cả thông tin DOI và bản quyền cũng đã được tạo, khiến trang web trông rất chuyên nghiệp.
Nếu ai đó gửi cho bạn ảnh chụp màn hình bài báo này và yêu cầu bạn tìm nguồn tham khảo, một số người có thể bị lừa.
Một số người thậm chí còn sử dụng ChatGPT Images 2.0 để tạo ảnh chụp màn hình các giao dịch chuyển khoản ngân hàng, điều này thật đáng sợ. Họ thậm chí có thể ngụy tạo con dấu chính thức, điều này không tốt chút nào.
Đơn thuốc này cũng được tạo ra bằng ChatGPT Images 2.0. Ngoại trừ chữ viết quá gọn gàng để giống chữ của bác sĩ, mọi thứ khác đều đủ để đánh lừa bạn rằng đó là đơn thuốc thật.
02. ChatGPT Images 2.0 đang nhận được rất nhiều đánh giá tích cực; người dùng đang phát cuồng vì nó.
Hiện tại, tất cả người dùng ChatGPT và Codex đều có thể sử dụng miễn phí một số lượng mẫu ảnh thô nhất định, ước tính tạo ra khoảng 7 ảnh dựa trên thử nghiệm thực tế. Người dùng trả phí có thể mở khóa "Chế độ tư duy", trong đó mô hình thực hiện tìm kiếm trực tuyến, kiểm tra và tự kiểm tra để đảm bảo chất lượng của ảnh thô. Mô hình gpt-image-2 cũng được cung cấp công khai thông qua API.
Người dùng có thể mở cuộc trò chuyện ChatGPT, nhấn dấu cộng ở bên trái ô nhập liệu và chọn Tạo hình ảnh. Ứng dụng sẽ sử dụng ChatGPT Images 2.0 theo mặc định. Sau đó, họ có thể nhấp vào dấu cộng để thêm ảnh và tệp, rồi gửi tin nhắn.
Nếu các yêu cầu không rõ ràng, ChatGPT sẽ yêu cầu người dùng xác nhận lại trước khi tạo ảnh.
Sau khi ChatGPT Images 2.0 được phát hành, cư dân mạng đã đổ xô đi dùng thử và dành tặng những lời khen ngợi hết lời. Ai cũng khoe khoang về độ tinh tế của những hình ảnh mà họ tạo ra bằng ChatGPT Images 2.0. Một số cư dân mạng thậm chí còn thốt lên rằng không thể phân biệt được đâu là ảnh thật và đâu là ảnh giả.
Một bác sĩ y khoa từ Đại học Tokyo đã đăng tải một áp phích về bài báo do ông tạo ra, nói rằng mặc dù ông chưa thử nghiệm, nhưng ChatGPT Images 2.0 dường như có khả năng xử lý dữ liệu trong bài báo , và ông tuyên bố rằng nghiên cứu khoa học sắp sửa mở ra một cuộc cách mạng mới.
Riley Brown, đồng sáng lập của vibecode và là một blogger quốc tế, đã nhận định: "Đây là mô hình hình ảnh tốt nhất."
Mặc dù ChatGPT Images 2.0 rất mạnh mẽ, vẫn còn nhiều bức ảnh đánh lừa người dùng cần được xử lý cẩn trọng. Các vấn đề đạo đức xung quanh hình ảnh do AI tạo ra không thể bị bỏ qua. Nếu những hình ảnh cực kỳ chân thực đó được gửi từ những người, công ty hoặc địa điểm quen thuộc trên mạng xã hội, liệu có ai bị đánh lừa không?
03. Kết luận: Ngành công nghiệp hình ảnh do AI tạo ra đã đạt đến tầm cao mới, nhưng cũng cần có quy định và quản trị.
Với nhu cầu ngày càng tăng đối với hình ảnh do AI tạo ra, sự ra mắt của ChatGPT Images 2.0 chắc chắn đã đưa toàn bộ ngành công nghiệp lên một tầm cao mới, với những cải tiến đáng kể về độ rõ nét của hình ảnh, khả năng tái tạo chi tiết, sự đa dạng về phong cách và sự tự do sáng tạo.
Tuy nhiên, cùng với sự phát triển của khả năng công nghệ, ngành công nghiệp này cũng phải đối mặt với những thách thức mới, bao gồm bảo vệ bản quyền, kiểm duyệt nội dung và rủi ro đạo đức liên quan đến nội dung được tạo ra.
Nhiều "hình ảnh kỳ diệu" do AI tạo ra trông rất thật đến mức có thể bị nhầm lẫn với hình ảnh thật. Ví dụ, chúng có thể được lấy từ các thông tin thường ngày như họp báo, ảnh chụp màn hình mạng xã hội và video phát trực tiếp. Nếu những hình ảnh này lượng lớn là ảnh giả do AI ngụy tạo, thật khó tưởng tượng có bao nhiêu người sẽ bị đánh lừa.
Sự phát triển trong tương lai không chỉ đòi hỏi những tiến bộ trong thuật toán, mà còn cần tuân thủ các tiêu chuẩn ngành và chiến lược ứng dụng bền vững.
Có thể dự đoán rằng với sự tối ưu hóa cả công nghệ và quản trị, hình ảnh do AI tạo ra sẽ đóng vai trò lớn hơn trong thiết kế sáng tạo, giáo dục và đào tạo, nội dung giải trí và nhiều lĩnh vực khác.
Bài viết này được đăng tải từ tài khoản WeChat công cộng "Zhidongxi" (ID: zhidxcom) , tác giả: Bi Weihua, biên tập viên: Moying, với sự cho phép của 36Kr.




