Ứng dụng chỉnh sửa ảnh bằng AI đã được ra mắt; thử nghiệm thực tế sử dụng GPT để chỉnh sửa ảnh: kết quả chỉ mất 5 phút, "hơi quá mức cần thiết" nhưng nó thực sự hiệu quả.

Bài viết này được dịch máy
Xem bản gốc
Xiao Lei đã thử nghiệm chức năng chỉnh sửa ảnh Images 2.0 của ChatGPT và kết quả thật bất ngờ. Trí tuệ nhân tạo (AI) đã phân tích chính xác ảnh của các cosplayer tại các hội nghị anime, nhanh chóng thực hiện các thao tác như điều chỉnh ánh sáng và bóng tối, xóa bối cảnh và cắt khuôn mặt. Trong thử nghiệm, ChatGPT đã biến một bức ảnh chỉnh sửa kém chất lượng thành một bức ảnh được chỉnh sửa chuyên nghiệp chỉ trong 4 phút. Nó cũng có thể vẽ lại các chi tiết trang phục dựa trên bối cảnh, cho phép cosplayer ngay lập tức "di chuyển" đến một địa điểm được chỉ định. Xiao Lei cho rằng rằng mặc dù việc chỉnh sửa ảnh bằng AI đôi khi có thể gặp trục trặc, nhưng hiệu quả và sự tiện lợi của nó vượt xa các phần mềm chỉnh sửa ảnh truyền thống. Gói thành viên trị giá 19,99 đô la có thể thay thế các dịch vụ chỉnh sửa ảnh đắt tiền tại các studio, và dự kiến ​​người dùng thông thường sẽ có xu hướng sử dụng chỉnh sửa ảnh bằng AI trong tương lai.

Tác giả và nguồn bài viết: Lei Technology

Trước khi bài kiểm tra chính thức bắt đầu, tôi đã nghĩ đến nhiều kết quả có thể xảy ra, chẳng hạn như khả năng chỉnh sửa ảnh bằng AI sẽ cực kỳ mạnh mẽ hoặc cực kỳ tệ hại, nhưng tôi thực sự không ngờ nó lại hài hước đến mức này.

Lý do viết bài này là vì Tiểu Liễu vô tình tìm thấy những bức ảnh được chụp tại một hội chợ truyện tranh. Nhìn vào hàng trăm bức ảnh trong thư mục, mặc dù muốn chỉnh sửa nhưng cậu ấy đã rất kinh hãi khi nghĩ đến khối lượng công việc cần phải làm.

Nghĩ đến điều này, Tiểu Lôi chợt nhớ đến Images 2.0, ứng dụng mà ChatGPT ra mắt gần đây. Chắc hẳn ai cũng biết đến khả năng "tạo ra cái gì đó từ không có gì" của nó. Vậy câu hỏi đặt ra là, Images 2.0 có thể giúp tôi chỉnh sửa ảnh mà không làm thay đổi ảnh gốc không?

Sau khi suy nghĩ kỹ và thực hiện, Xiao Lei lập tức chọn ra một vài bức ảnh phù hợp để xem ChatGPT có thể chỉnh sửa chúng giúp anh ấy như thế nào.

Chỉnh sửa ảnh bằng AI đôi khi có thể không ổn định, nhưng thực tế vẫn có thể sử dụng được.

Trước tiên, hãy cùng xem hình ảnh gốc.

Nguồn ảnh: Lei Technology

Những người thường xuyên tham dự các hội nghị anime đều biết rằng rất hiếm khi thấy những người hóa trang có chất lượng như thế này trong những bức ảnh chưa chỉnh sửa được chụp bằng máy ảnh không gương lật. Tuy nhiên, do các vấn đề như ánh sáng tại sự kiện và góc chụp của nhiếp ảnh gia, những bức ảnh này khó có thể được coi là "đẹp mắt".

Thông thường, hầu hết mọi người sẽ mở Lightroom và điều chỉnh các thông số như độ phơi sáng. Thực tế, tôi cũng vậy. Khi nào cảm thấy lười biếng, tôi sẽ chỉ sử dụng chức năng điều chỉnh tự động. Sau khi tinh chỉnh các thông số thủ công, bạn có thể thấy rằng độ sáng và bóng tối tổng thể của hình ảnh đã được cải thiện đáng kể.

Nguồn ảnh: Lei Technology

Tôi mất khoảng 5 phút để chỉnh sửa bức ảnh này, và thành thật mà nói, tôi không hài lòng lắm. Nó chỉ ở mức "chấp nhận được" thôi.

Sau đó, tôi để ChatGPT tiếp quản và xem nó sẽ chỉnh sửa ảnh như thế nào.

Trước tiên, tôi sẽ đưa ra hướng dẫn của mình: Tôi sẽ tải lên một số ảnh và tôi cần bạn, với tư cách là một biên tập viên ảnh chuyên nghiệp, giúp tôi chỉnh sửa và tối ưu hóa chúng để đáp ứng các tiêu chuẩn xuất bản thương mại (bạn có thể tối ưu hóa chi tiết khuôn mặt, nhưng không nên chỉnh sửa quá nhiều).

ChatGPT chỉ đơn giản nói "Tôi hiểu" và liệt kê một loạt các nguyên tắc xử lý:

Nguồn ảnh: Lei Technology

Có vẻ như tiềm năng đấy? Tiếp theo, tôi đã tải ảnh gốc lên và thông báo cho ChatGPT theo yêu cầu rằng ảnh đó là "ảnh sự kiện trực tiếp".

Nguồn ảnh: Lei Technology. Lưu ý: Những suy nghĩ ngẫu nhiên của ChatGPT trong quá trình chỉnh sửa ảnh.

Sau đó ChatGPT đã gửi cho tôi bức ảnh này.

Nguồn ảnh: Lei Technology

Không, cô là ai vậy, cô gái?

Mặc dù nhìn kỹ hơn sẽ thấy có chút tương đồng về hình dáng khuôn mặt với người trong bức ảnh được tải lên, nhưng việc chỉnh sửa quá đà khiến Xiao Lei bật cười. Điều khó hiểu hơn nữa là chiếc micro mà người đó đang cầm, có logo "Toutiao", cho thấy hình ảnh tham khảo của ChatGPT là ảnh chụp từ một sự kiện của Toutiao.

Rõ ràng, khi yêu cầu của bạn quá mơ hồ, AI luôn có thể giao cho bạn một nhiệm vụ hoàn toàn mới, vì vậy tôi tiếp tục đưa ra các hướng dẫn mới, yêu cầu ChatGPT tinh chỉnh các thông số như ánh sáng và bóng tối mà không làm thay đổi chủ thể chính của bức ảnh.

Sau đó, nó cho tôi hình này (hình này được ghép lại với hình trước đó để dễ so sánh).

Nguồn ảnh: Lei Technology. Lưu ý: Ảnh bên trái thể hiện quá trình sửa chữa thủ công, ảnh bên phải thể hiện quá trình sửa chữa bằng AI.

Thành thật mà nói, trông khá ổn. Sau khi AI xử lý, nó đã tăng độ sáng tổng thể của nhân vật, làm cho màu da sạch hơn và điều chỉnh nhẹ màu hồng của tóc để trông dễ chịu hơn. Toàn bộ nhân vật trông như thể "nổi bật" giữa đám đông.

Sự tương phản trên khuôn mặt đặc biệt nổi bật. Không chỉ các điểm sáng được điều chỉnh hoàn hảo, mà cả vùng bóng hồng nhạt ban đầu trên khuôn mặt cũng được tăng cường. Kết hợp với màu tóc được làm nổi bật hơn, các đường nét nhân vật trở nên rõ nét hơn. Thành thật mà nói, với hiệu ứng được chỉnh sửa bằng AI này, nếu nó được dùng làm ảnh quảng cáo cho một cosplayer thì sẽ chẳng ai phản đối cả.

Sau đó, Xiao Lei thử chụp một bức ảnh khác.

Nguồn ảnh: Lei Technology

Hình ảnh gốc có khá nhiều khuyết điểm, điểm cộng duy nhất là vẻ ngoài xinh đẹp tuyệt vời của người hóa trang. Vậy trí tuệ nhân tạo sẽ xử lý nó như thế nào?

Nguồn ảnh: Lei Technology

Đúng như dự đoán, việc chỉnh sửa bao gồm điều chỉnh độ phơi sáng và cân bằng trắng, nhưng lần sê-ri những người qua đường đã được "loại bỏ", và tư thế của người trong ảnh được thay đổi một chút, trông năng động hơn (lưu ý vị trí của phụ kiện trên tay trái). Thành thật mà nói, hiệu ứng của bức ảnh này thậm chí còn bất ngờ hơn. Không chỉ đơn thuần là thay đổi các thông số, AI còn biết cách loại bỏ bối cảnh và điều chỉnh tư thế của người trong ảnh, và thoạt nhìn, không có gì bất thường.

Phải nói rằng, đối với những bức ảnh này, vốn được chụp và bố cục khá tốt, AI về cơ bản có thể xử lý hoàn toàn. Bạn chỉ cần cho AI biết hướng chỉnh sửa của mình, và nó có thể tạo ra kết quả chính xác khoảng 80-90%. Tuy nhiên, hai bức ảnh trên thậm chí không đủ điều kiện để được coi là bài tập thực hành cho một người chỉnh sửa ảnh chuyên nghiệp, vì vậy hãy tăng độ khó lên một chút.

ChatGPT thật tuyệt vời!

Hình ảnh dưới đây khá trừu tượng vì sân khấu chính thức chật kín người, và Xiao Lei chỉ có thể chụp ảnh từ xa. Không có thời gian để tinh chỉnh cài đặt máy ảnh, và việc đảm bảo ảnh không bị mờ đã là giới hạn. Những bức ảnh như vậy thường được coi là không thể sử dụng được. Vậy AI sẽ xử lý việc này như thế nào?

Nguồn ảnh: Lei Technology

Dưới đây là một số tác phẩm của ChatGPT:

Nguồn ảnh: Lei Technology

Trí tuệ nhân tạo (AI) trước tiên tập trung trực tiếp vào chủ thể chính, sau đó thực hiện cắt xén ảnh siêu cấp, loại bỏ bối cảnh xung quanh. Cuối cùng, nó tăng độ phơi sáng tổng thể của chủ thể còn lại, tinh chỉnh vùng sáng và vùng tối, làm nổi bật khuôn mặt của chủ thể và đảm bảo rằng ảnh không bị phơi sáng quá mức.

Thành thật mà nói, khả năng của ChatGPT đã vượt quá mong đợi của tôi trong quá trình thử nghiệm. Ban đầu tôi nghĩ nó chỉ điều chỉnh các thông số ảnh như bình thường, nhưng tôi không ngờ nó lại cắt xén ảnh nhiều và chỉnh sửa ảnh theo gu thẩm mỹ và thao tác thông thường của con người. Có thể nói rằng nếu bạn không có ảnh khác để thay thế, thì việc sử dụng bức ảnh này để tạo thành một "lưới chín ô" hoàn toàn không thành vấn đề.

Hãy xem lại bức ảnh này. Đây là một bức ảnh hoàn toàn không thể sử dụng được vì tôi tình cờ nhìn thấy nó khi đang đi ngang qua hành lang trong lúc chuyển cảnh. Tôi đã bấm nút chụp trước khi kịp điều chỉnh cài đặt máy ảnh (ánh sáng bên trong địa điểm không đủ, và có ánh nắng trực tiếp chiếu vào hành lang), khiến cho người hóa trang trông như sắp thăng thiên ngay tại chỗ.

Nguồn ảnh: Lei Technology

Liệu trí tuệ nhân tạo có thể cứu vãn được một hình ảnh bị lỗi như vậy? Trước tiên, hãy xem kết quả của việc chỉnh sửa hình ảnh theo các hướng dẫn trước đó:

Nguồn ảnh: Lei Technology

Chúng ta chỉ có thể nói rằng ChatGPT đã cố gắng cứu vãn bức ảnh, nhưng không thành công. Khuôn mặt không còn bị đen nữa, nhưng độ sáng tổng thể của bức ảnh khiến nó trông như thể Tiểu Liễu sắp bị "ánh sáng thần thánh" chiếu vào.

Sau đó, Xiao Lei quyết định thay đổi yêu cầu: Hãy cố gắng hết sức để bức ảnh trông đẹp, nhưng hãy cẩn thận đừng thay đổi khuôn mặt, cố gắng làm cho quần áo và phụ kiện càng giống thật càng tốt, và bạn có thể thay thế bối cảnh.

Sau đó tôi chụp được bức ảnh này:

Nguồn ảnh: Lei Technology

Tôi chỉ có thể nói rằng hiệu ứng này thật tuyệt vời! ChatGPT thật sự ấn tượng.

Chỉ trong 4 phút, ChatGPT không chỉ hoàn thành việc cắt ghép hình người mà còn vẽ lại chi tiết trang phục, tìm một bối cảnh phù hợp để thay thế, và cuối cùng thậm chí còn làm cho khuôn mặt của người cosplay hướng về phía nhiếp ảnh gia, hiệu quả có thể so sánh với "Hoa Đà tái sinh".

Chưa hài lòng với chỉ một bức ảnh, Xiao Lei quyết định thử chụp thêm một bức nữa:

Nguồn ảnh: Lei Technology

Chỉ với một lệnh đơn giản, Kamen Rider trong hội chợ truyện tranh đã lập tức "dịch chuyển tức thời" đến trung tâm chiến trường. Trí tuệ nhân tạo thậm chí còn tinh tế giảm bớt độ sáng trên bộ giáp dựa trên bối cảnh, khiến tổng thể trông chân thực hơn.

Nếu hơn 20.000 người chơi cosplay nói trên nhận được ảnh của Xiao Lei, họ có lẽ sẽ rất ngạc nhiên: "Tôi đã chụp những bức ảnh được chỉnh sửa chuyên nghiệp này từ khi nào vậy?"

Liệu phần mềm chỉnh sửa ảnh dựa trên trí tuệ nhân tạo sẽ thay thế phần mềm chỉnh sửa ảnh truyền thống trước tiên?

Đến thời điểm này của bài kiểm tra, tôi đã đi đến kết luận: những người chỉnh sửa ảnh chuyên nghiệp có thể sẽ phải đối mặt với tương lai thất nghiệp. Mặc dù trí tuệ nhân tạo hiện tại chưa thể thực hiện chỉnh sửa khuôn mặt phức tạp, nhưng việc tạo ra những bức ảnh chất lượng studio lại rất dễ dàng. Chỉ cần nhìn vào hai bức ảnh trên; bạn có thể tính toán chi phí cần thiết cho chụp ảnh thương mại.

Vậy chi phí của Xiao Lei là gì? Phí thành viên ChatGPT là 19,90 đô la, và vài phút tải lên cùng thời gian chờ đợi, trong thời gian đó tôi có thể làm những việc khác mà không cần phải xem xét kỹ lưỡng từng chi tiết và điều chỉnh thông số.

Do đó, đối với người bình thường, xu hướng tương lai sẽ là để AI chỉnh sửa ảnh cho họ, bởi vì họ đơn giản là không có đủ năng lượng để học toàn bộ logic chỉnh sửa và cách vận hành phần mềm. Suy cho cùng, điều mọi người thực sự muốn rất đơn giản: Tôi đã chụp một bức ảnh, hãy giúp tôi làm cho nó trông đẹp hơn, tôi muốn đăng nó lên mạng xã hội, và giới hạn trên của việc chỉnh sửa ảnh bằng AI rõ ràng không chỉ giới hạn ở việc "đăng lên mạng xã hội".

Theo Xiao Lei, quy trình sáng tạo nhiếp ảnh trong tương lai sẽ hoàn toàn thay đổi. Bối cảnh và chuyển động nhân vật có thể không còn cần thiết. Chỉ cần bạn ăn mặc đủ đẹp, AI có thể đưa bạn đến khắp nơi trên thế giới, hoặc thậm chí một thế giới khác, mà không cần chỉnh sửa khuôn mặt, để đáp ứng mọi nhu cầu chụp ảnh cosplay của bạn.

Tại thời điểm này, tôi thực sự muốn nói với các cosplayer và nhiếp ảnh gia: thời thế đã thay đổi.

Mặc dù các nhiếp ảnh gia chuyên nghiệp vẫn có những lợi thế nhất định, chẳng hạn như gu thẩm mỹ độc đáo và khả năng hướng dẫn bố cục tại chỗ, nhưng vấn đề đau đầu lớn nhất có lẽ là số lượng phần mềm chỉnh sửa ảnh quá nhiều. Đối với người bình thường, việc dành hàng giờ trong Lightroom kém hiệu quả hơn so với việc chỉnh sửa bằng AI chỉ trong ba phút – một thực tế ngày càng trở nên rõ ràng.

Mặc dù các công cụ chỉnh sửa ảnh bằng AI đôi khi có thể gặp trục trặc, nhưng khi một công cụ tiện lợi, nhanh chóng và cho kết quả khá tốt trong hầu hết các trường hợp, người dùng thường sẽ không từ bỏ nó chỉ vì những lỗi nhỏ. Thay vào đó, họ có thể sẽ phàn nàn về nó trong khi vẫn tiếp tục sử dụng.

Đây chính là điều khiến việc chỉnh sửa ảnh bằng AI trở nên thực sự đáng sợ.

Bài viết này được đăng tải trên trang "Lei Technology" với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
50
Thêm vào Yêu thích
10
Bình luận