Midjourney tăng cường trình chỉnh sửa hình ảnh AI của mình—Đây là cách sử dụng

avatar
Decrypt
08-21
Bài viết này được dịch máy
Xem bản gốc

Midjourney gần đây đã công bố bản cập nhật cho trình chỉnh sửa hình ảnh của mình, khiến giao diện web của nó thậm chí còn mạnh mẽ và hấp dẫn hơn. Giao diện web cho trình chỉnh sửa hiện mạnh mẽ hơn trình chỉnh sửa cũ vẫn có sẵn thông qua Discord, hệ sinh thái gốc của Midjourney. Điều này cũng có vẻ chỉ ra một động thái rộng hơn ở Midjourney khi cố gắng phát triển giao diện riêng của mình như là giao diện để tạo hình ảnh, tương tự như những gì Leonardo hoặc Ideogram đang làm.

Tính năng này cũng đưa Midjourney vào vị trí tốt hơn so với các lựa chọn thay thế khác như trình chỉnh sửa Dall-E của OpenAI , cho phép người dùng sử dụng ngôn ngữ tự nhiên để thực hiện một số inpainting nhưng không cho phép outpainting các tính năng. Ideogram cũng không cho phép outpainting hoặc zooming. Trên thực tế, hiện tại, trình chỉnh sửa AI tạo ra mạnh mẽ nhất là Leonardo —nó vẫn thiếu một số chức năng mà bản nâng cấp Midjourney này cung cấp.

Midjourney mới đây đã bắt đầu cho phép người dùng tùy chỉnh đầu ra của mình, về cơ bản là đào tạo sao chép nhúng hoặc sử dụng LoRA cho một phong cách cụ thể. Để làm như vậy, người dùng chỉ cần chọn hình ảnh họ thích trong các so sánh trực tiếp. Midjourney ghi chú tất cả các hình ảnh mà người đó thích, tìm điểm tương đồng và các yếu tố chung trong mỗi bố cục, sau đó tạo ra một phong cách sẽ thay đổi hoàn toàn các thế hệ sau để phù hợp hơn với sở thích của người dùng.

Đây là tính năng độc đáo mà không có trang web tạo hình ảnh độc quyền nào khác có được và là phương pháp tốn nhiều thời gian và nguồn lực để đạt được với các mô hình cục bộ.

Như đã đề cập, trình chỉnh sửa hình ảnh mới chỉ khả dụng trên giao diện web của Midjourney. Để truy cập, hãy truy cập Midjourney.com , đăng nhập bằng tài khoản Discord hoặc Google của bạn và nhấp vào tab "Tạo" để bắt đầu tạo và chỉnh sửa ảnh của bạn.

Khi bạn ở chế độ “sáng tạo”, hãy viết lời nhắc vào hộp văn bản ở trên cùng—nó sẽ hỏi, “Bạn sẽ hình dung ra điều gì?”

Sau khi viết xong lời nhắc, hãy nhấn “enter” để tạo hình ảnh.

Sau khi tạo hình ảnh trong giao diện người dùng web của Midjourney, bạn có thể truy cập menu công cụ chỉnh sửa bằng cách nhấp vào bất kỳ hình ảnh nào từ tab "Tạo". Thao tác này sẽ mở ra một loạt các tùy chọn để tinh chỉnh và thao tác sáng tạo của bạn.

Chức năng "Vary" tương tự như khả năng "ảnh-sang-ảnh" do các mô hình nghệ thuật AI khác cung cấp. Midjourney sẽ sử dụng hình ảnh gốc làm cơ sở và tạo ra một loạt các biến thể mới tham chiếu đến tác phẩm nghệ thuật ban đầu. Việc chọn tùy chọn "Tinh tế" sẽ làm giảm cường độ khử nhiễu, giúp các thế hệ mới phù hợp hơn với bản gốc. Ngược lại, việc chọn "Mạnh" sẽ làm tăng khả năng khử nhiễu, cho phép mô hình có nhiều tự do sáng tạo hơn để tạo ra các hình ảnh ít bị ảnh hưởng bởi tham chiếu.

Tính năng "Nâng cấp" cho phép người dùng tăng độ phân giải của hình ảnh bằng AI tạo hình, tạo ra hình ảnh chi tiết hơn. Cài đặt "Tinh tế" sẽ giữ hình ảnh được nâng cấp gần với hình ảnh gốc hơn, trong khi "Mạnh" sẽ cung cấp cho mô hình nhiều không gian hơn để đưa thêm các thành phần và thay đổi, mặc dù vẫn duy trì kết nối với tham chiếu.

Tùy chọn "Phối lại" cho phép người dùng tạo nhiều biến thể cho hình ảnh bằng cách sửa đổi lời nhắc, tạo ra kết quả sáng tạo hơn so với một biến thể đơn giản.

Bằng cách nhấp vào tab "Thêm", người dùng có thể chọn tùy chọn "Chạy lại", tùy chọn này sẽ tạo lại hình ảnh mà không bị ảnh hưởng bởi các lần lặp trước.

Bên cạnh đó, nút "Editor" mở khóa toàn bộ bộ công cụ chỉnh sửa được cập nhật của Midjourney, như đã nêu chi tiết trong các phần trước. Đây là nơi diễn ra tất cả sự kỳ diệu của các tính năng mới của Midjourney.

Sau khi nhấp vào nút “Editor”, một giao diện mới sẽ mở ra, với hình ảnh xuất hiện ở giữa màn hình. Từ đây, chúng ta có một vài tùy chọn và thanh trượt sẽ ảnh hưởng đến hình ảnh của chúng ta.

Sau đây là chức năng của từng tùy chọn và cách bạn có thể sử dụng chúng để cải thiện việc tạo hình ảnh.

Một trong những tính năng nổi bật của trình chỉnh sửa Midjourney là công cụ "Xóa", cho phép người dùng xóa hoặc sửa đổi các thành phần cụ thể trong hình ảnh được tạo. Bằng cách nhấp vào nút "Xóa" và chọn khu vực họ muốn thay đổi, sau đó người dùng có thể nhập lời nhắc mới để Midjourney tạo nội dung cập nhật trong khu vực cụ thể đó.

Ví dụ, chúng tôi đã chọn công cụ "Xóa" và tô lên đầu robot vì chúng tôi muốn tạo ra những chiếc mũ dự tiệc.

Sau khi chọn các phần muốn thay đổi, chúng tôi nhập lời nhắc mới nêu rõ các thành phần mong muốn, chẳng hạn như "mũ dự tiệc" và nhấp vào "Tạo" để Midjourney cập nhật hình ảnh cho phù hợp.

Không cần phải quá chi tiết với lời nhắc, ít nhất là về mặt phong cách. Midjourney sẽ hiểu được tính thẩm mỹ tổng thể của hình ảnh của bạn và sẽ tạo ra các yếu tố phù hợp với bố cục. Hình ảnh cuối cùng trông như thế này:

Điều quan trọng cần lưu ý là Midjourney khuyên bạn nên chọn một khu vực lớn hơn một chút so với các thành phần cụ thể mà bạn muốn sửa đổi. Điều này cung cấp cho hệ thống AI đủ bối cảnh để hiểu thành phần và tạo ra các kết quả gắn kết. Nếu khu vực được chọn quá nhỏ, Midjourney có thể gặp khó khăn trong việc tạo ra các đầu ra thỏa đáng hoặc có thể không tạo ra bất kỳ nội dung mới nào cả.

Bổ sung cho công cụ "Xóa" là chức năng "Khôi phục", cho phép người dùng hoàn tác mọi thao tác xóa và khôi phục hình ảnh về trạng thái ban đầu. Quy trình làm việc lặp đi lặp lại này cho phép người dùng thử nghiệm và tinh chỉnh các sáng tạo của mình một cách dễ dàng, mở ra những cấp độ mới trong khả năng thể hiện sáng tạo.

Bên cạnh các công cụ "Xóa" và "Khôi phục", trình chỉnh sửa Midjourney còn có một bộ biểu tượng trực quan để quản lý quá trình chỉnh sửa lặp lại. Điều này tự giải thích, nhưng sau đây là chức năng của từng nút:

Nút "Hoàn tác" (mũi tên chỉ về phía sau) cho phép người dùng hoàn nguyên những thay đổi gần đây nhất, đưa hình ảnh trở lại một bước trước lần chỉnh sửa cuối cùng họ thực hiện.

Chức năng "Làm lại" (mũi tên chỉ về phía trước) thực hiện ngược lại, hoàn tác thao tác "Hoàn tác" trước đó và áp dụng lại chỉnh sửa gần đây nhất.

Nút "Đặt lại" (hai mũi tên chuyển động theo chu kỳ) đưa hình ảnh trở lại trạng thái ban đầu, không thay đổi—về cơ bản là đưa hình ảnh trở lại trạng thái trước khi người dùng bắt đầu quá trình chỉnh sửa.

Những biện pháp kiểm soát đơn giản nhưng hiệu quả này cho phép người dùng thoải mái thử nghiệm, biết rằng họ có thể dễ dàng quay lại hoặc áp dụng lại các thay đổi khi cần.

Trình chỉnh sửa Midjourney cũng có thanh trượt "Scale", có chức năng như một chế độ thu phóng được cá nhân hóa. Bằng cách điều chỉnh tỷ lệ, người dùng có thể mở rộng khung hình của hình ảnh và để Midjourney tạo nội dung mới để lấp đầy không gian có sẵn. Điều này giúp Midjourney khác biệt so với một số đối thủ cạnh tranh độc quyền của mình, vốn không có các tính năng tương tự.

Ví dụ, một cận cảnh của một cặp đôi đang xem một trận bóng đá có thể được thu nhỏ lại để lộ toàn bộ sân vận động đông đúc, với cặp đôi vẫn là tiêu điểm chính. Chức năng thu nhỏ này khác với các kỹ thuật "vẽ ngoài" truyền thống, vì nó không thay đổi kích thước hoặc độ phân giải của chính hình ảnh. Thay vào đó, nó chỉ đơn giản là mở rộng chế độ xem, cho phép Midjourney tạo các thành phần mới để lấp đầy khung vẽ mở rộng.

Hãy cùng xem công cụ này hoạt động như thế nào. Bắt đầu bằng hình ảnh cận cảnh ba chú rô-bốt trong bối cảnh nhà máy, chúng tôi thu nhỏ hình ảnh xuống chỉ còn chiếm 20% không gian canvas.

Sau khi chúng tôi điều chỉnh lời nhắc và nhấp vào "tạo", Midjourney đã tưởng tượng ra một cảnh nhà máy đầy đủ theo cùng một phong cách thẩm mỹ để lấp đầy không gian còn lại.

Điều quan trọng cần lưu ý là khi sử dụng chức năng "Scale", các nghệ sĩ phải đảm bảo rằng họ đã cung cấp lời nhắc chi tiết trước đó. Điều này cung cấp cho Midjourney thông tin cần thiết để tạo nội dung mạch lạc, chất lượng cao để lấp đầy khung vẽ mở rộng. Kết quả cuối cùng trông như thế này:

Bổ sung cho thanh trượt "Scale", trình chỉnh sửa Midjourney cũng cung cấp một bộ nút để điều chỉnh tỷ lệ khung hình của hình ảnh. Thay vì chỉ cắt hình ảnh, tính năng này cho phép người dùng mở rộng hình ảnh để phù hợp với tỷ lệ khung hình cụ thể, chẳng hạn như hướng dọc, với Midjourney tạo ra các thành phần bổ sung cần thiết.

Cũng giống như tỷ lệ, chúng tôi khuyên bạn nên sửa lời nhắc của mình để các thế hệ mới không bị thiếu chất lượng. Trong ví dụ này, chúng tôi đã biến một hình ảnh màn hình rộng (16:9) thành ảnh chân dung (3:4). Để làm cho nó liền mạch, chúng tôi đã sửa đổi lời nhắc của mình, yêu cầu Midjourney cung cấp cho robot của chúng tôi toàn bộ cơ thể và tạo một bảng, và AI đã cung cấp cho chúng tôi kết quả này:

Tương tự như chức năng "Scale", người dùng được khuyên nên tinh chỉnh lời nhắc khi sử dụng các công cụ tỷ lệ khung hình để đảm bảo các thế hệ mới duy trì chất lượng và tính thẩm mỹ mong muốn. Bằng cách kết hợp các điều khiển tỷ lệ khung hình và tỷ lệ khung hình, người dùng có thể dễ dàng điều chỉnh hình ảnh do Midjourney tạo ra theo nhiều định dạng và bố cục phương tiện truyền thông xã hội khác nhau.

Cuối cùng, trình chỉnh sửa MidJourney có thể di chuyển hình ảnh trong bố cục. Bằng cách di chuột qua tâm hình ảnh, người dùng có thể nhấp và kéo hình ảnh đến bất kỳ vị trí mong muốn nào trên canvas.

Tính năng này đặc biệt hữu ích vì nó cho phép người dùng giữ nguyên các thành phần họ muốn giữ trong ảnh trong khi tạo nội dung mới để lấp đầy khoảng trống xung quanh. Ví dụ, nếu người dùng có ảnh cận cảnh của chủ thể mà họ muốn giữ lại nhưng nó được căn giữa, họ có thể định vị lại vùng trung tâm đó sang một bên và yêu cầu Midjourney tạo ra các thành phần nền hoàn toàn mới để bổ sung cho chủ thể chính.

Ngoài ra, bên cạnh thanh trượt “Scale” có một thanh trượt “Brush Size” cho phép người dùng chọn kích thước của vùng sẽ được chọn bởi công cụ “Erase” hoặc “Restore”. Về cơ bản, kích thước càng lớn, bạn sẽ tô càng nhiều vùng chỉ bằng một cú nhấp chuột. Bạn có thể sử dụng kích thước công cụ lớn để chọn vùng và kích thước nhỏ để chọn các thành phần. Ví dụ, nếu bạn muốn thay đổi mũi, một cọ nhỏ sẽ cho phép bạn chọn vùng đó mà không ảnh hưởng đến mắt, trong khi một cọ lớn có thể cho phép bạn dễ dàng chọn toàn bộ khuôn mặt.

Bạn có thể sáng tạo theo ý muốn với giao diện người dùng này, do đó bạn không cần phải thực hiện từng bước một như khi bạn làm với giao diện Discord. Ví dụ, bạn có thể thay đổi tỷ lệ khung hình, di chuyển hình ảnh đến một phần khác của khung vẽ, xóa một số phần của bố cục gốc và thay đổi lời nhắc thành bất kỳ nội dung nào bạn thích —tất cả chỉ trong một lần tạo.

Vì vậy, đừng sợ. Công cụ này khá trực quan và ít khó khăn hơn so với việc xử lý quy trình làm việc của ComfyUI chẳng hạn. Midjourney cũng đang làm việc trên một bản cập nhật mới với mục tiêu là Midjourney v7 trong ít nhất bốn tháng nữa, vì vậy bạn có thể muốn vui vẻ chỉnh sửa hình ảnh của mình trong khi chờ đợi.

Biên tập bởi Ryan Ozawa .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận