Gặp gỡ Recraft V3: Trình tạo hình ảnh AI tốt nhất mà bạn chưa từng nghe đến

avatar
Decrypt
11-02
Bài viết này được dịch máy
Xem bản gốc

Hãy gạt Flux và MidJourney sang một bên: Có một đối thủ mới vừa vươn lên dẫn đầu bảng xếp hạng tạo hình ảnh AI. Một mô hình bí ẩn trước đây được gọi là Red Panda—khiến những người theo dõi AI phải đau đầu trên bảng xếp hạng của Artificial Analysis—cuối cùng đã tiết lộ chính nó là Recraft V3, một bản phát hành mới từ một công ty khởi nghiệp ít người biết đến ở London.

Mô hình này đạt điểm cao nhất trong hệ thống xếp hạng ELO dành cho máy tạo hình ảnh, vượt trội hơn Flux 1.1 Pro và MidJourney. Về mặt hiệu quả, Recraft V3 ngang bằng tốc độ tạo hình của SDXL là dưới 10 giây trong khi vẫn mang lại chất lượng hình ảnh vượt trội mà các bài kiểm tra mù chỉ ra.

Trong bốn ngày thử nghiệm chuẩn, Recraft V3 đã chứng minh được sự vượt trội về chất lượng tạo văn bản, độ chính xác về mặt giải phẫu và khả năng hiểu nhanh. Đây là mô hình duy nhất có khả năng tạo hình ảnh với các đoạn văn bản mở rộng, vượt xa khả năng tích hợp từ hoặc cụm từ đơn giản.

Trên thực tế, nó tốt đến nỗi ngay cả cựu nhà nghiên cứu AI ổn định JOE Penna, người đã làm việc phát triển SDXL —vua không thể tranh cãi của thế hệ hình ảnh nguồn mở cho đến khi Flux xuất hiện—cũng đã công khai ca ngợi mô hình này trên máy chủ Discord của công ty.

“Ồ! Mẫu mới tuyệt vời quá, Recraft,” anh ấy nói, “Tôi rất ấn tượng.”

Bạn có thể chưa từng nghe về nó, trừ khi bạn thực sự đam mê AI tạo sinh hoặc thiết kế kỹ thuật số, nhưng công ty khởi nghiệp Recraft AI của London được thành lập vào năm 2022 và bắt đầu như một công ty chuyên về các công cụ hỗ trợ AI dành cho nhà thiết kế đồ họa thay vì tạo hình ảnh chung. Quỹ đạo của công ty đã thay đổi sau khi nhận được 11 triệu đô la tiền tài trợ từ những công ty như Khosla Ventures và cựu CEO của GitHub, Nat Friedman, vào đầu năm nay.

Recraft V3 nổi trội trong việc tạo ra hình ảnh chân thực, xử lý các chi tiết và khuyết điểm tốt với độ chính xác đáng chú ý và hoạt động theo mô hình đăng ký tương tự như MidJourney, Leonardo hoặc Ideogram.

Thiết kế kỹ thuật số là cốt lõi trong các giá trị của Recraft. Mô hình này cũng có khả năng xử lý văn bản thành thế hệ vector, nghĩa là người dùng có thể nhắc mô hình tạo ra hình ảnh có thể được nâng cấp vô hạn mà không làm giảm chất lượng.

Người dùng miễn phí nhận được 50 tín dụng hàng ngày, đủ cho 50 hình ảnh. Tuy nhiên—và đây là mô hình kinh doanh mới, người dùng không giữ quyền sở hữu đối với các sáng tạo của họ. Quyền đó dành riêng cho người đăng ký trả phí, với các gói bắt đầu từ 10 đô la hàng tháng cho 1.000 tín dụng.

Người dùng có thể truy cập Recraft V3 thông qua ba kênh: giao diện web, lệnh Discord hoặc ứng dụng di động có sẵn trên iOS và Android.

Hãy mở Discord, tham gia máy chủ Recraft và bạn sẽ thấy mình đang ở trong vùng đất quen thuộc nếu bạn đã từng sử dụng MidJourney. Hãy đến kênh #image-gen, nhập /recraft và xem điều kỳ diệu xảy ra.

Bạn cũng có thể sử dụng các trình sửa đổi khác nhau sau lời nhắc. Bạn muốn một kiệt tác màn ảnh rộng? Thêm vào -- AR 16:9. Bạn cần một bức chân dung? Nhập -- AR 3:4, và nó sẽ hỗ trợ bạn.

Các bổ sung hữu ích khác là lệnh --style cho phép người dùng chọn hình ảnh cụ thể của thế hệ họ, dù là ảnh chân thực, 3D hay thậm chí là kawaii. Bạn có hình ảnh cụ thể nào trong đầu không? Lệnh --sref cho phép bạn tải lên hình ảnh tham chiếu để hướng dẫn tầm nhìn nghệ thuật của AI.

Sau khi hình ảnh được tạo ra, người dùng có thể chọn hình ảnh mà họ thích nhất giữa 2 thế hệ và sau đó họ có thể lưu hoặc phóng to nó lên gấp 4 lần kích thước của nó

Giao diện web tại recraft.ai có một số sức mạnh đáng kể. Để bắt đầu, chỉ cần truy cập Recraft.AI và đăng nhập.

Khi vào giao diện tạo hình ảnh, người dùng chỉ cần đặt lời nhắc vào hộp văn bản ở bên trái.

Chúng cũng có thanh trượt để thay đổi tỷ lệ khung hình và số lượng hình ảnh.

Người dùng cũng có thể thay đổi kiểu bằng cách nhấp vào nút có biểu tượng ở trên cùng của hộp văn bản và chọn tùy chọn ưa thích từ menu bật lên có nhiều ví dụ.

Giao diện phức tạp hơn nhiều so với các trang web khác và ngay từ cái nhìn đầu tiên đã thấy rõ ràng rằng nó nhắm đến các nhà thiết kế. Nó cho phép người dùng tạo khung, mô hình sản phẩm, bộ hình ảnh, xử lý nền, vector hóa hình ảnh, ETC

Những người sáng tạo trên thiết bị di động không bị lãng quên. Các ứng dụng chính thức trên iOSAndroid đều có sẵn, cung cấp các thế hệ chất lượng như nhau. Chỉ cần tải xuống ứng dụng, đăng nhập, nhấp vào nút giữa trên cùng và tạo hình ảnh bằng cách đưa lời nhắc vào hộp văn bản ở phía dưới màn hình và nhấp vào nút tạo

Người dùng có thể chọn mức độ chi tiết của hình ảnh, tỷ lệ khung hình, kiểu dáng và tham chiếu trên cùng một giao diện. Khá trực quan.

Chúng tôi đã thử nghiệm mô hình ở nhiều khu vực khác nhau, cả về phong cách và khả năng kỹ thuật. Sau đây là cách nó so sánh với các đối thủ cạnh tranh—cả mã nguồn mở và mã nguồn đóng.

Yêu cầu: Hình chiếu của từ "Emerge" trên khuôn mặt của một người phụ nữ

Tái chế V3:

Recraft cho thấy sự hiểu biết tốt nhất về kết cấu da tự nhiên, biểu cảm khuôn mặt và ánh sáng môi trường. Hình chiếu có vẻ hòa hợp tốt với làn da và quan trọng là có những khuyết điểm thực sự lỗ chân lông có thể nhìn thấy, các khuyết điểm nhỏ trên da và tóc bay tự nhiên. Biểu cảm chân thực và bối cảnh nền tạo thêm tính xác thực đáng kể.

Sự khuếch tán ổn định 3.5:

SD 3.5 đứng ở vị trí thứ hai. Đây là một cải tiến lớn so với SD3 Trung bình và thậm chí là cả những bản chỉnh sửa SDXL thực tế nhất. Nó cho thấy sự hiện diện mạnh mẽ đầy kịch tính với ánh sáng màu cam và son môi đỏ đậm. Trong khi các đặc điểm trên khuôn mặt được xác định rõ ràng, thì kết cấu da có chất lượng nhân tạo đáng chú ý. Hình chiếu trông giống như một lớp phủ sắc nét hơn và biểu cảm có phần tạo dáng và tổng hợp.

Giữa hành trình:

Như thường lệ, MidJourney tạo ra một diện mạo u ám, điện ảnh với kỹ thuật thực hiện mạnh mẽ. Tuy nhiên, làn da của người phụ nữ có chất lượng bóng, gần như thanh thoát, mặc dù đẹp, nhưng lại kém tự nhiên hơn so với nỗ lực của Recraft. Hình chiếu hòa trộn tốt, nhưng sự hoàn hảo tổng thể của các đặc điểm và kết cấu—và sự thiếu chân thực rõ ràng trong biểu cảm—cho thấy nguồn gốc AI của nó.

Người chiến thắng: Recraft

Gợi ý: Một chú chó đứng trên đỉnh TV hiển thị chữ “Decrypt” trên màn hình. Bên trái là một người phụ nữ mặc vest công sở cầm một đồng xu, bên phải là một chú rô-bốt đứng trên hộp cứu thương. Toàn cảnh trông thật siêu thực

Tái chế V3:

Mô hình này đã thất bại về mặt nhận thức không gian. Tuy nhiên, nó đã đạt được phong cách siêu thực trong toàn bộ bố cục. Đây là sự khác biệt so với các mô hình khác thể hiện sự tuân thủ tuyệt vời và nhận thức không gian trong các yếu tố, nhưng tâm trạng hoặc phong cách chung của cảnh vẫn còn đáng ngờ.

Điều này có thể được coi là một sự đánh đổi tốt đối với một số người vì việc tô màu và chỉnh sửa các thành phần trong một bố cục dễ hơn là thay đổi kiểu dáng toàn bộ hình ảnh. Tuy nhiên, điều quan trọng là phải xem xét đây là một hạn chế lớn khi so sánh với các mô hình khác.

Người chiến thắng: Flux

Gợi ý: Hình minh họa vẽ tay về một con nhện khổng lồ đang đuổi theo một người phụ nữ trong rừng, cực kỳ đáng sợ, đau khổ, khung cảnh tối tăm và rùng rợn, kinh dị, gợi ý về ảnh hưởng của nhiếp ảnh tương tự, phác họa

Mô hình có nhiều kiểu dáng khác nhau để lựa chọn, nhưng chúng tôi đã chọn Recraft RAW cho thế hệ này. Lúc đầu, chúng tôi nghĩ kiểu "vẽ tay" là lựa chọn tốt nhất, nhưng… không, không phải vậy.

Sau khi thử nhiều kiểu cài đặt trước khác nhau, kiểu RAW cũ (kiểu linh hoạt nhất) là lựa chọn phù hợp nhất với nhu cầu của chúng tôi.

So với các mô hình khác, Recraft đã tạo ra một bố cục thú vị và thể hiện chính xác thông điệp chính của cảnh: Một con nhện khổng lồ đang đuổi theo một người phụ nữ. Tuy nhiên, toàn bộ tác phẩm nghệ thuật trông giống một hình minh họa kỹ thuật số hơn là một hình minh họa vẽ tay.

Về mặt thẩm mỹ, mô hình chính xác nhất cho lời nhắc cụ thể này có vẻ là Mô hình khuếch tán ổn định mới nhất, tạo ra hình minh họa vẽ tay và có thể truyền tải nỗi thống khổ của một người phụ nữ đang chạy trốn khỏi một con nhện khổng lồ.

Người chiến thắng: SD3

Thật dễ hiểu tại sao Recraft V3 lại giành được vị trí cao nhất trong Bảng xếp hạng Tạo ảnh. Không giống như các đối thủ cạnh tranh như MidJourney và Flux, thường rơi vào các mẫu cách điệu, dễ đoán—mặt “Flux ” mượt mà hoặc “mặt MidJourney” vô hồn—Recraft thiên về chủ nghĩa hiện thực. Các đầu ra của nó rất hấp dẫn, thể hiện các chi tiết phức tạp như kết cấu da tự nhiên, các khuyết điểm tinh tế và ánh sáng sắc thái. Sự cân bằng thẩm mỹ này, thiên về tính xác thực mà không làm mất đi sự bóng bẩy, mang lại cho Recraft một lợi thế mà các mô hình khác khó có thể sánh kịp.

Chiến lược định giá cũng quan trọng cần cân nhắc. Recraft cung cấp một gói miễn phí với các khoản tín dụng hàng ngày hào phóng và là mô hình duy nhất hỗ trợ tạo văn bản sang SVG, một lợi ích cho các họa sĩ minh họa đang tìm kiếm các vectơ có thể mở rộng, chất lượng chuyên nghiệp. Nó cũng có giá tương tự như gói rẻ nhất của MidJourney—nhưng trừ khi bạn đang tìm kiếm tính thẩm mỹ của MidJourney, Recraft linh hoạt và mạnh mẽ hơn nhiều, vì vậy đây là lựa chọn tốt hơn.

Tuy nhiên, Recraft không hoàn hảo. Khi nói đến các cảnh phức tạp với nhiều yếu tố, nhận thức không gian đôi khi bị hạn chế. Các lời nhắc yêu cầu bố cục chính xác có thể dẫn đến sai lệch nhỏ và người dùng có thể thấy mình đang tô màu hoặc điều chỉnh vị trí nhiều hơn mong đợi. Nhưng đối với những người ưu tiên tính hiện thực và tính linh hoạt, thì thiếu sót này dễ dàng bị bỏ qua.

Ngoài ra, việc người dùng miễn phí không sở hữu tác phẩm của mình cũng có thể là một thiếu sót lớn cần cân nhắc.

Nhìn chung, Recraft V3 có vẻ là lựa chọn nguồn đóng tốt nhất, mang lại giá trị và tính linh hoạt vượt trội ở mức giá phù hợp với ngân sách của người sáng tạo. Đối với bất kỳ ai đang tìm kiếm hình ảnh chân thực chất lượng cao mà không có "giao diện AI" đặc trưng, ​​Recraft là người chiến thắng rõ ràng.

Tuy nhiên, những người có khả năng chạy mô hình AI cục bộ có thể chỉ cần Flux hoặc SD 3.5 là đủ.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
2
Thêm vào Yêu thích
1
Bình luận