Cuối tuần vừa rồi mình nhận 1 chiếc job nhỏ xinh, nhiệm vụ của mình là làm video minh họa cho bài hát Mẹ yêu ơi! với hình ảnh hoàn toàn từ AI. Đây là bài hát mà một bạn nhỏ tiểu học sẽ sử dụng để dự thi hát ở trường. Video dài 5 phút, nội dung được thiết kế bám sát lời bài hát để truyền tải trọn vẹn cảm xúc. Dưới đây là một số hình ảnh mình đã tạo ra cho dự án này.
Với thời gian gấp rút chỉ có 3-4 tiếng để hoàn thiện video, mình đã phải tận dụng tới 2 phần mềm cùng lúc là Ideogram và Midjourney. Trong đó Ideogram mình dùng tài khoản miễn phí, mỗi ngày chỉ có tối đa 10 lượt tạo hình ảnh, mỗi lượt sẽ trả về 4 hình ảnh gần giống nhau. Để hoàn thành video kịp thời gian mình phải xài tới 3 tài khoản Ideogram (tương ứng 3 mail khác nhau). Còn Midjourney mình đã mua gói trả phí Standard nên không giới hạn số lượng, thời gian sử dụng.
Mình đã từng nhắc tới Ideogram tại bài viết Hướng dẫn cách tạo video hoạt hình animation hoàn toàn bằng AI, tại bài viết đó mình đã hướng dẫn cách tạo hình ảnh bằng Ideogram vì thế bài viết này mình không nhắc lại nữa mà chỉ tập trung so sánh ưu và nhược điểm khi sử dụng 2 công cụ này.
Midjourney khá nổi tiếng với khả năng tạo hình ảnh chân thực, sắc nét và đặc biệt nổi trội bởi tính năng đồng bộ khuôn mặt nhân vật. Theo trải nghiệm cá nhân mình thì Midjourney không dễ dùng cho lắm nên mình sẽ làm hẳn một bài hướng dẫn cách sử dụng Midjourney sau, các bạn nhớ theo dõi nhé.
1. Ưu điểm của 2 công cụ tạo hình AI – Ideogram và Midjourney
1.1 Ưu điểm Ideogram
- Miễn phí: Không mất bất kỳ chi phí nào, chỉ với 1 gmail ~ tương đương 1 tài khoản mới, bạn có thể tạo tối da 10 lần/ngày. Mỗi lần gõ prompt, Ideogram trả về 4 hình ảnh với các chi tiết gần giống nhau cho bạn lựa chọn.
- Nhanh chóng: Chưa đầy 1 phút sau khi gõ prompt, Ideogram sẽ trả về 4 hình ảnh tương ứng, khá sát với mô tả prompt mà bạn đưa ra. Nếu chưa đúng ý hãy điều chỉnh thêm prompt để cho ra kết quả sát nhất.
Ví dụ hình 1 mình dùng prompt như sau: “A deeply emotional 3D animated scene of the mother, now 75 years old, lying peacefully in a hospital bed, her face gentle and aged with wisdom. The daughter, now 45 years old, sits beside her mother, holding her hand with one hand and reading softly from a book with the other. The mother gazes at her daughter with a look of profound love and pride, her lips curling into a faint, warm smile. The room is softly lit, creating a tranquil and heartfelt atmosphere, underscoring the enduring bond between mother and daughter.”
Kết quả trả về khá đẹp nhưng khổ nỗi mình muốn tạo hình ảnh bà mẹ và cô con gái là người Châu Á, bức hình lại có nét Tây Tây kiểu Châu Âu vì thế mình đã bổ sung thêm vào prompt như sau: “A deeply emotional 3D animated scene of an elderly Asian mother, now 75 years old, lying peacefully in a hospital bed.…” trong đó đã bổ sung thêm từ khóa “Asian mother” và kết quả trả về như hình 2. Bà mẹ và cô con gái đã có đặc trưng của người Châu Á với làn da, mái tóc và đôi mắt rất có hồn.
- Độ chính xác cao
Không phải AI nào cũng có độ chính xác cao, ví dụ có một cảnh mình prompt đặc tả bàn tay người mẹ và người con nắm chặt nhau thì Midjourney trả về hình ảnh với đôi bàn tay có 6-7 ngón gì đó cơ.
Nói vậy không có nghĩa là Midjourney tạo hình thiếu chính xác hơn Ideogram (Hiện tại Midjourney được đánh giá cao trên thị trường nhờ khả năng tạo ra các hình ảnh phức tạp, chân thực, và nghệ thuật vượt trội.) Chỉ có điều nó không dễ sử dụng như Ideogram mà thôi.
Với cùng prompt này mình bê sang Ideogram và đây là kết quả khiến mình khá hài lòng.
- Dễ sử dụng
Ideogram có giao diện dễ sử dụng. Ngay khi vào trang chủ, bạn chỉ cần gõ prompt vào box “Describe what you want to see” và bấm “Generate” (Các thông số được cài đặt sẵn, hoặc bạn chỉ cần điều chỉnh lại chút xíu là oke). Sau đó chờ 1′ là có ảnh trả về ngay.
1.2 Ưu điểm Midjourney:
- Số lượng hình ảnh tạo ra nhiều hơn, không bị giới hạn 10 lượt/ngày như Ideogram: Để so sánh với Ideogram về vấn đề này cũng hơi khập khiễng, vì một bên mất phí và một bên miễn phí mà. Nên tạm thời bỏ qua yếu tố này nhé. Bật mí tí xíu là gói trả phí của Midjourney thì không rẻ nhưng mình toàn lách luật bằng cách mua TK bên ngoài nên chi phí cũng phần nào đỡ hơn mua trực tiếp từ website.
- Tùy chỉnh từng ảnh dễ dàng: Tương tự Ideogram, Midjourney cũng trả về 4 hình ảnh tương đương prompt đã đưa ra. Bạn có thể bấm vào từng ảnh và tùy chỉnh khuôn mặt, cảm xúc, màu sắc cho từng yếu tố trong ảnh.
- Có nhiều tác vụ chuyên sâu hơn Ideogram: ví dụ như điều chỉnh khuôn mặt nhân vật, đồng bộ khuôn mặt nhân vật,…
MidJourney có khả năng tạo ra các khuôn mặt nhân vật với độ chi tiết cao, từ màu da, ánh mắt, kiểu tóc, đến các biểu cảm phức tạp. Điều này giúp các nhân vật không chỉ sống động mà còn mang đậm nét riêng biệt, dễ gây ấn tượng mạnh.
Khi sử dụng cùng một prompt hoặc kết hợp các tham số điều chỉnh (parameters), các hình ảnh được tạo ra có tính đồng bộ cao. Việc này hơi tốn thời gian một chút nên ở video vừa rồi mình không ứng dụng tới tính năng này, hẹn các bạn ở một bài viết khác sẽ có thành quả để show cho mọi người xem.
2. Nhược điểm của Ideogram và Midjourney là gì?
1.1 Nhược điểm của Ideogram:
- Giới hạn số lượng hình ảnh trong ngày: Với tài khoản miễn phí mình đang sử dụng, mỗi ngày tối đa 10 lượt yêu cầu tạo hình ảnh, mỗi lần sẽ trả về 4 hình ảnh tương đương nhau. Khá vật vã khi số lượng ảnh lớn mình tạo tới 3 tài khoản để tăng số lượng lên. Các bạn có điều kiện thì nên mua tài khoản trả phí nhé, đừng như mình ><
- Không tùy chỉnh từng hình ảnh theo yêu cầu mong muốn
- Chỉ dành cho những nhu cầu tạo hình ảnh cơ bản.
1.2 Nhược điểm của Midjourney:
- Mất phí khá cao: Gói cước trên website chính thức của Midjourney như sau:
Bảng giá trên tính theo năm, vậy ít nhất bạn sẽ chi trả 8$/tháng*12 = 96$/năm để sử dụng gói cơ bản của Midjourney.
Hiện tại mình đang dùng gói Standard nhưng với chi phí 10$/tháng (Mua qua các group). Nếu là một dân chuyên chắc hẳn bạn sẽ không thích cách sử dụng này vì ít nhiều chúng gây ra một số bất tiện trong quá trình sử dụng. Tuy nhiên, nghiệp dư như mình vừa đủ xài và như thế là mình hài lòng rồi.
- Sử dụng phức tạp hơn Ideogram
Có 2 cách sử dụng Midjourney để tạo hình ảnh. Một là truy cập vào trang chủ Midjounrney, giao diện tạo hình ảnh cũng tương tự Ideogram, từ việc gõ prompt và tùy chỉnh các thông số hình ảnh. Tuy nhiên tính năng tùy chỉnh nâng cao từng hình ảnh hạn chế hơn so với cách 2 tạo ảnh bằng nền tảng Discord.
Cách 2, sử dụng nền tảng Discord để tạo hình ảnh, giao diện sẽ như sau:
Discord là nền tảng chính mà MidJourney vận hành, cho phép người dùng tạo hình ảnh trong môi trường cộng đồng năng động. Mỗi người 1 room khác nhau để tạo hình nên không lo bị lẫn lộn. Bạn có thể học hỏi việc tạo hình ảnh, viết prompt từ cộng đồng. Tính năng chỉnh sửa ảnh nâng cao cũng đa dạng, nhiều tùy chọn hơn trên trang chủ. Tuy nhiên giao diện khá khó gần với newbie việc gõ câu lệnh (prompt) cũng phức tạp hơn với các yếu tố được bổ sung vào như –ar (Kích thước ảnh), -cref (mức độ lặp lại trong hình ảnh giá trị từ 0,1-1), –seed, –v, –n, –h1,…. và nhiều thông số khác mà mình cũng chưa xài hết. Mỗi một thông số có giá trị riêng, ý nghĩa riêng.
Để công tâm mà nói thì một đứa yêu thích sự đơn giản như mình sẽ chấm điểm Ideogram cao hơn, trải nghiệm trên Ideogram cũng khiến mình hài lòng hơn. Tuy nhiên, mình tin chắc do năng lực bản thân chưa đủ để khám phá hết tính năng của Midjourney, dẫn tới quá trình trải nghiệm tạo hình ảnh AI bằng Midjourney có phần khó khăn hơn. Mình đã và đang dành thời gian tìm tòi thêm về Midjourney để cho ra những sản phẩm chất lượng hơn trong tương lai. Hy vọng sẽ sớm có một bài viết trên blog để hướng dẫn mọi người sử dụng công cụ này. Nhớ đón đọc nhé!