Tuần này tôi đã nhìn thấy một số thứ kỳ lạ: những người phụ nữ có râu, những con tuần lộc sáu chân và một anh chàng lái ô tô với đầu thò ra ngoài kính chắn gió. Nhưng không có hình ảnh nào trong số đó là thật. Tôi đang thử nghiệm các trình tạo hình ảnh AI để tìm kiếm ứng dụng yêu thích và lựa chọn hàng đầu của tôi có thể được cài đặt trên các điện thoại Android hàng đầu.
Trình tạo hình ảnh AI biến lời nhắc văn bản thành hình ảnh. Mức độ phổ biến của chúng tăng vọt vào năm 2022 khi các mô hình AI chuyển văn bản thành hình ảnh như DALL-E, MidJourney và Stable Diffusion thu hút sự chú ý của cộng đồng công nghệ. Những thứ này vẫn còn tồn tại và đã được cải thiện, nhưng tôi yêu thích nhất là Google Gemini.
Gemini là chatbot AI của Google và tôi đã thử nghiệm khả năng tạo hình ảnh của nó cùng với chín lựa chọn thay thế. Mặc dù chưa hoàn hảo nhưng đó là điều tôi hài lòng nhất. Nó rất đơn giản để sử dụng và tạo ra những hình ảnh thuyết phục chỉ với một vài lần lặp lại.
Trình tạo hình ảnh Gemini AI có thể làm gì?
Và những gì nó không thể trừ khi bạn trả tiền
Để tạo hình ảnh, hãy mở ứng dụng Gemini trên điện thoại của bạn hoặc truy cập Google Gemini trên web. Sau đó, nhập lời nhắc của bạn và một hình ảnh sẽ xuất hiện sau đó một lát.
Không giống như các lựa chọn thay thế, Gemini tạo hình ảnh miễn phí. Tuy nhiên, chỉ những người đăng ký Gemini Advanced mới có thể yêu cầu hình ảnh của mọi người. Khả năng hình dung con người đã bị loại bỏ khỏi Gemini vào đầu năm 2024 sau nhiều tranh cãi nhưng đã được cải thiện và đưa trở lại. Người dùng trả phí và miễn phí sẽ có được hình ảnh có độ phân giải cao (2.048 x 2.048 pixel) được tạo bởi cùng một mô hình AI, Imagen 3 của Google.
Gemini bị chặn tạo hình ảnh có trẻ em hoặc những người có thể nhận dạng được như người nổi tiếng. Các yêu cầu về nội dung bạo lực, tình dục hoặc gây rối sẽ không được xử lý. Trang Chính sách sử dụng bị cấm của Google đề cập đến các cách mà việc sử dụng AI tổng hợp của nó là không ổn.
Có liên quan
Cách dùng Gemini tạo ảnh AI trong Google Slides
Tạo hình ảnh đi kèm cho bài thuyết trình của bạn chỉ trong vài giây
Các lựa chọn thay thế cho hình ảnh AI của Song Tử là gì?
Nguồn: Adobe
Có hàng tá trình tạo hình ảnh AI, nhưng các lựa chọn thay thế có khả năng cho Gemini đều đến từ những cái tên bạn đã từng nghe trước đây. ChatGPT và Microsoft Nhà thiết kế tận dụng mô hình AI DALL-E 3 và cung cấp cho bạn một số hình ảnh miễn phí mỗi ngày. Theo kinh nghiệm của tôi, hình ảnh của Song Tử chân thực và chính xác hơn. Firefly của Adobe đáng được cân nhắc vì những hình ảnh hư cấu và nghệ thuật. Nó sẽ sụp đổ khi bạn yêu cầu bất cứ điều gì đòi hỏi một con người có vẻ ngoài thực tế.
Stable Diffusion, MidJourney và Flux.1 là những đối thủ xứng tầm nhất của Gemini, đặc biệt là đối với các ứng dụng chuyên nghiệp. Tuy nhiên, tôi không thể kiểm tra chúng kỹ lưỡng như tôi muốn. Tuy nhiên, kết quả có vẻ đầy hứa hẹn và có thể sánh ngang hoặc vượt quá khả năng của Gemini trong một số mục đích sử dụng nhất định.
Điều này khiến Gemini trở thành trình tạo hình ảnh AI yêu thích của tôi
Nó không chỉ là nó miễn phí để thử
Những hình ảnh trên được tạo bằng Google Gemini.
Gemini làm tôi nhớ đến Google Tìm kiếm trong những ngày hoàng kim của nó. Tôi nhập yêu cầu của mình, nhấn Enter và nhanh chóng nhận được kết quả mà không gặp rắc rối hay phiền nhiễu. Sự đơn giản và dễ sử dụng là một trong những lý do hàng đầu khiến tôi thích Gemini. Tôi cũng thích chất lượng cao của hình ảnh được tạo ra. Thường xuyên hơn không, tôi nhận được những gì tôi mong đợi. Khi tôi không làm như vậy, thật dễ dàng để yêu cầu sửa đổi, vì Song Tử sẽ mặc định xem xét các lời nhắc trước đó.
Song Tử mắc sai lầm và có những sai sót. Ví dụ, nó không thể đếm hoặc đánh vần tốt. Bạn sẽ gặp khó khăn để có được con số chính xác của nội dung nào đó hoặc bất kỳ văn bản nào trong hình ảnh được tạo mà không có lỗi. Tôi nhận thấy rằng hầu hết các trình tạo hình ảnh AI đều gặp khó khăn trừ khi chúng được tối ưu hóa cho công việc (như Ideogram dùng để tạo văn bản).
Tôi không coi Gemini là công cụ tạo hình ảnh lý tưởng cho một ứng dụng cụ thể, nhưng tôi tin rằng nó phù hợp cho nhiều mục đích sử dụng tại nhà và cơ quan. Dưới đây là một số điều tôi nghĩ đến:
- Cần hình ảnh hoặc clip art cho trang web hoặc bản trình bày? Song Tử sẽ lấp đầy những khoảng trống nếu các trang web hình ảnh có sẵn không có thứ bạn muốn.
- Các nhà hoạt hình và nhà phát triển trò chơi có thể sử dụng Gemini để tạo họa tiết và hình nền hoặc hình dung nhanh chóng ý tưởng nghệ thuật.
- Kiến trúc sư và nhà thiết kế có thể xem trước ý tưởng về sự kết hợp màu sắc hoặc vật liệu, sản phẩm hoặc cách sắp xếp phòng.
- Các chuyên gia tiếp thị có thể tạo ra đồ họa thu hút sự chú ý cho các chiến dịch.
- Giáo viên có thể làm đồ dùng trực quan cho các môn học hoặc biên soạn sách tô màu cho trẻ nhỏ.
- Các doanh nhân có thể tạo ra hình ảnh AI để bán trên áo sơ mi hoặc cốc trong cửa hàng của họ.
- Tạo hình nền hoặc thiệp chúc mừng mới mà không ai khác có.
Một yếu tố khác có lợi cho Gemini là việc tạo hình ảnh được sử dụng miễn phí miễn là bạn không muốn có người trong thiết kế của mình. Đối với nhiều người, đó sẽ là lần tiếp xúc đầu tiên của họ với việc chuyển văn bản thành hình ảnh. Cảm ơn Google vì đã tạo ra một công cụ hữu ích có thể truy cập rộng rãi.
Có liên quan
Google Gemini so với Gemini Advanced: Giải thích tất cả những khác biệt chính
Gemini Advanced có thể làm gì tốt hơn và nó có đáng giá không?
Google Gemini và AI có thể thay đổi mãi mãi cách chúng ta sáng tạo
Tôi cảm thấy mình giống như một đứa trẻ đang thả mình trong cửa hàng kẹo khi thử nghiệm Google Gemini và các công cụ tạo hình ảnh thay thế. Đó là một thế giới mới với những khả năng mới có thể thay đổi cách chúng ta làm việc, vui chơi và thể hiện bản thân.
Việc tạo hình ảnh AI của Gemini có những giới hạn và các đối thủ của nó cũng vậy. Tuy nhiên, không phải tất cả chúng đều có quy trình dễ tiếp cận, đơn giản và kết quả thuyết phục mà tôi đã thấy với Gemini. Điều này mang lại lợi thế cho nó trong cuốn sách của tôi và thật thú vị khi xem chúng ta sẽ đi được bao xa nếu AI được cho thêm vài năm nữa để phát triển.