paint-brush
Hướng dẫn đơn giản về lời nhắc văn bản AI: Cho AI biết chính xác những gì bạn muốn xemtừ tác giả@claidai
17,830 lượt đọc
17,830 lượt đọc

Hướng dẫn đơn giản về lời nhắc văn bản AI: Cho AI biết chính xác những gì bạn muốn xem

từ tác giả Sofiia Shvets6m2023/02/06
Read on Terminal Reader

dài quá đọc không nổi

Lời nhắc để tạo hình ảnh AI là các lệnh, ở dạng văn bản hoặc hình ảnh, cho biết hình ảnh mà nền tảng AI tạo ra. Bạn sẽ tìm thấy hai loại lời nhắc tạo hình ảnh khác nhau: văn bản và hình ảnh. Hầu hết các trình tạo hình ảnh AI mà bạn tìm thấy trên thị trường hiện nay sẽ dựa trên văn bản với một số tùy chọn cho lời nhắc hình ảnh.
featured image - Hướng dẫn đơn giản về lời nhắc văn bản AI: Cho AI biết chính xác những gì bạn muốn xem
Sofiia Shvets HackerNoon profile picture

Hướng dẫn này sẽ trình bày những kiến thức cơ bản về cách làm việc với lời nhắc văn bản và cách bạn có thể sử dụng chúng một cách hiệu quả để hiển thị hình ảnh mà bạn đã hình dung.

mang đi

  • Lời nhắc cho trình tạo hình ảnh AI có thể dựa trên cả văn bản và hình ảnh, và trong một số trường hợp, kết hợp cả hai


  • Cấu trúc chung của lời nhắc văn bản cho trình tạo hình ảnh AI là tương tự trên bảng, cũng như số lượng từ và thứ tự của các bộ mô tả.


  • Các yếu tố khác nhau của lời nhắc văn bản có các hiệu ứng độc đáo đối với kết xuất và thêm độ phức tạp cho hình ảnh.

Lời nhắc là gì?

Lời nhắc để tạo hình ảnh AI là các lệnh, ở dạng văn bản hoặc hình ảnh, cho biết hình ảnh mà nền tảng AI tạo ra. Thông thường, bạn sẽ tìm thấy hai loại lời nhắc tạo hình ảnh khác nhau: văn bản và hình ảnh.

Lời nhắc văn bản

Để cho AI biết loại hình ảnh nào sẽ hiển thị, trước tiên bạn nên mô tả hình ảnh đó. Điều này được thực hiện với một lời nhắc văn bản, là một danh sách các từ, đôi khi là cả một câu đúng ngữ pháp, mô tả những gì AI sẽ hiển thị.

Let's Enhance Image Generator sử dụng lời nhắc văn bản để hiển thị hình ảnh


Hộp văn bản được đánh dấu là một dấu nhắc văn bản ví dụ được sử dụng để kết xuất hình ảnh bằng AI bằng Let's Enhance Image Generator . Tùy thuộc vào nền tảng kết xuất bạn đang sử dụng, lời nhắc văn bản giống hệt nhau sẽ có kết quả khác nhau.

Lời nhắc hình ảnh

Trong một số trường hợp khi văn bản không đủ, bạn có thể tải hình ảnh lên trình tạo hình ảnh AI và sử dụng nó làm tài liệu tham khảo để tạo các hình ảnh khác. Tùy thuộc vào loại nền tảng AI bạn đang sử dụng và loại kết quả bạn sẽ cần, sử dụng lời nhắc bằng hình ảnh thậm chí còn hiệu quả hơn so với văn bản.

Bản gốc: Girl with a Pearl Earring by Johannes VermeerOutpainting by: August Kamp


Ví dụ: Trí tuệ nhân tạo Outpainting của DALL.E có thể lấy một hình ảnh hiện có và hiển thị phần tiếp theo của nó. Hình ảnh trên cho thấy điều mà AI tin là phần tiếp theo của bức tranh Cô gái đeo bông tai ngọc trai nổi tiếng của Johannes Vermeer.


Hình ảnh ban đầu của bức tranh nằm trong hình vuông và mọi thứ xung quanh nó được kết xuất bởi DALL.E.

Một sự kết hợp của cả hai

Mặc dù hầu hết các trình tạo hình ảnh AI mà bạn tìm thấy trên thị trường hiện nay sẽ dựa trên văn bản với một số tùy chọn cho lời nhắc hình ảnh, nhưng có nhiều cách để sử dụng kết hợp cả hai lời nhắc để hiển thị hình ảnh mong muốn.

Viết lời nhắc tạo hình ảnh

Một chi tiết rất quan trọng mà bạn phải ghi nhớ là hiểu một trình tạo hình ảnh AI cụ thể chuyên về lĩnh vực gì và cách sử dụng nó một cách hiệu quả. Một số trình tạo hình ảnh AI, chẳng hạn như dòng Dall-E rất giỏi trong việc hiển thị hình ảnh bắt chước chủ nghĩa quang học.


Mặt khác, có MidjTHER, nổi tiếng là rất hiệu quả trong các định dạng minh họa hoặc nghệ thuật kỹ thuật số.


Trình tạo hình ảnh Let's Enhance của riêng chúng tôi rất tuyệt vời trong việc mô phỏng tính thẩm mỹ trực quan của hình ảnh sản phẩm, ngoài ra còn hiển thị hình ảnh chân thực, hình minh họa và mô hình 3D.


Đếm từ: Sử dụng ít nhất 3-7 từ

Mặc dù hầu hết các trình tạo hình ảnh AI sẽ có giới hạn ký tự trên lời nhắc văn bản, nhưng không có giới hạn từ. Điều này có nghĩa là bạn có quyền tự do cấu trúc lời nhắc văn bản của mình theo bất kỳ cách nào bạn muốn.


Tuy nhiên, hiện tại, sự đồng thuận dường như là bạn cần 3-7 từ để viết lời nhắc văn bản thành công để AI hiển thị.


Kết xuất bằng Let's Enhance Image Generator

Dưới đây là hình ảnh hiển thị của dấu nhắc văn bản trong ví dụ trên. Lời nhắc “chụp toàn cảnh” tác động đáng kể đến các hình ảnh ở cột bên trái.


Bạn không cần phải tuân thủ nghiêm ngặt quy tắc này và được phép sử dụng ít hơn 3 hoặc nhiều hơn 7 từ. Nhưng như bạn sẽ thấy trong các ví dụ bên dưới, vấn đề không phải là số lượng từ mà là bạn sử dụng những từ nào.

Chủ đề: Ai và Cái gì

Bất kỳ kết xuất hình ảnh AI nào cũng yêu cầu một số loại chủ đề. Đây phải là điều đầu tiên bạn viết trong dấu nhắc văn bản (trong hầu hết các trường hợp). Có thể chỉ để lại một chủ đề duy nhất trong lời nhắc văn bản và để AI tạo ra thứ gì đó tổng quát hơn một chút.


Tuy nhiên, trong hầu hết các trường hợp, bạn sẽ cần một lời nhắc văn bản mô tả nhiều hơn để tạo ra một hình ảnh gần giống với những gì bạn muốn hiển thị.


Các chủ đề thường là danh từ, vì vậy, nơi tốt nhất để bắt đầu với lời nhắc văn bản của bạn bất kể bạn đang sử dụng AI nào là bắt đầu với một chủ đề.

Mô tả: Họ đang làm gì, ở đâu và như thế nào

Để thêm một chút sắc thái cho hình ảnh kết xuất của bạn và giúp AI thu hẹp những hình ảnh sẽ sử dụng làm tài liệu tham khảo, bạn cần sử dụng các mô tả. Đây là những tính từ của bạn và giống như cách bạn sử dụng chúng trong bất kỳ câu thông thường nào, chúng mô tả chủ đề.


Mẹo với việc sử dụng tính từ trong tạo hình ảnh AI là bạn có thể kết hợp một số tính từ này để tăng thêm độ sâu và độ phức tạp cho hình ảnh.


Ngoài các tính từ mô tả chủ đề, một yếu tố khác của mô tả là các chi tiết trả lời các câu hỏi như:


  • Điều gì đang xảy ra?
  • Đối tượng đang làm gì?
  • Làm thế nào là chủ đề làm điều này?
  • Điều gì đang xảy ra xung quanh chủ đề?


Câu hỏi cuối cùng đó khá quan trọng, vì phông nền đóng vai trò chính trong việc mô tả hiệu quả. Đây là một ví dụ về hai lời nhắc văn bản tương tự mang lại kết quả khá khác nhau. Lời nhắc văn bản cho hình ảnh bên trái là Raccoon đang đọc .


Tuy nhiên, lời nhắc văn bản cho hình ảnh bên phải chi tiết hơn một chút; do đó, tại sao hình ảnh trở nên rõ ràng và phức tạp hơn: Gấu trúc đang đọc sách trong ảnh chụp cận cảnh thư viện.

Kết xuất bằng Let's Enhance Image Generator


Như bạn có thể thấy qua kết quả, chúng tôi đã trả lời một số câu hỏi và AI có thể thu hẹp những gì chúng tôi đang tìm kiếm và hiển thị thứ gì đó gần với những gì chúng tôi đang tìm kiếm nhất có thể. AI có thể tạo ra một hình ảnh có nhiều chi tiết hơn và ít điểm bất thường hơn.


Đây là một ví dụ tuyệt vời khác về cách trình tạo hình ảnh AI hoạt động tốt hơn với lời nhắc hình ảnh chi tiết hơn.


Kết xuất bằng khuếch tán ổn định

Hình ảnh chim sẻ được tạo ra này cho thấy cách AI có thể hiển thị một hình ảnh chung chung nhưng rất chính xác ngay cả khi không có bộ mô tả bổ sung.


Tuy nhiên, kết xuất ở bên phải cho thấy cách trình tạo hình ảnh AI, trong trường hợp này là Khuếch tán ổn định, có thể hoạt động với nhiều thành phần hơn để hiển thị hình ảnh phức tạp hơn đáng kể.

Thẩm mỹ và Phong cách: Nó trông như thế nào

Để hoàn thành lời nhắc văn bản, bạn phải thêm một vài lời nhắc văn bản nữa để hoàn thiện hình ảnh kết xuất của bạn. Lưu ý rằng, ở cuối lời nhắc văn bản ở trên, chúng tôi có các từ như “ảnh” và “cận cảnh”.


Những từ cuối cùng trong lời nhắc của bạn sẽ là những từ quyết định tính thẩm mỹ và phong cách tổng thể của hình ảnh của bạn.


Thay vì “ảnh”, bạn có thể có “tranh sơn dầu”, “bức bích họa” hoặc “kết xuất 3D”. Để xác định phong cách cho hình ảnh của mình, bạn cũng có thể sử dụng các phong trào nghệ thuật như trường phái ấn tượng, gothic, steampunk, v.v.


Ngoài ra, nếu bạn đang tìm cách sao chép các tác phẩm của một nghệ sĩ nổi tiếng, bạn thậm chí có thể đặt một hoặc nhiều tên nổi tiếng trong lời nhắc văn bản. AI sẽ kết hợp ảnh hưởng từ nhiều nghệ sĩ nổi tiếng khác nhau để tạo ra thứ gì đó kết hợp các yếu tố từ tất cả họ.


Cuối cùng, bạn cũng có thể ra lệnh cho khung hình ảnh. Các lời nhắc như “cận cảnh” hoặc “chụp trung bình”, giống như cách bạn thực hiện trong chụp ảnh, có thể giúp AI hiểu bạn muốn hình ảnh được thể hiện ở góc độ nào và khoảng cách bao nhiêu.


Kết xuất bằng Lexica

Đây là một ví dụ về hai hình ảnh do Lexica tạo ra trên một thiết bị máy tính cầm tay. Lời nhắc bên trái, mặc dù đơn giản, nhưng có thể tạo ra một thiết bị cổ điển thậm chí sao chép màn hình LCD trường học cũ.


Tuy nhiên, kết xuất ở bên phải, nhờ các lời nhắc như “thẩm mỹ sóng hơi” và “chụp ảnh sản phẩm”, có phong cách và thẩm mỹ trực quan rõ ràng hơn, như bạn có thể nhận biết qua các màu neon.

Kinh nghiệm là người thầy tốt nhất

Không có mẹo và thủ thuật nào dạy bạn cách viết lời nhắc AI hiệu quả hơn kinh nghiệm. Phần tốt nhất về trình tạo hình ảnh AI là chúng rất dễ tiếp cận. Tất cả những gì bạn cần là kết nối internet và bạn có thể chọn từ nhiều nền tảng miễn phí có sẵn.


Vì vậy, hãy ra khỏi đó và thử nghiệm lời nhắc hình ảnh AI để xem bạn có thể khám phá những điều mới và hấp dẫn nào trong lĩnh vực tạo hình ảnh đang phát triển.