Opiera się na modelu języka GPT-3, który potrafi generować spójny i płynny tekst na różną tematykę. DALL-E rozszerza GPT-3, dodając komponent wizyjny, który może kodować i dekodować obrazy. Dzięki temu DALL-E rozumie zarówno tekst, jak i obrazy oraz tworzy ich nowatorskie kombinacje.
W tym artykule omówimy niektóre z najbardziej ekscytujących i kreatywnych podpowiedzi tekstowych, jakie obsługuje DALL-E, i pokażemy kilka przykładów tworzonych przez nie obrazów.
Jak korzystać z podpowiedzi tekstowych w DALL-E?
DALL-E łączy w sobie GPT-3, potężny model językowy i CLIP, model wizyjny, którego można się nauczyć z języka naturalnego. DALL-E może tworzyć naturalne i pomysłowe obrazy w zależności od wprowadzonego tekstu. OpenAI tego wymaga zarejestruj się i zaloguj korzystać z DALL-E 2. W tym celu możesz dowiedzieć się więcej o procesie rejestracji i logowania, odwołując się do tego artykułu „ Jak zarejestrować się i zalogować do DALL-E 2? ”:
Aby korzystać z podpowiedzi tekstowych w DALL-E, należy wykonać kilka podstawowych kroków:
1. Wpisz każdy najmniejszy element w podpowiedzi tekstowej
DALL-E radzi sobie ze złożonymi i abstrakcyjnymi podpowiedziami tekstowymi, takimi jak metafory, analogie, kompozycje, transformacje i ograniczenia. Użytkownicy mogą używać języka naturalnego, słów kluczowych lub kombinacji obu.
Przykład
DALL-E może generować obrazy na podstawie podpowiedzi tekstowych. Te podpowiedzi tekstowe wymagają, aby DALL-E łączył różne koncepcje, kształty, kolory, tekstury i materiały w sposób spójny i realistyczny. Na przykład użyj podpowiedzi tekstowej „ pięciokąt zrobiony z płonącego sera ' jak poniżej:
2. Uzyskaj szczegółowe informacje na temat stylu
Inną cechą DALL-E jest możliwość generowania wielu obrazów dla tego samego podpowiedzi tekstowych, każdy z inną interpretacją lub stylem.
Przykład
DALL-E może generować obrazy „ kot w garniturze ”, które różnią się rodzajem garnituru, pozą kota, tłem i wyrazem twarzy. To pokazuje, że DALL-E ma bogatą i różnorodną wyobraźnię i może tworzyć obrazy, które są nie tylko dokładne, ale także zaskakujące i pełne humoru:
3. Istotne dla określonych domen lub kontekstów
DALL-E może również generować obrazy istotne dla określonych dziedzin lub kontekstów, takich jak sztuka, historia, kultura, nauka lub fikcja.
Przykład
DALL-E może generować obrazy „ obraz Picassa przedstawiający kobietę z dwojgiem oczu ”. Podpowiedź tekstowa wymaga, aby DALL-E posiadał pewną wiedzę lub znajomość domeny lub kontekstu oraz generował spójne i odpowiednie obrazy:
4. Nie zapomnij napisać o kolorach
Do podpowiedzi tekstowej możesz dodać modyfikatory, aby określić styl, kolor, perspektywę lub układ obrazu.
Przykład
Rozważany jest przykład polegający na wprowadzeniu podpowiedzi tekstowej „ niebieski dom z czerwonym dachem w stylu Van Gogha ” jak widać na poniższym rysunku:
Dodatkowa wskazówka: jak udoskonalić podpowiedzi tekstowe I Zmodyfikować obrazy?
Opcjonalnie użytkownicy mogą udoskonalić podpowiedzi tekstowe lub zmodyfikować obrazy, korzystając z narzędzi dostarczonych przez DALL-E.
Przykład
Możesz nacisnąć prawy przycisk myszy na obrazie i kliknąć „ Edytuj obraz ” opcja zmiany koloru lub kształtu obiektu na obrazie:
Użytkownicy mogą także korzystać z „ Powiększenie ” do powiększania lub pomniejszania określonej części obrazu, jak poniżej:
Chodzi o różne wykorzystanie podpowiedzi tekstowych w DALL-E.
Wniosek
Aby używać podpowiedzi tekstowych w DALL-E, użytkownicy muszą wpisać każdy najmniejszy element w podpowiedzi tekstowej i uzyskać szczegółowe informacje na temat stylu, dziedzin, kontekstów i kolorów. DALL-E to niesamowite narzędzie, które pomaga tworzyć wspaniałe i oryginalne obrazy na podstawie podpowiedzi tekstowych. Jest to także ciekawy sposób na pobudzenie wyobraźni i zobaczenie, co może wymyślić DALL-E. Należy jednak pamiętać, że DALL-E nie jest doskonały i może czasami generować obrazy, które są nieodpowiednie, nonsensowne lub niedokładne. Zawsze używaj DALL-E w sposób odpowiedzialny i pełen szacunku.