Co to jest VisualGPT – wszystko, co musisz wiedzieć

VisualGPT firmy Microsoft udostępnia nową technologię „ WizualnyGPT ” oznacza postęp w dziedzinie sztucznej inteligencji i otwiera możliwości uzyskania bardziej atrakcyjnych i interaktywnych doświadczeń związanych ze sztuczną inteligencją, wypełniając lukę między grafiką a językiem.

Co to jest VisualGPT?

VisualGPT to rozszerzona wersja ChatGPT oparta na modelach NLP (Przetwarzanie języka naturalnego), ale w VisualGPT używany jest VFMS, który może konwertować zapytania tekstowe do postaci obrazu. Chodzi o to, że jest to połączenie/integracja zapytań tekstowych i graficznych.

Cel VisualGPT

Po wypuszczeniu na rynek ChatGPT, który jako jedyny pracował w formacie tekstowym, aby osiągnąć kolejny poziom zaawansowania, pojawiło się doskonałe narzędzie, które będzie działać w formacie tekstowym na graficznym, kierując się wszystkimi tymi względami i w wyścigu o sztuczną inteligencję postęp Microsoft wypuszcza VisualGPT. Głównym celem VisualGPT jest tworzenie obrazów AI na żądanie użytkownika lub analiza obrazu

Architektura VisualGPT

VisualGPT zawiera zapytania użytkownika, menedżera podpowiedzi, wizualne modele podstawowe (VFM), zasadę systemu, historię dialogu, historię rozumowania i odpowiedź pośrednią.

Jeśli mówimy konkretnie o jego modelu, tj. „ VFM (wizualne modele podstawowe) ”, używanych jest prawie 22 VFM, takich jak BLIP (wstępne szkolenie z języka i obrazu ładującego) i Stable Diffusion.

Jak uruchomić czat wizualnyGPT?

Aby uruchomić czat wizualnyGPT, rozważ następujące kroki:

Krok 1: Stwórz środowisko

Najpierw musisz stworzyć środowisko Pythona w wersji 3.8:

importuj sys

sys.path.append ( „/usr/local/lib/python3.8/site-packages” )

Krok 2: Klonuj plik Visual ChatGPT

Teraz sklonuj wizualny plik ChatGPT z GitHub, używając następującego polecenia:

! klon git https: // github.com / deepanshu88 / Visual-chatgpt.git

Krok 3: Skonfiguruj nowy katalog

Następnie skonfiguruj nowy katalog za pomocą poniższego polecenia:

% płyta CD chatgpt wizualny

Krok 4: Zainstaluj wymagane pakiety

Teraz zainstaluj wymagane pakiety, korzystając z „ pypeć polecenie cmdlet:

! zwiń https: // bootstrap.pypa.io / get-pip.py -O get-pip.py

! python3.8 get-pip.py

! Pythona 3.8 -M pypeć zainstalować -R wymagania.txt

Krok 5: Uzyskaj dostęp do API OpenAI

Po zainstalowaniu pakietów początkowych uzyskaj dostęp do OpenAI API, uzyskując klucz API z „platform.openai.com” i wykonując uwierzytelnione wywołania API:

% śr OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

Krok 6: Wybierz model

Na koniec, po uzyskaniu dostępu do Openai, wybierz Model. Istnieje ponad 20 modeli używanych w VisualGPT, które możesz wybrać zgodnie ze swoimi wymaganiami:

! Pythona 3.8. / Visual_chatgpt.py --obciążenie Text2Image_cuda: 0

W powyższym poleceniu „ Tekst2Obraz ” odpowiada modelowi, który ma być zastosowany. Więcej szczegółów znajdziesz w tym Google Colab zeszyt .

Wniosek

ChatGPT został wprowadzony, aby uzyskać szczegółowe odpowiedzi na każde zapytanie, a teraz Microsoft uruchomił VisualGPT, który radzi sobie z danymi tekstowymi i obrazowymi. Dzięki temu użytkownik może po prostu dodać swoje wymagania w formie tekstowej i otrzymać wynik graficzny.

Co to jest VisualGPT – wszystko, co musisz wiedzieć