Bard wreszcie generuje zdjęcia dzięki Imagen 2

Bard może w pełni teraz konkurować z innymi multimodalnymi chatbotami, dzięki lepszym sposobom tworzenia obrazów Imagen 2.

Generowanie obrazów w Google Bard za pomocą Imagen 2

Chatbot Google Bard dodaje generowanie obrazów AI, nadrabiając zaległości w funkcji, którą konkurencyjny ChatGPT Plus ma od miesięcy. A Gemini Pro dostępne jest w nowych językach oraz otrzymuje funkcję sprawdzania, czy w internecie znajdują się treści potwierdzające odpowiedź Barda.

Zobacz też: Bard dostępny jest już po polsku!

Użytkownicy mogą poprosić Barda o wygenerowanie zdjęć przy użyciu modelu zamiany tekstu na obraz Google Imagen 2. Bard, teraz obsługiwany przez wielkojęzykowy model Google Gemini Pro, zawsze miał generować obrazy. Zakładano, że będzie go zasilał mocniejszy model Gemini Ultra, jednak model ten pozostaje wciąż w fazie rozwoju.

Google pozycjonuje Barda jako godnego konkurenta dla ChatGPT Plus OpenAI, który obsługuje GPT-4 i pozwala użytkownikom generować obrazy dzięki integracji z DALL-E 3. Oba chatboty działają dobrze, ale brak funkcji zamiany tekstu na obraz w Bardzie ChatGPT Plus miał pewną przewagę. Ludzie mogą korzystać ze zaktualizowanego Barda z Imagen 2 bezpłatnie (ale na razie w języku angielskim), w przeciwieństwie do ChatGPT Plus, który opiera się na płatnej subskrypcji.

Generowanie obrazów AI znalazło się ostatnio pod ostrzałem po tym, jak fałszywe zdjęcia Taylor Swift o charakterze jednoznacznie seksualnym zalały serwis X. Chociaż nadal nie wiadomo, z jakich platform ludzie korzystali do generowania tych obrazów, firmy technologiczne zaczęły blokować swoje platformy do generowania obrazów.

Przykład wygenerowanego obrazu psa przez chatbota Bard
Przykład wygenerowanego obrazu psa przez chatbota Bard

Google stwierdziło, że możliwości obrazu Barda „zaprojektowano z myślą o odpowiedzialności”. Opracowana przez firmę funkcja znaku wodnego zostanie wtopiona w piksele zdjęć, co pomoże wskazać, że obrazy zostały wygenerowane przez sztuczną inteligencję. Google poinformowało również, że wdrożyło bariery techniczne i zabezpieczające, aby uniknąć generowania zdjęć znanych osób i ograniczyć treści zawierające przemoc, obraźliwe lub o charakterze jednoznacznie seksualnym.

Generowanie obrazu nie będzie ograniczone do Barda. Firma Google wypuściła nowe eksperymentalne narzędzie do zdjęć obsługiwane przez Imagen 2 o nazwie ImageFX.

Rozszerzenia Google Bard

ImageFX umożliwia użytkownikom tworzenie obrazów za pomocą prostych podpowiedzi tekstowych, dzięki czemu można bawić się generatywną sztuczną inteligencją, a opinie trafiają bezpośrednio do inżynierów Google’a. Podobnie jak w przypadku Barda, wszystkie zdjęcia wygenerowane przez ImageFX zostaną oznaczone przez SynthID i będą zgodne z zasadami Google’a dotyczącymi sztucznej inteligencji i barierami technicznymi. Dołącza do innych narzędzi Google’a do tworzenia opartych na sztucznej inteligencji, MusicFX i TextFX, które zostały wprowadzone na rynek w zeszłym roku i są dostępne do testów w Google Labs.

Bard otrzymuje także kilka innych rozszerzeń. Chociaż generowanie obrazów jest na razie możliwe tylko w języku angielskim, chatbot rozszerzył się na ponad 40 języków w ponad 230 krajach. Poprzednia wersja działała tylko w języku angielskim i była dostępna w 170 krajach. Niektóre obsługiwane języki to arabski, bengalski, tamilski i urdu.

Przykład wykorzystania funkcji „O tym obrazie”, aby pokazać, że dany obraz mógł zostać wygenerowany przy użyciu AI od Google
Przykład wykorzystania funkcji „O tym obrazie”, aby pokazać, że dany obraz mógł zostać wygenerowany przy użyciu AI od Google

Firma Google rozszerzyła także funkcję podwójnego sprawdzania do 40 języków, która umożliwia użytkownikom ocenę odpowiedzi poprzez automatyczne przeszukiwanie internetu w celu potwierdzenia lub zaprzeczenia treści.

➔ Obserwuj nas w Google News, aby być na bieżąco!

źródło: Google Blog