Z Whisk można skorzystać na razie tylko w ramach Google Lab i tylko w Stanach Zjednoczonych, ale już wygląda niesamowicie!
OpenAI dominuje obecnie na scenie AI po tym, jak sprytnie przejął okres przedświąteczny swoim wydarzeniem „12 Days”. Każdy dzień przynosi nam nowy livestream, w którym OpenAI ogłasza nową funkcję ChatGPT lub kolejną aktualizację produktu, pozostawiając niewiele miejsca konkurencyjnym firmom AI na zabłyśnięcie. Ale jest jeszcze Google, największy rywal OpenAI w dziedzinie AI, który znalazł równie sprytne sposoby na rywalizację o uwagę.
Zaledwie w zeszłym tygodniu Google ogłosiło dużą aktualizację Gemini 2.0 i swoich pierwszych agentów AI. Jeśli to nie wystarczyło, abyśmy zapomnieli o ChatGPT przynajmniej na jeden dzień, Google postanowiło również zaprezentować platformę Android XR, która będzie zasilać urządzenia XR z AI. Google zapowiedziało również swoje nienazwane inteligentne okulary AR zasilane przez Gemini.
Kilka dni później Google wypuściło kolejny nowy produkt AI. Chodzi o ekscytujący generator obrazów o nazwie Google Whisk. To nie jest zwykły generator obrazów AI, co prawdopodobnie sprawia, że jest najfajniejszy. Zamiast wpisywać monit do Gemini, aby utworzyć konkretny obraz AI, możesz przesłać obrazy i pozwolić Whisk utworzyć nowe sceny na podstawie Twoich monitów.
To nie jest pełny produkt, ponieważ Whisk jest obecnie dostępny tylko jako demo w Google Labs. Jest również ograniczony do rynku amerykańskiego, ale mimo to wygląda niesamowicie.
Google ma do dyspozycji kilka potężnych generatorów obrazów AI. Niektóre są dostępne w Google Photos, a niektóre zostały wprowadzone wraz z telefonami Pixel 9. Zazwyczaj krytykowałem oprogramowanie Google do edycji zdjęć AI, zwłaszcza te, które były dostarczane z telefonami Pixel 9, ponieważ pozwalają każdemu łatwo manipulować rzeczywistością i zamieniać ją w coś fałszywego.
Firma tak bardzo spieszyła się, aby pokazać swoje postępy w AI, że uruchomiła te funkcje bez wcześniejszego wdrożenia zabezpieczeń. Te pojawiły się później.
Czym jest Whisk firmy Google?
Whisk to zupełnie coś innego. Nie jest przeznaczony do tworzenia realistycznych obrazów, które można wykorzystać do wątpliwych działań. To zabawny sposób na szybkie tworzenie obrazów AI przy użyciu zdjęć, które już masz jako inspirację. Whisk nie każe Ci pisać szczegółowego monitu dla obrazu wygenerowanego przez AI. Zamiast tego poprosi Cię o przesłanie trzech obrazów:
- jednego dla tematu,
- drugiego dla sceny,
- trzeciego dla stylu.
Gemini przeanalizuje te obrazy, stworzy na ich podstawie własny monit i przekaże go do narzędzia do generowania obrazów Imagen 3 firmy Google.
Google potwierdziło we wpisie na blogu, że proces „przechwytuje istotę tematu, a nie dokładną replikę”. Jednak może Ci się nie spodobać to, co Gemini myślało, że chcesz osiągnąć na podstawie swoich obrazów. Jeśli tak jest, możesz dodać monit tekstowy, aby AI w Whisk mogła stworzyć coś nowego, co będzie bardziej zgodne z Twoją wizją.
Google zauważa również, że Whisk to „nowy typ kreatywnego narzędzia”, a nie tradycyjny edytor obrazów. „Stworzyliśmy go do szybkiej eksploracji wizualnej, a nie do edycji pikseli. Chodzi o eksplorowanie pomysłów w nowy i kreatywny sposób, co pozwala na przeglądanie dziesiątek opcji i pobieranie tych, które lubisz” — powiedział Google.
Niektórzy użytkownicy Reddita, którzy testowali tę funkcję, odkryli, że Whisk może tworzyć realistyczne obiekty.
Wydaje się również, że Whisk jest idealnym narzędziem do angażowania się w szkolenie AI bez informowania Cię przez Google o tym, że szkolisz AI. Pomyśl o tym: dajesz Google swoje zdjęcia, a następnie Gemini przegląda je, aby zobaczyć, co może zrozumieć. Następnie składa w całość trzy zdjęcia, aby stworzyć jeden obraz, który nie jest idealny. Monit tekstowy, którego używasz do udoskonalenia obrazu, jest w rzeczywistości narzędziem do przekazywania opinii dla Gemini.
W świecie, w którym firmom zajmującym się AI brakuje danych do szkolenia AI, eksperymenty takie jak Whisk, które mogą łatwo stać się wirusowe, mogą się przydać. W związku z tym Google nie mówi, co dzieje się z Twoją interakcją z Whisk. Co dzieje się ze zdjęciami, które przesyłasz do Whisk? Co dzieje się z „czatem” z Gemini? Nie wiemy.
Możesz wypróbować Whisk, rejestrując się w Google Labs pod tym linkiem – labs.google/whisk, o ile mieszkasz w USA. Nowy generator obrazów AI nie jest dostępny na rynkach międzynarodowych. Oto film przedstawiający Whisk w akcji:
➔ Obserwuj nas w Google News, aby być na bieżąco!
źródło: Google The Keyword | BGR