Narzędzie AI do konwersji tekstu na wideo firmy Adobe już brzmi lepiej niż Sora

Adobe pracuje nad tajemniczym produktem AI generującym wideo, który umożliwi użytkownikom tworzenie klipów wideo na podstawie wyłącznie podpowiedzi tekstowych.

Kadr z filmu wyprodukowanego przez Sora firmy OpenAI
Kadr z filmu wyprodukowanego przez Sora firmy OpenAI

Jeśli ta nowa funkcja AI brzmi Wam znajomo, dzieje się tak dlatego, że Adobe nie będzie pierwszą firmą, która wypuści tego typu narzędzie. OpenAI pokazało wersje demonstracyjne narzędzia Sora na początku tego roku, które umożliwia tworzenie filmów na podstawie podpowiedzi tekstowych. Warto zauważyć, że Sora została przeszkolona na podstawie prawdziwych filmów.

Jest jednak jeszcze zbyt wcześnie, aby powiedzieć, który produkt będzie lepszy. Nienazwane narzędzie firmy Adobe nie jest jeszcze dostępne, a Sora jest nadal testowana przed wydaniem dopracowanej wersji. Jednak doniesienia wskazują, że Adobe może obrać lepszą drogę w rozwoju usługi zamiany tekstu na wideo: twórcy faktycznie otrzymają wynagrodzenie za licencjonowanie swoich klipów, aby można je było wykorzystać do uczenia modelu sztucznej inteligencji.

Według dokumentów firmy Adobe, do których dotarł Bloomberg, firma zaczęła kupować filmy dla swojego rywala – Sory. Według doniesień Adobe oferuje swojej sieci twórców 120 dolarów za „filmy przedstawiające ludzi wykonujących codzienne czynności, takie jak chodzenie lub wyrażanie emocji, w tym radości i złości”.

Z raportu wynika, że Adobe potrzebuje także ujęć anatomicznych, w tym stóp, dłoni i oczu. Priorytetami są także osoby wchodzące w interakcję z przedmiotami takimi jak smartfony czy sprzęt fitness. Firma Adobe nie chce jednak treści chronionych prawem autorskim, nagości ani innych potencjalnie obraźliwych materiałów.

Oferta Adobe podobno wynosi dla twórców około 2,62 dolara za minutę. Jednak opłaty dla twórców mogą wzrosnąć do 7,25 dolara za minutę wideo, którego Adobe użyje do szkolenia swojego odpowiednika narzędzia Sora.

Twórca ChatGPT, firma OpenAI, zadziwiła świat kilka tygodni temu przedstawiając narzędzie AI o nazwie Sora do zamiany tekstu na wideo, które generuje klipy wyglądające prawie jak prawdziwe. Kilka tygodni później CTO OpenAI Mira Murati ogłosiła plany publicznego udostępnienia Sory jeszcze w tym roku.

Pomimo swojej roli wykonawczej w firmie Murati nie chciała powiedzieć, w jaki sposób OpenAI szkoliło Sorę. Nie odpowiadała na pytania dotyczące rodzaju filmów, których OpenAI używało do szkolenia Sory, ponieważ albo nie wiedziała, albo mogło wydarzyć się coś podejrzanego. Oznacza to, że OpenAI mogło szkolić Sorę na publicznie dostępnych klipach z mediów społecznościowych, a nawet witryn takich jak YouTube, bez faktycznego uzyskiwania zgody od twórców treści lub sieci społecznościowych.

Chociaż są to tylko spekulacje, sposób, w jaki Murati unikała tego pytania, nie stawia OpenAI w dobrym świetle, szczególnie w świecie, który jest nadmiernie skupiony na kwestiach praw autorskich dotyczących produktów AI. Murati ostatecznie potwierdziła, że OpenAI korzystało z filmów z Shutterstocka, ale nie powiedziała, czy klipy z YouTube’a i serwisów firmy Meta były również wykorzystywane do szkolenia Sory.

Nie jest jasne, kiedy podobny produkt firmy Adobe do przetwarzania tekstu na wideo zostanie wprowadzony na rynek ani ile czasu zajmie przygotowanie go do publicznych testów. Według Bloomberga firma Adobe potwierdziła już, że pracuje nad narzędziami AI do generowania wideo i planuje omówić je jeszcze w tym roku.

Adobe ma już narzędzia genAI do generowania obrazów i wykonywania edycji. Program sztucznej inteligencji do zamiany tekstu na wideo, który może konkurować z Sorą, wydaje się logicznym kolejnym krokiem.

➔ Obserwuj nas w Google News, aby być na bieżąco!

źródło: BGR