Podobnie jak DALL-E dla modeli 3D, Shap-E może przekształcić opisy w języku naturalnym w trójwymiarowe obiekty CAD.
OpenAI robi szybkie postępy w rozwoju nowego systemu obiektowego zamiany tekstu na 3D, nad którym pracuje. Sztuczna inteligencja Shap-E, dostępna do pobrania z otwartym kodem źródłowym, może generować zasoby 3D bezpośrednio z opisu tekstowego lub budować je z dostarczonych obrazów. W grudniu zeszłego roku – czyli około miliarda lat temu w systemie czasowym sztucznej inteligencji – OpenAI wypuściło swój system Point-E, który jest w stanie przyjąć monit tekstowy i wykorzystać go do zbudowania podstawowych modeli 3D w postaci chmur punktów.
Teraz jednak firma wypuściła Shap-E — nowy system, który jest znacznie szybszy i zdolny do budowania modeli jako „niejawnych funkcji” – formuł matematycznych, które można renderować albo jako teksturowane siatki, albo jako neuronowe pola promieniowe (NeRFs, z nag. neural radiance fields), modele 3D opracowane z obrazów 2D przy użyciu uczenia maszynowego.
Technika jest dość interesująca, ale ambicja tutaj jest naprawdę wielka. Te modele 3D są zaprojektowane do pracy z aplikacjami niższego szczebla, więc pospekulujmy trochę, do czego będzie można ją wykorzystać.
Jeśli możesz rozmawiać z komputerem i generować modele 3D w odpowiedzi na język naturalny, będziesz mógł rozmawiać z sztuczną inteligencją podobną do GPT, która może działać jako projektant CAD. Oznacza to, że można będzie tworzyć projekty produktów, części, budynków, rzeźb i innych rzeczy bez dotykania myszy, dokonując edycji ustnie lub w inny sposób.
Oznacza to, że gry wideo mogą elastycznie generować przedmioty w locie w odpowiedzi na słowa lub działania gracza. „Hej kowalu! Zrób mi 10-metrowy miecz z zaokrąglonym końcem w kształcie dzwonu i dwoma dużymi, okrągłymi osłonami na rękojeści!”
To wczesny krok w kierunku programowanych werbalnie efektów wizualnych 3D i potencjalny sposób generowania wszystkiego, od stroju, przez dom, po towarzysza w aplikacjach VR/AR.
I oczywiście w końcu będzie współpracować z drukowaniem 3D, co oznacza, że kształty wyczarowane przez AI z pewnością pojawią się w prawdziwym świecie, gdy zostaną wykonane w wyższej jakości.
Oznacza to, że właśnie patrzymy na narodziny technologii, która da LLM, takich jak ChatGPT, daje możliwość wytwarzania fizycznych obiektów przez sztuczną inteligencję, na podstawie naszych wytycznych.
Ale z drugiej strony pomysł superinteligentnej sztucznej inteligencji budującej oddziały robotów eksterminujących w celu wyeliminowania życia biologicznego raczej nie stanie się problemem. To pomysł tak głupi, że tylko człowiek mógłby go wymyślić – wszystko zależy od tego jak pokierujemy rozwojem tych technologii. Śpijmy dobrze!
➔ Obserwuj nas w Google News, aby być na bieżąco!
źródło: OpenAi | New Atlas