AI tłumaczy teksty z antycznych języków

Naukowcy z MIT i Google wykorzystują głębokie uczenie do rozszyfrowywania starożytnych języków.

Starożytna greka wyryta w kamieniu
Starożytna greka wyryta w kamieniu | fot. Don Lloyd (Flickr)

Naukowcy z MIT i Google Brain odkryli, jak wykorzystać uczenie maszynowe do rozszyfrowania starożytnych języków. Technikę tę można wykorzystać do czytania w językach, które dawno wymarły. Metoda opiera się na zdolności maszyn do szybkiego wykonywania monotonnych zadań. Na świecie mówi się obecnie w około 6500–7000 językach. Ale to mniej niż jedna czwarta wszystkich języków, którymi posługiwali się ludzie w historii ludzkości.

Według niektórych szacunków językowych ta całkowita liczba wynosi około 31.000 języków. Za każdym razem, gdy wymiera jakiś język, zmienia się sposób myślenia, odnoszenia się do świata. Znikają także relacje, poezja życia, opisana w unikalny sposób w tym języku. Ale co by było, gdybyśmy mogli dowiedzieć się, jak czytać martwe języki? Naukowcy z MIT i Google Brain stworzyli system oparty na sztucznej inteligencji (AI), który może to osiągnąć.

Podczas gdy języki się zmieniają, wiele symboli oraz sposób rozmieszczenia słów i znaków pozostaje stosunkowo niezmienny w czasie. Z tego powodu można spróbować rozszyfrować dawno zaginiony język, jeśli zrozumiemy jego związek ze znanym językiem przodków. Ten wgląd pozwolił zespołowi, w skład którego wchodzili Jiaming Luo i Regina Barzilay z MIT oraz Yuan Cao z laboratorium AI Google, wykorzystać uczenie maszynowe do rozszyfrowania wczesnego języka greckiego Pismo linearne B Linear B (1400 r. p.n.e.) oraz ugaryckiego (wczesnego hebrajskiego) również liczącego ponad 3000 lat.

Linear B był już wcześniej złamany przez człowieka – w 1953 został rozszyfrowany przez Michaela Ventrisa. Ale teraz nastąpił pierwszy raz, kiedy język został odszyfrowany przez maszynę.

Podejście zastosowane przez badaczy koncentrowało się na 4 kluczowych właściwościach związanych z kontekstem i wyrównaniem znaków do odszyfrowania – podobieństwem dystrybucyjnym, monotonicznym mapowaniem znaków, rzadkością strukturalną i znacznym nakładaniem się pokrewnych znaków.

Wyszkolili sieć AI w poszukiwaniu tych cech, uzyskując poprawne tłumaczenie 67,3% pokrewnych słów wspólnego pochodzenia na ich greckie odpowiedniki.

Według MIT Technology Review, sztuczna inteligencja może potencjalnie lepiej radzić sobie w takich zadaniach, ponieważ może po prostu przyjąć brutalne podejście, które byłoby zbyt wyczerpujące dla ludzi. Mogą próbować przetłumaczyć symbole nieznanego alfabetu, szybko testując go z symbolami z jednego języka po drugim, przepuszczając je przez wszystko, co już jest znane.

Następny krok dla naukowców? Być może tłumaczenie Pismo linearne A (Linear A) – starożytnego języka greckiego, którego nikomu do tej pory nie udało się rozszyfrować.

Przeczytaj oryginalny artykuł „Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B”.

➔ Obserwuj nas w Google News, aby być na bieżąco!

źródło: MIT| Google Brain | Big Think