Firma Google uruchomiła nowy typ wyszukiwarki Dataset Serach (Beta) zaprojektowany specjalnie pod kątem wyszukiwania specjalistycznych zestawów danych (naukowych, rządowych i niektórych organizacji).
Nowa wyszukiwarka Google’a Dataset Search, jest narzędziem zapewniającym łatwiejszy dostęp do milionów zestawów danych w tysiącach repozytoriów danych w internecie. Każdy może korzystać z wyszukiwania danych, które jest obecnie w fazie beta. Google podkreśla jednak korzyści, jakie Datacet Search ma dla dziennikarzy i naukowców zajmujących się i analizujących dane.
Do czego służy wyszukiwarka Dataset Search?
Narzędzie Google’a Dataset Search umożliwia wyszukiwanie zbiorów danych przechowywanych w tysiącach repozytoriów w internecie, dzięki czemu są one powszechnie dostępne i użyteczne. Zbiory danych i związane z nimi dane są zwykle rozproszone po wielu repozytoriach. Najczęściej dane nie są powiązane ani zindeksowane przez wyszukiwarki, co znacznie utrudnia lub wręcz uniemożliwia ich wyszukiwanie.
Wprowadzając jeden interfejs, który pozwala użytkownikom przeszukiwać wiele repozytoriów, Google chce zmienić sposób korzystania z danych. Projekt ma przynieść wiele korzyści:
- stworzy ekosystem udostępniania danych, który zachęci wydawców do stosowania sprawdzonych metod przechowywania i publikowania danych, oraz
- zapewni naukowcom to, czego najbardziej pragną: sposób na pokazanie wpływu, jaki wywiera ich praca poprzez cytowanie utworzonych przez nich zbiorów danych.
Przeczytaj także: Google ma już 20 lat – ale ten czas leci!
Wyniki wyszukiwania zestawów danych pochodzą z witryn wydawców, bibliotek cyfrowych i osobistych stron internetowych autorów. Nowa wyszukiwarka Google w dużej mierze polega na znacznikach Schema.org dla dostawców zestawów danych, które zostały wprowadzone w lipcu tego roku.
Znaczniki zestawów danych pozwalają wydawcom opisywać ich dane w taki sposób, aby Google (i inne wyszukiwarki) mogły lepiej zrozumieć zawartość swoich stron. Google zachęca dostawców zestawów danych do korzystania z tego znacznika w celu włączenia ich treści do wyszukiwania w Dataset Search.
Obecnie wyszukiwanie w tym narzędziu można wykorzystać do znalezienia odniesień do większości zestawów danych w naukach o środowisku, naukach społecznych, a także danych rządowych i danych dostarczanych przez organizacje informacyjne. Gdy więcej wydawców zacznie używać nowego znacznika schematu dla danych uporządkowanych, Google ostatecznie rozszerzy różnorodność treści zawartych w wyszukiwarce Dataset Search.
Wyszukiwanie zestawów danych jest dostępne w wielu językach i działa tak samo, jak każda inna wyszukiwarka. Po prostu wpisz to, czego szukasz, a Google zwróci odpowiednie zestawy danych z opisem formatów do pobrania od dostawców (np. csv lub xml) z opisami (w tym datą utworzenia i opublikowania zbioru, nazwą dostawcy, obszaru itp.)
źródło: Google Blog – Making it easier to discover datasets via Search Engine Journal