Czym tak naprawdę jest Deep Web?

Ukryty Internet (Deep Web)

W powszechnym  rozumieniu Deep Web jest siedliskiem występku i niewypowiedzianej grozy. Jest to miejsce z pornografią dziecięcą i zabójcami do wynajęcia – przestrzenią w której funkcjonuje i rozwija się działalność przestępcza. Dlaczego więc naukowcy, bibliotekarze, przedsiębiorcy i Internauci korzystają z tego zasobu? Dziś o tym czym jest Ukryty Internet i dlaczego warto z niego korzystać.

Deep web jest często mylony z tzw. Dark net (w jęz. polskim używa się terminu darknet). W uproszczeniu oznacza on tę część sieci, w której użytkownicy pozostają celowo anonimowi.  Znajduje się on w zasobach Ukrytego Internetu, ale nie może być z nim utożsamiany, gdyż tak naprawdę stanowi jego niewielki procent. Anonimowość darknetu wykorzystują zarówno przestępcy, jak i osoby nieposiadające wolności swobodnego wypowiadania swoich poglądów (np. w krajach niedemokratycznych). Korzystają z niego np. politycy, aktywiści, detektywi, służby specialne, ale także zwykli użytkownicy Internetu, ktorzy cenią sobie ochronę swojej prywatności.

1

Deep Web jest w rzeczywistości większy niż możemy to sobie wyobrazić. Nie ma oficjalnych danych liczbowych potwierdzających rozmiar całego zasobu internetowego, ale powszechnie zakłada się, ze tradycyjne wyszukiwarki takie jak Google, Yahoo i Bing obejmują swoim zasięgiem jedynie niewielką część sieci – mniej niż 4% całego Internetu.

Czym tak naprawdę jest Deep Web?

Współczesne wyszukiwanie informacji w Internecie można porównać do przeciągania siatki na powierzchni oceanu. Choć wiele można złapać w sieci, jest jeszcze wiele informacji, które pozostaną nieodkryte i niewidoczne, z powodu źle użytych technik i narzędzi wyszukiwawczych. I to wlasnie te zasoby, trudno dostępne poprzez tradycyjne wyszukiwanie za pomocą Google, należą do tzw. Deep Web, czyli Ukrytego Internetu.

Powszechne jest tez porównywanie zjawiska Ukrytego Internetu do góry lodowej – to, co znajduje się na powierzchni oceanu stanowi widzialną i łatwo wyszukiwalną część Internetu (tzw. Surface Web), pod powierzchnią natomiast, znajdziemy to, co ukryte i trudniej dostępne – Głęboki bądź Ukryty Internet.

2
Analogia góry lodowej, często używana do symbolicznego ukazania rozmiaru Ukrytego Internetu (zanurzona część), w stosunku do powierzchni Internetu widzialnego (część znajdująca się nad powierzchnią wody)

Termin Ukryty Internet (obecnie w jęz. angielskim najczęściej stosowanym terminem jest ‘deep web’ czyli Głęboki Internet) po raz pierwszy został użyty prawdopodobnie już w 1994 roku przez Jill Ellsworth na określenie tych zasobów sieciowych, które dla użytkowników Internetu są niewidzialne bądź niedostępne (Bergman, 2001).

Wielu z nas korzysta z zasobów Ukrytego Internetu, nie zdając sobie nawet z tego sprawy. Większość studentów nie zna terminu deep web a przy poszukiwaniu źródeł informacji do swoich prac naukowych korzysta z elektronicznych baz danych bądź internetowych katalogów bibliotecznych, udostępnianych im w ich akademickiej bibliotece. Przedsiębiorcy chcąc wyszukać informacje na temat konkretnego przedsiębiorcy skorzystają z bazy danych REGON. Lekarz w celu znalezienia potrzebnych mu informacji czy ‘case studies’ nie skorzysta z Google, ale ze specjalistycznych portali medycznych czy baz danych.  Te wszystkie informacje (oraz całe mnóstwo innych) wchodzą w zasób Ukrytego Internetu.

Definicja Ukrytego Internetu

 Tę najbardziej podstawową i najczęściej przytaczaną, podaje słownik wydany przez American Library Association (Carter i Levine-Clark, 2013):

„Część World Wide Web, która jest niewykrywalna dla wyszukiwarek”

W praktyce oznacza to, że w sieci istnieją zasoby internetowe, które są celowo lub nieświadomie ukryte, niewidoczne lub nieosiągalne do przeszukiwania przez roboty indeksujące (skanujące Internet). Do tych zasobów zalicza się m.in.

  • strony, do których dostęp zabezpieczany jest hasłem (wymagają rejestracji, płatnej bądź bezpłatnej;
  • strony, które z przyczyn technicznych nie są indeksowane (np. ich rozmiar jest zbyt duży by być indeksowany);
  • strony, do których dostęp został świadomie utrudniony przez założyciela/moderatora strony (przy użyciu pliku robots.txt);
  • dynamiczne strony WWW oraz zasoby generowane w czasie rzeczywistym; bazy danych, które łatwiej przeszukiwać przez ich własne wyszukiwarki;
  • treści i źródła,  które są indeksowane, ale dotarcie do nich wymaga użycia bardziej zaawansowanych kwerend, z zastosowaniem odpowiednich komend.

 

Jak uzyskać dostęp do Ukrytego Internetu (≠ darknetu)?

  • Za pomocą wyspecjalizowanych wyszukiwarek i katalogów stron deep web:

Np. http://www.searchengineguide.com

http://www.collegedegree.com/library/college-life/99-resources-to/

http://www.infoplease.com

  • Korzystając ze zwykłych wyszukiwarek, wpisując w polu wyszukiwawczym database („baza danych”) + wybrane zagadnienie, np „finance database”, „classical music database” itd.
  • Korzystając z katalogów i baz bibliotecznych

Bibliotekarze mają dużą wiedzę na temat źródeł informacji oraz sposobów dotarcia do nich. Warto zaglądać zwłaszcza na strony bibliotek naukowych, które oprócz tematycznych bibliografii i katalogów, oferują także dostęp do komercyjnych baz danych, takich jak EBSCO, Proquest czy Euromonitor.

Dlaczego warto korzystać  z Ukrytego Internetu?

Zasoby Ukrytego Internetu są w większości bardziej wiarygodne i wartościowe aniżeli treści wyszukane w sieci powierzchniowej, za pomocą standardowych wyszukiwarek. Bazy danych, repozytoria, są tworzone i kontrolowane przez specjalistów (środowiska naukowe, biblioteki, wydawcy naukowi oraz specjaliści z określonych dziedzin wiedzy), w przypadku „widzialnego” Internetu brakuje tej kontroli, wyniki często zależą od skuteczności robotów wyszukujących, które nie są w stanie sprawdzić wiarygodności znalezionych informacji.

Znaczą część Ukrytego Internetu stanowią informacje biznesowe. Są to zarówno informacje z zakresu ekonomii, zarządzania i marketingu, informacje o firmach, dane ekonomiczne, czy informacje dotyczące koniunktury różnych krajów. Dla zainteresowanych informacją biznesową poleganie wyłącznie na wynikach uzyskanych przez standardowe wyszukiwarki, znacznie redukuje szanse na znalezienie relewantnej, wiarygodnej informacji.

Może warto więc odwiedzić swojego bibliotekarza? Lub zwrócić się bezpośrednio do firmy zajmującej się infobrokeringiem?

To od Ciebie zależy, z jakich informacji skorzystasz!

Bibliografia:

Bergman, M. K. (2001). The Deep Web: Surfacing Hidden Value.

Carter, T. M. i Levine-Clark, M. (2013). ALA Glossary of Library and Information Science.

Pamuła-Cieślak, N. (2015). Ukryty Internet jako przedmiot edukacji informacyjnej.

Share Button