Deep Web

Z Encyklopedia Zarządzania

Deep Web (głęboka, ukryta sieć) zwana też Hidden lub Invisible Web, stanowi tę część Wold Wide Web, która nie jest indeksowana przez standardowe wyszukiwarki. Termin Deep Web został użyty już w 1994 roku przez Jilla Ellswortha dla opisu informacji niewidocznych dla konwencjonalnych wyszukiwarek, czyli dużo wcześniej nim Internet wstąpił w etap upowszechnienia. Niewidoczność tę należy interpretować jako sytuację, w której przeglądarka ma dostęp do kodu danej strony, ale nie jest w stanie go zinterpretować. Deep Web można traktować jako przeciwieństwo sieci widzialnej (Visible Web) zwaną również powierzchniową (Surface Web) czy siecią indeksowalną (Indexable Web), do której dostęp jest osiągalny z poziomu wyszukiwarek (Szpunar, 2014).

Różnica między Deep Webem a częścią indeksowaną przez wyszukiwarki

Ważne jest zrozumienie różnicy między Deep Webem a częścią internetu, która jest indeksowana przez wyszukiwarki. Główną różnicą jest fakt, że Deep Web nie jest dostępny dla wyszukiwarek internetowych, takich jak Google czy Bing. Wyszukiwarki te działają na zasadzie indeksowania stron internetowych i tworzenia spisów treści, które są publicznie dostępne. Jest to powód, dla którego większość użytkowników internetu nie ma świadomości istnienia Deep Webu. Większość treści w Deep Webie jest ukryta za zaporami bezpieczeństwa, które utrudniają lub uniemożliwiają dostęp do tych stron. Deep Web ma znaczący wpływ na globalną sieć internetową zarówno pod względem technicznym, jak i społecznym. Pod względem technicznym, Deep Web wymaga różnych narzędzi i protokołów do przeglądania i dostępu do tych ukrytych stron. Jednym z najbardziej znanych narzędzi jest Tor, który pozwala na anonimowe przeglądanie stron w Deep Webie. Istnieją również inne sieci anonimowe, takie jak I2P czy Freenet, które umożliwiają dostęp do tej części internetu. Społecznie, Deep Web jest tematem kontrowersyjnym ze względu na wiele nielegalnych działań, które mają miejsce w tej przestrzeni. Deep Web jest znany z handlu narkotykami, bronią, fałszywymi dokumentami oraz usługami hackingu i cyberprzestępczości. Istnieją jednak również pozytywne aspekty Deep Webu, takie jak dostęp do informacji, które nie są publicznie dostępne, ochrona prywatności, wolność słowa i anonimowość.

Wpływ Deep Webu na globalną sieć internetową można zauważyć również w kontekście dyskusji na temat regulacji i kontroli internetu. Wielu rządów i organizacji dąży do ograniczenia dostępu do Deep Webu i walki z nielegalnymi działaniami, które mają miejsce w tej przestrzeni. Jednak równocześnie istnieje debata na temat ochrony prywatności i wolności w sieci, co prowadzi do trudnych decyzji dotyczących regulacji Deep Webu.

Deep Web a Darknet

Pojęcia Darknet i Deep Web są ze sobą niejednokrotnie mylone. Deep Web jest terminem, który odnosi się do wszystkich nieindeksowanych części Internetu przez wyszukiwarki, czyli nie są obecne w wynikach wszystkich popularnych wyszukiwarek internetowych, takich jak np. Google, Yahoo czy Bing. Spekulacje tworzone przez ekspertów z dziedziny IT przewidują, że wielkość głębokiej sieci może być nawet do kilkuset razy większa niż sieć ogólnodostępna. W rzeczywistości większość głębokiej sieci nie zawiera nic niepokojącego. Znajdują się tu głównie ogromne bazy danych, biblioteki czy witryny sklepowe niedostępne dla ogółu społeczeństwa. Jednym z przykładów mogą być używane na co dzień przez studentów i wykładowców zasoby akademickie prowadzone przez uniwersytety czyli np. katalogi biblioteczne czy wewnętrzne sieci uczelniane.

Zasadnicza różnica jednak wynika z tego, że zasoby Deep Webu mogą zostać wyszukane poprzez alternatywne wewnętrzne wyszukiwarki. Niestety nie są one w pełni możliwe do rozpoznania ze względu na ich ogrom oraz ilość unikatowych wyszukiwarek, a wiele projektów zwanymi "głębokimi indeksami" nie udało się zrealizować. Niemniej prace nad przeczesywaniem sieci Deep Web nadal są rozwijane. Natomiast Darknetem czyli ciemną siecią jest niewielki wycinek omówionego wcześniej Deep Webu. Treść Darknetu jest niedostępna we wszelakich wyszukiwarkach. Opiewa ona na koncepcji prywatności i całkowitej anonimowości osiąganych za pomocą niezwykle zaawansowanym technikom kryptograficznym. W Darknecie, co do zasady, pełną ochronę prywatności zapewnioną mają zarówno internauci jak i wydawcy stron. Mimo iż jest to możliwe, dużym agencjom rządowym szereg trudności sprawia śledzenie osób funkcjonujących w anonimowej przestrzeni. Wymagane do tego nakłady nie są proporcjonalne do skuteczności (Majorek, 2017)

Zasoby Deep Webu

"Powszechnie wiadomo, że nie można precyzyjnie zliczyć wszystkich stron WWW, ani tych, które "widzą" wyszukiwarki. Mimo to, co pewien czas podejmowane są badania, w których naukowcy starają się oszacować wielkość sieci płytkiej i głębokiej. Najczęściej cytowana praca, na której opierało się wiele następnych to wyniki badań M. K. Bergmana dla Bright Planet z 2001 r., wg których:

  1. deep web jest ok. 400-550 razy większy niż zasoby indeksowane przez wyszukiwarki i liczy ok. 550 mld dokumentów (7.500 terabajtów),
  2. 60 największych baz danych ukrytego Internetu zawiera 750 TB danych,
  3. ok. 95% zasobów "ukrytych" jest dostępnych publicznie, bezpłatnie;
  4. ponad połowa to tematyczne bazy danych;
  5. zasoby deep web są odwiedzane przez użytkowników o 50% częściej niż zasoby "płytkie".

C. Sherman podał w 2001 r. nieco inne wyniki badań i oszacował ukryty web jako ok. 2-50 razy większy niż zasoby indeksowane przez wyszukiwarki. D. Lewandowski i P. Mayr, P uznali w 2006 r. szacunki M. K. Bergmana za bardzo zawyżone z powodu błędu statystycznego (korzystania ze średniej zamiast mediany) oraz liczenia rozmiaru baz danych w GB zamiast rekordach. Sami oszacowali rozmiar "naukowej sieci ukrytej" na ok. 20-100 mld dokumentów" (Derfert-Wolf, 2007)

Przyczyny istnienia Deep Web

Bezpieczeństwo danych. Jedną z głównych przyczyn istnienia Deep Web jest potrzeba zapewnienia bezpieczeństwa dla wrażliwych lub poufnych informacji. Organizacje, instytucje finansowe i inne podmioty przechowują ważne dane, takie jak dane klientów, transakcje finansowe czy tajemnice handlowe, na stronach internetowych, które nie są dostępne publicznie. Pozostawienie tych danych na powierzchni internetu mogłoby je uczynić bardziej narażonymi na ataki cybernetyczne i naruszenia prywatności.

Własność korporacyjna. Wielkie firmy i korporacje wykorzystują Deep Web do przechowywania swoich wewnętrznych dokumentów, projektów badawczych i komunikacji wewnętrznej. Dzięki temu mogą zachować kontrolę nad swoimi danymi i uniknąć potencjalnej konkurencji lub szpiegostwa przemysłowego. Te intranety korporacyjne są zwykle odseparowane od publicznej części internetu i wymagają specjalnego dostępu.

Kontrola dostępu. Deep Web pozwala na bardziej precyzyjną kontrolę dostępu do zasobów. Przykładem może być witryna internetowa przeznaczona tylko dla pracowników pewnej branży, która dostarcza istotne informacje tylko zarejestrowanym użytkownikom. Dzięki temu dostęp do informacji jest ograniczony do tych, którzy mają uprawnienia, co ma kluczowe znaczenie w przypadku poufnych informacji.

Archiwa i dokumentacja. Wiele instytucji kulturalnych, muzeów, archiwów i uczelni przechowuje swoje archiwa i dokumentację w obszarze Deep Web. To umożliwia zachowanie integralności historycznych i kulturalnych zasobów, które nie zawsze są dostępne dla ogółu społeczeństwa. Przechowywanie tych zasobów na Deep Web pozwala na dokładniejsze zarządzanie nimi i ogranicza dostęp jedynie do tych, którzy mają na to uprawnienia.

Ochrona przed indeksowaniem. Niektóre witryny internetowe lub zasoby chcą uniknąć indeksowania przez popularne wyszukiwarki, aby zachować prywatność lub kontrolować dostęp do swojej zawartości. To szczególnie ważne dla osób lub organizacji, które nie chcą, aby ich dane lub informacje były dostępne dla ogółu lub były łatwo dostępne w wynikach wyszukiwania. Dlatego przechodzą na Deep Web, gdzie mogą zachować większą kontrolę nad widocznością swoich zasobów online.

Dostępność i bezpieczeństwo

Autoryzacja użytkownika. W Deep Web dostęp do wielu zasobów jest ograniczony i wymaga autoryzacji użytkownika. To oznacza, że użytkownicy muszą dostarczyć odpowiednie dane uwierzytelniające, takie jak login i hasło, aby uzyskać dostęp do witryn lub usług. To podejście zapewnia większe bezpieczeństwo, chroniąc poufne informacje przed przypadkowym dostępem. Autoryzacja jest szczególnie powszechna na stronach korporacyjnych, bankowych czy w systemach zarządzania danymi medycznymi.

Sieci prywatne. Korporacje i organizacje często korzystają z Deep Web, aby utworzyć swoje prywatne sieci, które nie są dostępne z zewnątrz internetu. Te wewnętrzne sieci pozwalają na bezpieczną komunikację i wymianę informacji między pracownikami oraz kontrolują dostęp do poufnych danych. Dzięki temu organizacje mogą utrzymywać kontrolę nad swoimi informacjami, minimalizując ryzyko naruszeń bezpieczeństwa.

Bezpieczeństwo transakcji. Deep Web jest również wykorzystywany do przeprowadzania bezpiecznych transakcji finansowych i handlu elektronicznego. W tym kontekście wiele platform i witryn oferuje mechanizmy bezpieczeństwa, takie jak szyfrowanie danych czy certyfikaty SSL. To sprawia, że korzystanie z Deep Web może być bardziej bezpieczne niż niektóre otwarte przestrzenie internetu, gdzie ryzyko oszustwa jest większe.

Prywatność użytkownika. Korzystając z Deep Web, użytkownicy mogą zachować większą prywatność w porównaniu do korzystania z tradycyjnych przeglądarek. To dlatego, że ich działania są mniej widoczne i trudniejsze do śledzenia przez strony internetowe lub reklamodawców. Dla osób, które ceną swojej prywatności, Deep Web może stanowić atrakcyjną alternatywę.

Zagrożenia bezpieczeństwa. Mimo że Deep Web nie jest automatycznie związany z nielegalnymi działaniami, istnieje ryzyko, że w niektórych obszarach mogą zachodzić działania niezgodne z prawem. Cyberprzestępcy mogą próbować wykorzystać tę przestrzeń do prowadzenia nielegalnych działań, takich jak handel narkotykami czy przestępczość związaną z finansami. Dlatego konieczne jest zachowanie ostrożności i zdrowego rozsądku podczas eksplorowania Deep Web oraz korzystanie z zaawansowanych narzędzi bezpieczeństwa, aby uniknąć potencjalnych zagrożeń.

Potencjał wykorzystania Deep Web

Źródło Cennych Informacji. Deep Web kryje w sobie bogactwo cennych informacji, które nie są dostępne publicznie. To tutaj znajdują się specjalistyczne bazy danych, raporty, badania naukowe oraz statystyki, które stanowią nieocenione źródło wiedzy dla różnych dziedzin. Przykładowo, instytucje naukowe i badawcze przechowują w swoich obszarach Deep Web archiwa naukowe i biblioteki cyfrowe, umożliwiając dostęp do publikacji, których nie można znaleźć w przeglądarkach internetowych.

Wsparcie dla Badań Naukowych. Deep Web odgrywa kluczową rolę w dziedzinie badań naukowych. Wiele renomowanych instytucji naukowych udostępnia swoje zasoby naukowe, które obejmują prace doktorskie, artykuły i materiały konferencyjne, tylko za pośrednictwem dostępu do Deep Web. Dla naukowców jest to bezcenne źródło danych, które może przyczynić się do rozwoju wiedzy i odkryć.

Analizy Biznesowe i Konkurencyjne. Firmy wykorzystują Deep Web do przeprowadzania analiz rynkowych i konkurencyjnych. Przez dostęp do ukrytych źródeł danych, przedsiębiorstwa mogą pozyskać cenne informacje na temat trendów rynkowych, opinii klientów oraz działań konkurencji. To umożliwia lepsze podejmowanie decyzji biznesowych i opracowywanie strategii rozwoju.

Archiwizacja Danych. Deep Web jest również miejscem, gdzie przechowuje się istotne archiwa danych i informacji historycznych. Organizacje kulturalne, muzea i instytucje badawcze korzystają z tej przestrzeni, aby zachować integralność swoich zbiorów historycznych i kulturowych. Dzięki temu unikatowe materiały są dostępne dla badaczy i przyszłych pokoleń.

Bezpieczeństwo i Cyberbezpieczeństwo: Deep Web odgrywa istotną rolę w dziedzinie cyberbezpieczeństwa. Firmy zajmujące się analizą zagrożeń i działaniami przeciwdziałającymi cyberatakowi korzystają z informacji pochodzących z tego obszaru, aby wykrywać potencjalne zagrożenia. Monitorowanie forów internetowych i stron ukrytych może pomóc w śledzeniu działań cyberprzestępców oraz w zabezpieczaniu wrażliwych danych.

Podsumowując, Deep Web jest obszarem internetu, który ma ogromny potencjał wykorzystania w wielu dziedzinach, od nauki po biznes i bezpieczeństwo. Stanowi on źródło cennych informacji, wspiera badania naukowe, umożliwia analizy biznesowe, pomaga w archiwizacji danych oraz odgrywa kluczową rolę w dziedzinie cyberbezpieczeństwa. Przez to wszystko Deep Web jest niezwykle ważnym elementem globalnej sieci.


Deep Webartykuły polecane
Automatyczna indeksacjaWyszukiwarka internetowaMetadaneHTMLResponsive designSQLHTTPInternetFirewall

Bibliografia

  • Janczyk J. (2014), W głębi Internetu-inne zastosowania informatyki, Dydaktyka informatyki, 9
  • Majorek M. (2017), Ostatni bastion wolności w internecie?, Krakowska Akademia im. Andrzeja Frycza Modrzewskiego
  • Szpunar M. (2014), Sieć ukryta a sieć widzialna. O zasobach WWW nieindeksowanych przez wyszukiwarki, Przegląd Kulturoznawczy, Numer 1 (19)
  • Tabakow M., Korczak J., Franczyk B. (2014), Big Data - definicje, wyzwania i technologie informatyczne, Business Informatics, nr 1
  • Derfert-Wolf L. (2007), Odkrywanie niewidzialnych zasobów sieci, Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy

Autor: Łukasz Rygał