Wyszukiwarka internetowa
Wyszukiwarka internetowa (ang. search engine) to strona internetowa zawierająca odpowiednie oprogramowanie z interfejsem WWW, umożliwiające znajdywanie informacji w sieci. Ułatwia poszukiwanie użytkownikom Internetu. Funkcję wyszukiwarki może także pełnić program, który służy do indeksowania stron internetowych. Indeksowanie umożliwia mu na wskazanie stron, na których prezentowane są pożądane przez użytkownika informacje.[1]
TL;DR
Wyszukiwarka internetowa to strona lub program umożliwiający znajdowanie informacji w sieci. Działa na podstawie indeksowania stron i oceny ich przez algorytmy. Istnieją różne rodzaje wyszukiwarek, takie jak oparte na analizie treści strony, topologii sieci, zasadzie aukcji miejsc, wyszukiwarki poziome i pionowe. Wyszukiwarki można również podzielić na generacje. Filarami wyszukiwarek są scheduler, robot/spider, indexer, parser i query processor. Najpopularniejsze wyszukiwarki w Polsce to Google, Bing, Yahoo, Overture, Ask Jeeves/Teoma, Alta Vista, Aol, HotBot, Lycos, IWon, Excite i Netscape.
Mechanizm działania
Wyszukiwarka, a właściwie automat indeksujący, przeszukuje sieć, gromadzi strony w swojej bazie danych i ocenia je według pewnych algorytmów nieznanych użytkownikom sieci. Mechanizm działania wyszukiwarki a właściwie algorytm, według którego dokonuje się selekcji i hierarchizacji stron jest tajemnicą każdej wyszukiwarki, a jego schemat działania jest bardzo pożądany, zwłaszcza wśród firm. Przedstawiony na stronie wyszukiwarki zestaw wyników jest przeważnie w pewien sposób uszeregowany, tak aby na samym szczycie listy wyszukiwania przedstawiał najbardziej znaczące "trafienia". Najpowszechniejszą metodą podawania wyników jest prosta lista opatrzona streszczeniem każdej ze stron. Słowa kluczowe są najczęściej przedstawiane w kontekście otaczającego go tekstu. W niektórych sytuacjach istnieje możliwość zawężenia lub rozszerzenia wyszukiwania, korygowanie wyszukiwanych terminów lub innej modyfikacji. Niektóre wyszukiwarki dostarczają rezultaty kategoriami lub są odwzorowane graficznie[2]
Rodzaje wyszukiwarek
Wyszukiwarki dzielimy ze względu na mechanizm wyszukiwania:
- Wyszukiwarki oparte na analizie treści strony - automat analizuje treść strony, zwracając uwagę głównie na liczbę słów kluczowych w tekście; wyszukiwanie polega na podaniu łącz do stron związanych z zapytaniem użytkownika; niestety często podając hasło w wyszukiwarce, otrzymujemy wiele stron, których zawartość zupełnie nie jest adekwatna do tego, czego poszukujemy.
- Wyszukiwarki oparte na analizie topologii sieci - wyszukiwarka zlicza liczbę łączy na stronie, związanych z podanym przez użytkownika tematem; przy czym łącza, które zostaną wyświetlone, nie będą zawierały stron nie związanych z podanym słowem kluczowym, tak jak ma to miejsce w przypadku wyszukiwarek analizujących sama treść strony. Pierwszą wyszukiwarką, która zastosowała zaawansowane algorytmy analizy topologii sieci był Google.
- Wyszukiwarki oparte na zasadzie aukcji miejsc - polega to na opłaceniu każdego kliknięcia symboliczna kwotą, np. kilku groszy, centów. Strony płacą wyszukiwarce, obowiązuje tu taka sama zasada jak na aukcjach, kto da więcej, będzie miał lepszą pozycję w rankingu. Płaci się tylko za wejście do danego serwisu, nie za wyświetlanie. Niestety i w takim mechanizmie może dojść do nadużyć, ze względu na komercyjny charakter działalności serwisów internetowych.
- Wyszukiwarki poziome (ang. horizontal search) - przeszukują całą sieć i są podejmowane przez wyszukiwarki uniwersalne, nazywane "horyzontalnymi".
- Wyszukiwarki pionowe (ang. vertical search) - wyszukiwarki "wertykalne", które ograniczają zakres swojego działania, jeśli chodzi o temat, środek przekazu, region, język, bądź inny zestaw kryteriów, zajmując się tym obszarem bardzo wnikliwie. Tematycznie ograniczone wyszukiwarki wyświetlają wyłącznie strony związane jedynie z konkretną gałęzią wiedzy np. ScienceDirect dostarcza użytkownikom bibliografię literatury naukowej.
Możemy przedstawić również podział wyszukiwarek, stosując kryterium generacji:[3]
- Wyszukiwarki I generacji - reprezentowane w pierwszej połowie lat 90 przez wyszukiwarki pokroju Infoseek, Excite, Altavista. Pozwalały one na łączenie słów poszukiwanych na stronach internetowych, których metatagi (grupa znaczników w części nagłówkowej dokumentu stosowanych do ukazania ich treści) powiadamiały o obecności pożądanych treści.
- Wyszukiwarki II generacji - przeszukują określone dane w sieci np. linki. Współcześnie, takowe wyszukiwarki są ważną częścią obecnego scenariusza internetowego.
- Wyszukiwarki III generacji - próbują znaleźć odpowiedź na "wyzwania stające z zapytaniami" przez semantyczną ocenę danych typu: porada dla szukającego (m. in. ortografia), projektowanie kontekstu przestrzennego (gdzie i czego poszukuje użytkownik).
Filary wyszukiwarek
Wyróżniamy pięć filarów, na których opiera się wyszukiwarka internetowa:[4]
- Scheduler - jego misją jest planowanie, kiedy roboty muszą przejąć pobrany zasób w adresie URL.
- Robot/Spider - skanuje wykaz stron internetowych, zbiera i zapamiętuje informacje.
- Indexer - tworzy indeksy oraz metadane upraszczając fazę wyszukiwania, po uprzednim przetworzeniu danych, które generuje robot.
- Parser - wydobywa i odczytuje treści zasobów.
- Query processor - przyjmuje prośby i przekazuje odpowiedzi.
Najpopularniejsze wyszukiwarki w Polsce
Na obecną chwilę, dogonienie monopolisty jest celem niewykonalnym. Ponadto przedsiębiorstwo Google rozwinęło cały wachlarz dedykowanych usług. Jest również domyślną wyszukiwarką dla większości używanych w Polsce przeglądarek. Według portalu Bloomberg, Google w 2014 roku zapłaciło 1 miliard dolarów za utrzymanie swojej wyszukiwarki jako domyślnej w urządzeniach Apple.
- Google (97,34%)
- Bing (1,77%)
- Yahoo! (0,85%)
- Overture
- Ask Jeeves/Teoma
- Alta Vista
- Aol
- HotBot
- Lycos
- IWon
- Excite
- Netscape
Wyszukiwarka internetowa — artykuły polecane |
Automatyczna indeksacja — Pozycjonowanie stron — Responsive design — Metadane — Phishing — Wymagania dla witryn internetowych — Prezentacja multimedialna — Analiza sentymentu — HTTP |
Przypisy
- ↑ Węglarz W. (2010). Przeglądanie stron internetowych i komunikacja, Wydawnictwo Naukowe PWN, Warszawa, s. 12
- ↑ Halavais A.(2012), Wyszukiwarki internetowe a społeczeństwo, Wydawnictwo Naukowe PWN, Warszawa, s. 35
- ↑ Maltraversi M. (2017). SEO & SEM. Przewodnik dla zaawansowanych po Webmarketingu, CeDeWu, Warszawa, s. 25
- ↑ Maltraversi M. (2017). SEO & SEM. Przewodnik dla zaawansowanych po Webmarketingu, CeDeWu, Warszawa, s. 31
Bibliografia
- Dobosz Krzysztof (2012). Przeszukiwanie zasobów Internetu, Polsko-Japońska Akademia Technik Komputerowych, Warszawa
- Geer S. (2004). Internet od A do Z, Studio Emka, Warszawa
- Kolasa W. (2016). Serwisy biblioteczne w perspektywie search engine optimization, Annales Universitatis Paedagogicae Cracoviensis
- Langville A.N., Meyer C.D. (2011). Google's PageRank and Beyond, Princeton University Press
- Ledford J.L. (2015). Search Engine Optimization Bible 2nd Edition., Wiley Publishing
- Maciejowski T. (2004). Firma w internecie, Oficyna Ekonomiczna, Kraków
- Sokół M. (2004), Internet. Przewodnik, Helion, Gliwice
- Żernicka K. (2010), Wyszukiwanie w czasie rzeczywistym - przyszłość internetu?, E-mentor, Vol. 36, Nr 4
Autor: Joanna Kubarek, Krzysztof Gaweł