Analiza struktury serwisu
Analiza struktury serwisu |
---|
Polecane artykuły |
Charakterystyka
Analiza struktury serwisu (ang. Web structure mining) próbuje określić strukture hiperłącz na poziomie wewnatrzdokumentowym. Na podstawie topologii z hiperłączy, Web Structure Mining kategoryzuje strony i generuje informacje, takie jak podobieństwo i relacje między różnymi witrynami sieci Web. Proces wyszukiwania informacji wykorzystuje powiązania między dokumentami HTML. Jest to cecha, która spopularyzowała format HTML (Hypertext Markup Language). Łącza te mogą być interpretowane jako relacje między dokumentami. Tradycyjne metody wyszukiwania znajdują ustalone słowo kluczowe i sortują dokumenty pod względem częstotliwości występowania w nim tego słowa. W wielu przypadkach taka kolejność przedstawiania wyników nie jest zadowalająca.
Na przykład odnalezienie zadanego słowa na stronie, na którą wskazuje bardzo dużo łączy jest dużo bardziej cenne od odnalezienia strony, na której zadane słowo występuje wielokrotnie. Analogicznie dobre prace naukowe są często cytowane; tak więc lepsza strona WWW jest częściej odwiedzana, ponieważ prowadzi do niej wiele odnośników z innych stron (autorytet).
Bibliografia
- Lee W., Hierarchical Web Stucture Mining, Sungkyul University, 2006
- Olszak C., Ziemba E., Strategie i modele gospodarki elektronicznej, Wydawnictwo Naukowe PWN Warszawa, 2007
- Bing L., Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer, 2007
Autor: Ilona Mika