Inteligentní podpora navigace na WWW s využitím XML

Diplomová práce

Jiří Kosek


Obsah

1. Úvod
2. Přístupy k navigaci a vyhledávání na webu
Vyhledávací služby
Navigační asistenti
Projekt RAINBOW a jeho možnosti při podpoře navigace
3. Přehled XML technologií a možností jejich využití
XML
Infoset
Jmenné prostory
Jazyky pro popis schématu dokumentů
Parsery a programátorská rozhraní
Využití XML při ukládání a zpracování dokumentů
Odkazy mezi dokumenty
XPointer – identifikace fragmentů dokumentu
XLink a RDF – popis vazeb mezi stránkami
Komunikace mezi moduly – XML-RPC a SOAP
Uživatelské rozhraní
XSLT – konverze a transformace dokumentů
Dotazovací jazyky
4. Komunikační infrastruktura
Požadavky systému
Distribuovanost
Nezávislost na implementačním prostředí
Flexibilita
Asynchronnost
Možnosti řešení komunikace mezi moduly
Vzdálené volání procedur
Distribuované objektové technologie
Messaging
Význam ontologie při komunikaci
Využití webových služeb a protokolu SOAP při komunikaci
SOAP
WSDL
UDDI
Ukázka vytvoření a použití jednoduché webové služby
Vytvoření služby
Javový klient
C# klient pro .NET
Klient v Perlu
5. Navigační rozhraní
Základní funkce
Možnosti implementace
Rámy
Vlastní prohlížeč
Modifikace existujícího prohlížeče
Architektura prohlížeče Mozilla
Implementace
6. Stahování a ukládání stránek
Možné přístupy ke stahování a ukládání stránek
Ukládání stránek do souborů
Ukládání stránek do relační databáze
Ukládání do vlastního formátu
Datový model pro uložení stránek
Návrh postupu pro stahování a ukládání stránek
Stahování stránek z daného URL
Normalizace kódování
Kanonizace do XML
Testování změny a opakovaného výskytu
Implementace stahování stránek
Výběr implementačního prostředí
Architektura modulu pro stahování stránek
7. Závěr
Použitá literatura
A. Modul pro stahování stránek
B. Navigační rozhraní
Navigační modul pro Mozillu
Servlet sloužící jako dotazovací modul

Seznam obrázků

2.1. Klasické vyhledávací služby nutí uživatele přecházet mezi nalezenými stránkami a výsledkem hledání
2.2. Některé prohlížeče zobrazují výsledek hledání v samostatném okně
2.3. Navigační panel What's Related v Mozille
2.4. Prototyp navigačního rozhraní
2.5. Architektura RAINBOW
2.6. Antarcti.ca – katalog stránek prezentovaný jako shluky v 2D prostoru
4.1. Vztah tří základních technologií (SOAP, WSDL a UDDI) webových služeb
4.2. Vytvoření webové služby z javové třídy
4.3. Výběr metod převáděných na webovou službu
4.4. Nastavení názvu webové služby
4.5. Vygenerování kostry instalačního balíčku pro webovou službu
4.6. Zadání názvu instalačního balíčku
4.7. Vytvoření instalačního archivu
4.8. Instalace webové služby na server
4.9. Administrační rozhraní WASP Serveru
4.10. Generování klienta z WSDL popisu I
4.11. Generování klienta z WSDL popisu II
4.12. Ukázka SOAP komunikace mezi webovou službou a jejím konzumentem
4.13. Generování konzumenta z WSDL ve Visual Studiu .NET
5.1. XP-architektura Mozilly
5.2. Schéma obsloužení požadavku navigačním rozhraním
5.3. Ukázka navigačního rozhraní v provozu
5.4. Navigační rozhraní zobrazuje indikátory stránky získané analytickým modulem
6.1. ER-diagram databáze pro ukládání stránek

Seznam tabulek

6.1. Struktura tabulky Page
6.2. Struktura tabulky URL
6.3. Struktura tabulky Link pro ukládání odkazů mezi stránkami

Seznam příkladů

4.1. Ukázka jednoduché zprávy SOAP
4.2. Ukázka zprávy s odpovědí
4.3. SOAP požadavek zaslaný přes HTTP
4.4. SOAP odpověď přenášená pomocí HTTP
4.5. SOAP požadavek zaslaný přes rozšíření HTTP
4.6. SOAP odpověď přenášená pomocí rozšíření HTTP
4.7. Ukázka WSDL souboru
4.8. Javová třída s metodou pro součet čísel
4.9. WSDL popis ukázkové webové služby
A.1. WSDL soubor služby poskytující stažené stránky
B.1. Navigační panel pro Mozillu
B.2. Servlet generující XUL kód