Základné pojmy
Čo je WWW, hypertext
a hypermédiá ?
WWW (World Wide Web, niekedy označovaný
aj ako W3) navrhol v roku 1989 Tim Berners-Lee. Projekt je založený na
troch základných myšlienkach: navigácia pomocou hypertextu, podpora
multimédií a integrácia už existujúcich služieb Internetu. Podstatou hypertextu
je, že hociktoré slovo (resp. úsek textu) môže byť označené ako odkaz na
iný hypertextový dokument, v ktorom sú uvedené podrobnejšie informácie,
týkajúce sa tohoto slova. Aktiváciou daného odkazu (nastavím sa naň šípkami
a stlačím kláves Enter, resp.
kliknem naňho myšou) sa dostanem do zvoleného dokumentu. V ňom sú obvykle
ďalšie
odkazy, takže naznačený proces môžem reťaziť.
Obrázok na nasledujúcej stane ilustruje
prepojenie niekoľkých dokumentov. Jedná sa o veľmi zjednodušenú podmnožinu
dokumentov, tvoriacich WWW informácie o pracovisku autorov (Katedra
kybernetiky a umelej inteligencie FEI Technickej univerzity v Košiciach).
Pri navigácii po WWW sa nemusím zaujímať
o to, kde sú jednotlivé dokumenty uložené: v skutočnosti sa často nachádzajú
na rôznych počítačoch, resp. sú pod správou iných typov servrov (napr.
Gopher, Ftp, a.p.). Naviac,
nemusí vždy ísť o textové dokumenty, niektoré odkazy môžu ukazovať aj na
obrazové, či zvukové informácie, prípadne na videosekvencie. Vzhľadom na
naznačené multimediálne možnosti sa niekedy hovorí v súvislosti s týmito
službami aj o hypermédiách.
Iné služby na Internete
WWW reprezentuje jeden typ služby dostupný
na Internete, a to vyhľadávanie informácií. Okrem vyhľadávania poskytuje
Internet aj druhý typ služieb, zameraných na komunikáciu:
elektronickú poštu (e-mail), diskusné
kluby (mailing lists),
diskusné skupiny (USENET newsgroups), priamy rozhovor
(talk), IRC (Internet Relay Chat), a ďalšie.
Čo sú klient a server
?
Prevažujúcou architektúrou aplikácií v
rámci Internetu je technológia klient / server. Server
umožňuje vykonávanie rôznych služieb
a klienti sa na server obracajú so žiadosťami o poskytnutie týchto služieb.
Klient a server sú v podstate programy, ale nakoľko v prípade Internetu
spravidla bežia na rôznych (často dosť vzdialených) počítačoch, pojmy klient
a server sa používajú aj k označeniu týchto počítačov.
V prípade WWW sú dokumenty zverejňované
na WWW servroch. Ja ako používateľ prichádzam do styku s klientskou časťou
programového vybavenia pre WWW s prehliadačom (browser-om). Prehliadače
môžu byť textové (Lynx) alebo častejšie grafické (Netscape, Microsoft
Explorer, HotJava), pričom môžu bežať na rôznych platformách (Unix,
X-Windows, Windows 95/NT 4.0, ...).
Keď zo svoj prehliadača
vyžiadam nejaký dokument, prehliadač-klient odošle moju požiadavku na príslušný
server, odkiaľ dokument získa a poskytne mi ho na obrazovke.
Čo sú cookies ?
Cookies sú krátke pomocné informácie v
tvare reťazca meno=hodnota.
Pomocou nich si môže server uchovať informácie o svojich predošlých kontaktoch
s klientom, prípadne si ich klient ukladá a pozdejšie ich využíva. Boli
navrhnuté s cieľom umožniť servru vytvoriť 'profil' klienta, tak aby server
mohol reagovať individuálne na rôznych klientov. Mechanizmus cookies umožňuje
servru získať mnohé informácie o návykoch používateľa klientského programu
(prehliadača), ktoré môžu byť zneužité (reklama, narušenie súkromia - chceli
by ste napríklad, aby sa vedelo, že 60% prístupov z vášho prehliadača smeruje
do domény playboy.com
? :-) ). Cookies sú prístupné aj prostriedkami JavaScriptu.
Čo sú firewall a proxy
?
Niektoré inštitúcie sa snažia ochrániť
servre svojej lokálnej siete pred nepovolanými a nekorektnými zásahmi zvonku.
Za tým účelom oddeľujú lokálnu sieť od ostatného Internetu smerovačom,
na ktorom beží špeciálny program - firewall (Na Slovensku sa ujal
pomerne nevhodný preklad - ohňová stena; presnejšie by bolo:
protipožiarna stena). Technológia firewallov nie je zatiaľ štandardizovaná
ale obvykle spočíva v zákaze priamej komunikácie medzi lokálnou a globálnou
sieťou. Cieľom je chrániť sieť nielen pred bezprostrednými útokmi, ale
aj utajiť jej skutočnú štruktúru. Vedľajším efektom je možnosť použiť v
chránenej sieti 'classeless' adresy, takže sa šetrí adresný priestor. Komunikácia
prebieha potom cez proxy server,
ktorý je súčasťou lokálnej siete. Komunikácia niektorých aplikácií smerom
z chránenej siete do Internetu využíva Proxy (zástupca) servre, ale môžu
byť použité aj tzv. brány (gateways). Proxy servre bývajú vybavené špeciálnymi
cache pamäťami, v ktorých sa uchovávajú informácie stiahnuté z globálnej
siete aj pre prípadných ďalších
klientov, ktorí budú mať o ne záujem. Proxy servre sa práve kvôli tejto
výhode používajú aj samostatne, mimo technológie firewallov. Keď
chcem ich ponuku využiť, musím si vhodne nakonfigurovať
svoj prehliadač.
Ako adresujem informačné
zdroje na WWW ?
Čo to je URL a akú má
štruktúru ?
URL (Uniform Resource Locator) je jednotné
označenie pre internetovské informačné zdroje. Predstavuje vlastne adresu
dokumentu, prípadne inej informácie (alebo aspoň adresu servra, ktorý túto
informáciu obhospodaruje). URL môžem použiť pri práci s prehliadačom, keď
manuálne zadávam adresu dokumentu, o ktorý mám záujem. Najčastejšie sa
však URL používajú v hypertextových odkazoch v rámci dokumentov, vytvorených
pomocou jazyka HTML (HyperText Markup Language).
V najjednoduchšom prípade má URL adresa
všeobecný tvar:
protokol://specificka_cast
kde protokol
označuje typ komunikačného protokolu (spôsobu, ktorým získam určitú informáciu),
napr.:
http HyperText
Transfer Protocol (WWW)
file súbory
na disku lokálneho počítača
ftp File
Transfer Protocol (prenos súborov zo vzdialeného počítača)
gopher služba
Gopher
news elektronické
časopisy z USENET-u
mailto odoslanie
elektronickej pošty
pričom protokol určuje aj typ servra;
specificka_cast má tvar závislý na použitom
protokole, najČastejšie
//adresa_servra/cesta/subor.pripona
kde
adresa_servra
je adresa počítača, poskytujúceho požadovanú informáciu
cesta je
cesta do príslušného adresára
subor.pripona
je kompletné meno požadovaného súboru.
URL adresa môže ďalej
obsahovať aj číslo portu (keď
nie je, použije sa implicitná hodnota), heslo a ďalšie
doplnkové informácie, v závislosti na použitom protokole. URL nesmie
obsahovať iné znaky ako písmená, číslice, pomlčky, bodky, lomítka a podčiarniky.
Ostatné znaky musím zakódovať trojicou znakov, kde prvý je %
a za ním je šestnástkový ASCII kód
daného znaku (napr. %20 v prípade medzery).
Príklady URL:
http://www.ecrc.de/eclipse/eclipse.htm
ftp://ccsun.tuke.sk/pub/mirror/SimTel/
gopher://gopher.uakom.sk
http://www.ecrc.de
news:local.kkui.vyuka
mailto:csonto@ccsun.tuke.sk
Väčšina webovských prehliadačov vie
automaticky doplniť protokolovú časť URL. Napriek tomu sa neodporúča spoliehať
sa na túto skutočnosť. Výnimkou je relatívne adresovanie, kde je vynechanie
protokolovej časti veľmi efektívne (pozri Aké sú najčastejšie
sa vyskytujúce sa prípony súborov? a Aké je
adresovanie na lokálnom počítači?).
Podľa prípony súborov zistí webovský
prehliadač typ súboru a zvolí aj spôsob, ako s ním bude narábať (napr.
či ho zobrazí, či ponúkne jeho uloženie na lokálny disk).
Aké sú najčastejšie
sa vyskytujúce prípony súborov ?
Každý súbor, prenášaný v rámci WWW by
mal mať príponu, jednoznačne charakterizujúcu jeho obsah. Prípony totiž
môžu pomôcť webovskému prehliadaču zistiť (v prípade, keď
sa mu to nepodarí určiť podľa obsahu súboru) o aký typ súboru sa jedná,
a podľa toho zvoliť aj spôsob ako s ním narábať (napr. či ho zobraziť,
či ho prehrať pomocou zvukovej karty, či ponúknuť jeho uloženie na lokálny
disk).
V tabuľke sú uvedené najčastejšie používané
prípony
Typ súboru
|
Prípona
|
HTML
|
.htm, .htm
|
ASCII text
|
.txt
|
zdrojový text Java
|
.java
|
bajtový kód Java
|
.class
|
JavaScript skript
|
.js
|
PostScript
|
.ps
|
obrázok vo formáte GIF
|
.gif
|
obrázok vo formáte JPEG
|
.jpg, .jpeg
|
zvukový záznam RealAudio
|
.ra, .ram
|
scéna virtuálnej reality v jazyku VRML
|
.wrl, .wrz,. vrw
|
MPEG video záznam
|
.mpeg, .mpg
|