Wayback Machine je najobľúbenejšou súčasťou webovej stránky Internet Archive. Bezplatný online nástroj, ktorý bol prvýkrát predstavený v roku 2001, vám umožňuje vrátiť sa „do minulosti“, aby ste videli, ako vyzerali webové stránky na celom svete v určitých časových bodoch. Wayback Machine obsahuje v čase písania tohto článku 562 miliárd webových stránok, pričom každý rok pribúdajú mnohé ďalšie.  

Úvod do internetového archívu

Internet Archive (Internetový archív), ktorý vytvorili Brewster Kahle a Bruce Gilliat, je nezisková organizácia s deklarovaným poslaním „univerzálneho prístupu ku všetkým vedomostiam“. Organizácia od začiatku poskytovala bezplatný verejný prístup k digitalizovaným materiálom, ako sú webové stránky, knihy, zvukové nahrávky vrátane živých koncertov, videá, obrázky a softvérové ​​programy.

K dnešnému dňu všetko zhromaždené internetovým archívom zaberá viac ako 70 petabajtov serverového priestoru, vrátane dvoch kópií všetkého. Organizácia je financovaná z darov, grantov a poplatkov zo služieb digitalizácie kníh. Internetový archív z dôvodu ochrany osobných údajov nesleduje IP adresy svojich čitateľov a používa protokol HTTPS (zabezpečený).

The Wayback Machine

Len jedna časť internetového archívu, Wayback Machine, bola navrhnutá tak, aby zachytávala obsah webových stránok, ktorý sa zmenil alebo odstránil. Od spustenia sa stal jedným z najpopulárnejších a najuznávanejších miest na webe. Kahle a Gilliat pomenovali toto miesto podľa fiktívneho zariadenia na cestovanie v čase z animovaného seriálu zo 60. rokov, The Rocky and Bullwinkle Show.

Hoci Internet Archive spustil túto stránku pre verejnosť až v októbri 2001, Wayback Machine začal archivovať webové stránky uložené vo vyrovnávacej pamäti od mája 1996. Do roku 2001 boli na digitálnych páskach uložené informácie, ktoré boli prístupné len vybraným vedcom a výskumníkom. Keď sa všetko o päť rokov neskôr dostalo na verejnosť (ako sa dlho plánovalo), obsahovalo už viac ako 10 miliárd archivovaných strán.

Ako funguje Wayback Machine

Používanie Wayback Machine

Webovú stránku Wayback Machine môže používať ktokoľvek. Ak chcete nájsť historické snímky webu, zadajte jeho URL do vyhľadávacieho nástroja. Na stránke sa zobrazí kalendár s označenými dátumami a časmi archivácie lokality. Treba myslieť na to, že webové stránky sa neukladajú každý deň. Kliknutím na konkrétny čas zobrazíte stránku v stave, v akom vyzerala presne v tomto dátume. Dostanete sa tak späť v čase.

Skladovanie a zbierky

Dnes stránka uchováva historické webové údaje na klastri uzlov Linuxu. Wayback Machine sťahuje všetky verejne dostupné informácie a dátové súbory na webových stránkach prostredníctvom svojho mechanizmu prehľadávania. Nie je tu však zahrnuté všetko, čo je uverejnené na webovej stránke, pretože určitý obsah je obmedzený alebo uložený v databázach, ktoré nie sú prístupné. Z tohto dôvodu sa niektoré webové stránky prehľadávajú lepšie ako iné, v závislosti od toho, ako vývojári vytvorili stránky v danom čase.

Tiež si všimnete, že čím je archív novší, tým viac obsahu je k dispozícii pre danú lokalitu. Nový nástroj, ktorý Internetový archív predstavil v roku 2005, je jedným z dôvodov, prečo sú novšie údaje úplnejšie. Archive-It.org pomáha prekonať nezrovnalosti na čiastočne uložených webových stránkach tým, že umožňuje inštitúciám a tvorcom obsahu zbierať a uchovávať zbierky digitálneho obsahu.

Prehľadávanie

Webové prehľadávače, niekedy nazývané spider alebo spiderbot, sú také staré ako samotný internet. Tieto prehľadávače sú internetové roboty, ktoré neustále prehliadajú web za účelom indexovania, vďaka čomu sú dôležitou súčasťou každého moderného vyhľadávacieho nástroja. Prehľadávače používané pre Wayback Machine na vytváranie digitálnych snímok webových stránok pochádzajú z rôznych zdrojov, ktoré sa časom menili.

Ako si rýchlo všimnete, frekvencia snímania snímok sa v závislosti od webovej stránky značne líši. Typicky, čím väčšia (a možno aj populárnejšia) webová stránka, tým častejšie dochádza k indexovému prehľadávaniu. Navyše veľa závisí od toho, ako často sa stránka mení. Dokonca aj tie najmenšie webové stránky sú nakoniec prehľadané, pokiaľ neexistuje dôvod, prečo nie. Napríklad sa neprehľadávajú weby chránené heslom či weby, ktorých vlastníci to zakázali.

Pokročilé nástroje

Wayback Machine, vytvorený pre výskumníkov aj verejnosť, má niekoľko vstavaných nástrojov, ktoré by bežným používateľom mohli chýbať. Napríklad vďaka dizajnu sa na stránky s výsledkami vyhľadávania ľahko odkazuje. Ako je vysvetlené: „Ak na svojej webovej stránke alebo v článku nájdete archivovanú stránku, na ktorú by ste chceli odkazovať, môžete skopírovať adresu URL. Môžete dokonca použiť priraďovanie fuzzy URL a špecifikáciu dátumu… ale to je o niečo pokročilejšie.“

Wayback Machine tiež umožňuje vlastníkom stránok použiť funkciu „Uložiť stránku teraz“ na uloženie konkrétnej stránky. V súčasnosti však táto funkcia nepridáva adresu URL lokality do žiadneho budúceho indexového prehľadávania. Okrem toho žiadosť neuloží viac ako jednu stránku. Je to však dobrý prvý krok na archiváciu domovskej stránky vášho webu pre historický záznam.

Zdroje: