Skip to main content
PASSIRO CRAWLER

Ako náš crawler funguje.

Passiro Crawler skenuje webstránky na problémy s prístupnosťou. Je rešpektujúci, transparentný a ľahko kontrolovateľný.

Identifikácia

Ako identifikovať náš crawler

Passiro Crawler sa pri každej požiadavke identifikuje nasledujúcim User-Agent reťazcom:

Mozilla/5.0 (...) Chrome/131.0.0.0 Safari/537.36 PassiroCrawler/1.0 (+https://passiro.com/bot)

Náš crawler môžete identifikovať hľadaním PassiroCrawler v User-Agent hlavičke.

Čo robí

Stavané na skenovanie, nie na zber dát.

Skenovanie prístupnosti

Vaše stránky načítavame v headless prehliadači a spúšťame axe-core, priemyselne štandardný motor na testovanie prístupnosti používaný Google, Microsoft a W3C. Testujeme podľa štandardov WCAG 2.1 AA.

Screenshoty

Robíme screenshoty skenovaných stránok, aby sme vytvorili vizuálne reporty, ktoré presne ukazujú, kde sa objavujú problémy s prístupnosťou. Screenshoty sú bezpečne uložené a zobrazujú sa len vlastníkovi webu alebo vo verejných recenziách.

Objavovanie odkazov

Sledujeme interné odkazy na objavenie stránok vášho webu. Sledujeme len odkazy v rámci rovnakej domény a dodržiavame maximálny limit stránok. Kontrolujeme aj sitemap.xml, ak je k dispozícii.

Správanie crawlera

Rešpektujúci od základu.

Obmedzená rýchlosť

Maximálne 2 požiadavky za sekundu. Nikdy nezahlcujeme váš server.

Crawlovanie s rozpoznávaním šablón

Náš crawler inteligentne rozpoznáva šablóny stránok. Na e-commerce weboch s tisíckami produktových stránok zdieľajúcich rovnaký layout automaticky identifikujeme šablónu a prejdeme na iné unikátne typy stránok. To znamená plné pokrytie s minimálnym počtom požiadaviek.

Žiadny zber dát

Nezbierame ani neukladáme váš obsah, ceny ani používateľské údaje. Robíme screenshoty pre vizuálne reporty a analyzujeme HTML štruktúru na súlad s prístupnosťou — nič iné.

Ochrana pred timeoutom

Každá stránka má timeout 10 sekúnd a celkový čas crawlovania je obmedzený na 5 minút. Nikdy nevisíme na vašom serveri.

Len rovnaká doména

Sledujeme len odkazy v rámci skenovanej domény. Počas skenovania nikdy nenavštevujeme externé webstránky.

Inteligentné skenovanie

Vidí váš web tak, ako ho vidia používatelia.

Pre presné výsledky prístupnosti a čisté screenshoty náš crawler automaticky spravuje vyskakovacie okná a overlay-e, ktoré sa objavujú na moderných webstránkach.

Bannery súhlasu s cookies — automaticky akceptované na všetkých hlavných platformách súhlasu (Cookiebot, OneTrust, Usercentrics, Didomi a ďalšie) vo všetkých 24 jazykoch EÚ.

Vyskakovacie okná a modály — prihlásenia na odber newslettera, propagačné overlay-e a ďalšie rušivé prvky sú detekované a zatvorené.

Overlay-e pozadia — stmavujúce vrstvy a celoobrazovkové pozadia sú odstránené, takže screenshoty zobrazujú skutočný obsah stránky.

Shadow DOM — prechádzame shadow roots, aby sme našli a zatvorili prvky súhlasu skryté vo web komponentoch.

Prispôsobenie

Prispôsobte crawler pre váš web.

Naša automatická detekcia spravuje väčšinu webstránok, ale niektoré majú vlastné vyskakovacie okná, unikátne toky súhlasu alebo prvky vyžadujúce špeciálne zaobchádzanie. Vlastníci webov môžu nakonfigurovať vlastné pravidlá crawlera v nastaveniach webu na dashboarde na spracovanie týchto prípadov.

Selektory na kliknutie

Určite CSS selektory tlačidiel alebo prvkov, na ktoré by mal crawler kliknúť pred skenovaním — napríklad na zatvorenie vlastného vyskakovacieho okna, ktoré naša automatická detekcia nerozpoznáva.

Selektory na skrytie

Vynútene skryte špecifické prvky pred vytvorením screenshotu. Užitočné pre fixné bannery, chat widgety alebo overlay-e, ktoré by sa nemali objaviť vo vašom reporte prístupnosti.

Prednastavené cookies

Nastavte cookies pred tým, ako crawler načíta vaše stránky — napríklad cookie súhlasu na úplné obídenie bannera cookies, alebo A/B test cookie na skenovanie konkrétnej varianty.

Ignorované cesty a limity stránok

Vylúčte špecifické URL cesty zo skenovania a nastavte vlastný limit stránok. Užitočné, ak sú časti vášho webu za prihlásením alebo obsahujú obsah, ktorý nepotrebuje skenovanie.

Tieto nastavenia sú dostupné na karte Nastavenia vášho webu na Passiro dashboarde. Zmeny sa prejavia pri ďalšom skenovaní.

Vaša kontrola

Ako zablokovať náš crawler

Ak nechcete, aby Passiro Crawler navštevoval vašu webstránku, môžete ho zablokovať pomocou súboru robots.txt:

User-agent: PassiroCrawler Disallow: /

Môžete tiež zablokovať konkrétne cesty alebo sekcie vášho webu. Dodržiavame všetky štandardné robots.txt direktívy.

Alternatívne nás môžete kontaktovať a pridáme vašu doménu na náš zoznam vylúčení.

Otázky o našom crawleri?

Ak máte otázky, obavy alebo potrebujete nahlásiť problém s Passiro Crawlerom, radi pomôžeme.

Kontaktujte nás