Google Sitemaps
05.06.2005
Google opět nezahálelo a přišlo s novou službou určenou pro všechny SEO odborníky, kterým do ruky nabídlo silní datový XML formát s open source nástrojem. Jistěže se jedná o horkou novinku, geniální službu Google Sitemaps, kterou za chvíli budou využívat pravděpodobně i konkurenční vyhledávače.
K čemu to slouží?
Crawlery (nebo-li sběrače dat) jsou obvykle hloupé stroje, které se pokouší zjistit častost aktualizace stránek, a podle toho je stahovat a zařazovat do indexu. Problémem crawlerů bohužel je, že ne vždy se jim to podaří, a proto mnohdy stahují více dat, než je třeba, a provádějí aktualizaci stránek, které mnohdy již mají v databázi.
Díky tomu, že jejich algoritmy nejsou dokonalé stahují množství dat, které jsou duplicitní a zastaralé. Díky omezené kapacitě robota se tak může stát, že bude často aktualizovat zastaralé stránky a vůbec si nepovšimne vašeho nového geniálního článku, který jste přidali právě včera.
K tomu, aby se to nestávalo napadlo chlapíky z Googlu, že by mohli vymyslet speciální soubor, který bude vypadat obdobně jako RSS zdroj a bude obsahovat seznam všech stránek, častost jejich aktualizace a hlavně i datum poslední modifikace.
Jaká je budoucnost?
Jak samotní lidé z Google říkají, nepředpokládají, že by onen datový zdroj vytvářel někdo ručně, naopak očekávají rychlou implementaci do webových serverů (které nabídnou seznam všech statických stránek a datum jejich poslední aktualizace) i do redakčních systémů.
Provozovatelé webů si tak již konečně oddechnou od nájezdu robotů přetěžující linky serveru, a majitelé stránek se dočkají mnohem rychlejší aktualizace novějších stránek. Ovšem pozor, data nastavená ve vašem souboru jsou pouze relativní, pokud tedy nastavíte denní aktualizaci veškerého webu, Google váš soubor takřka ignoruje.
Jak to vidím já osobně?
Protože Google doslova dělá nájezdy na můj web a tahá tuny balastu, chci implementovat tento systém co nejdříve. Nedokážu sice pochopit, proč si Google nevybere libovolný z informačních zdrojů, který nabízím (RSS 0.9, 1.0, 2.0, Atom 0.3), ale budiž. bBlog bude mít tuto vlastnost snad implementován jako jeden z prvních redakčních systémů, pokud se probojuji zkouškovým obdobím a Hulán se nevrátí a mezi šukáním mladého masa to nenaprogramuje dříve, snad se to podaří
.
Popis protokolu Google SiteMaps
Ukázka sitemap-xml.gz
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.yoursite.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=73&desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=74&desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=83&desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
od Acci
05.06.2005 #Nemáš s tím už nějaké zkušenosti? Hlavně mě zajímací, co když nějakou stránku v XML souboru neuvedu
Proč ne RSS od HejTi
05.06.2005 #Už jsem to psal někde jinde - poslední dobou se rozmáhá používání RSS na jiné věci, než pro které byl určen (články) - vždyť je to nějaká specifikace XML, stejně jako je specifikace pro google sitemaps.
Je zde jediný důvod, proč by to mělo být RSS?
Jak by potom takové RSS vypadalo?
Jakou by to mělo výhodu?
RSS a Atom od llook
05.06.2005 #Mezi současnými formáty si ale Google přece vybere - viz tohle: http://www.google.com/...emaps/docs/en/faq.html#s8
Jako sitemap lze použít i OAI-PMH 2.0, RSS 2.0, Atom 0.3 nebo TXT obsahující URL adresy.
wordpress uz ma od Patrick Zandl
05.06.2005 #asi pozde. wordpress uz patricne rozsireni ma.
od Pachollini
05.06.2005 #Relativní je důležitost stránky (priority), nikoliv frekvence. Uvedená frekvence změn by prostě měla odpovídat frekvenci změn. Viz např. http://www.google.com/...ol.html#xmlTagDefinitions
Re: Google Sitemaps od llook
06.06.2005 #Odzkoušeno - moje RSS 2.0 (shodou okolností také bBlog) to bere. Akorát to musím ručně resubmitovat, ale to je snadno napravitelný detail.
silniční? od brm
06.06.2005 #nabídlo silní datový XML formát
od Alex
09.06.2005 #Zajímavé... Snad to pomůže ještě více k relevantnosti Googlu.
)
Kdo bude asi nadávat nejvíc, budou FIRMY, které nemají na takové věci lidi, peníze ani čas. Dobře jim tak