Свободно за индексиране огледално копие на сайта на правителството

Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…
Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…

Моят допълнителен принос в кампанията „SEO срещу правителството“ е огледалното копие на правителствение сайт, което вече може да се обхожда безпроблемно от паяците на търсещите машини. Сайтът така или иначе е счупен на повече от едно място, и е пълен провал, но пък това да може да се индексира от Гугъл е една малка победа на научно-техническия прогрес ;) Чудя се, колко време ще им трябва да оправят robots.txt, дали ще смогнат преди изборите ;)

Както и да е, сайтът е http://government.bg.kaloyan.info/, и страниците в огледалното копие се попълват когато се посети съответния линк от сайта: например като посетите началната страница на копието ще се изтегли началната страница на оригинала. Дал съм време за живот на огледалните копия от 12 часа, така че ако информацията не се опреснява често, няма страшно – не е бъг ;) Връзките със „cgi-bin“ в тях са леееко променени, за да се заобиколи недостатък от хостинга (изключване на ScriptAlias „cgi-bin“ или каквато и да е тъм магия), така че и това не е бъг ;)

Скриптът, Schtrack!,  който прави възможно функционирането на огледалното копие, ми се върти в главата някъде от 2004, обаче все нямам време или повод, за да го направя. Е, ето сега се появи добър повод, и резултата е налице. На който му се занимава, може да намери кода на приложението тук (а самото приложение тук), и да си го ползвате за каквото си искате (в рамките на GPL, разбира се).

1 февруари 2009: Една седмица по-късно вече има стотина страници индексирани от огледалото на правителствения сайт, което може да се отбележи като някакъв относителен успех, особено като се има предвид некадърните адреси на сайта (под некадърни разбирайте такива, които не прилагат най-добрите практики, а точно обратното – супер антични). Друг успех е променения robots.txt, който вече позволява индексиране в дълбочина. Хайде да видим колко други неща ще се променият до преди изборите ;)