January 26, 2009

Свободно за индексиране огледално копие на сайта на правителството

Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…
Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…

Моят допълнителен принос в кампанията “SEO срещу правителството” е огледалното копие на правителствение сайт, което вече може да се обхожда безпроблемно от паяците на търсещите машини. Сайтът така или иначе е счупен на повече от едно място, и е пълен провал, но пък това да може да се индексира от Гугъл е една малка победа на научно-техническия прогрес ;) Чудя се, колко време ще им трябва да оправят robots.txt, дали ще смогнат преди изборите ;)

Както и да е, сайтът е http://government.bg.kaloyan.info/, и страниците в огледалното копие се попълват когато се посети съответния линк от сайта: например като посетите началната страница на копието ще се изтегли началната страница на оригинала. Дал съм време за живот на огледалните копия от 12 часа, така че ако информацията не се опреснява често, няма страшно — не е бъг ;) Връзките със “cgi-bin” в тях са леееко променени, за да се заобиколи недостатък от хостинга (изключване на ScriptAlias “cgi-bin” или каквато и да е тъм магия), така че и това не е бъг ;)

Скриптът, Schtrack!,  който прави възможно функционирането на огледалното копие, ми се върти в главата някъде от 2004, обаче все нямам време или повод, за да го направя. Е, ето сега се появи добър повод, и резултата е налице. На който му се занимава, може да намери кода на приложението тук (а самото приложение тук), и да си го ползвате за каквото си искате (в рамките на GPL, разбира се).

1 февруари 2009: Една седмица по-късно вече има стотина страници индексирани от огледалото на правителствения сайт, което може да се отбележи като някакъв относителен успех, особено като се има предвид некадърните адреси на сайта (под некадърни разбирайте такива, които не прилагат най-добрите практики, а точно обратното — супер антични). Друг успех е променения robots.txt, който вече позволява индексиране в дълбочина. Хайде да видим колко други неща ще се променият до преди изборите ;)

5 Comments »

  1. Линкът за “пълен провал” е неправилен и не помагаш в момента. Понеже наистина са пълен провал, правилният адрес на сайта е с www отпред.

    Comment by growchie — January 27, 2009 @ 00:27

  2. Благодаря за напомнянето за изпуснатото www.
    Няма полза от линкове в коментарите, понеше WP им слага rel=nofollow, което ме подсеща да си сложа плъгина, който изключва това.

    Comment by Kaloyan — January 27, 2009 @ 11:23

  3. Огледалното копие на правителствения сайт е вече в първа страница от резултатите при търсене на “РЕПУБЛИКА БЪЛГАРИЯ МИНИСТЕРСКИ СЪВЕТ” ;)

    Comment by Kaloyan — January 27, 2009 @ 13:30

  4. Правителството отвори сайта си за индексиране. Някакъв резултат, все пак.

    Comment by Yunuz — January 27, 2009 @ 22:47

  5. Ами браво! Само че толкова ли е сложно да се пусне, че 2 дена им отне да го направят ;)

    Comment by Kaloyan — January 28, 2009 @ 09:32

RSS feed for comments on this post. TrackBack URI

Leave a comment