Свободно за индексиране огледално копие на сайта на правителството

Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…
Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…

Моят допълнителен принос в кампанията „SEO срещу правителството“ е огледалното копие на правителствение сайт, което вече може да се обхожда безпроблемно от паяците на търсещите машини. Сайтът така или иначе е счупен на повече от едно място, и е пълен провал, но пък това да може да се индексира от Гугъл е една малка победа на научно-техническия прогрес ;) Чудя се, колко време ще им трябва да оправят robots.txt, дали ще смогнат преди изборите ;)

Както и да е, сайтът е http://government.bg.kaloyan.info/, и страниците в огледалното копие се попълват когато се посети съответния линк от сайта: например като посетите началната страница на копието ще се изтегли началната страница на оригинала. Дал съм време за живот на огледалните копия от 12 часа, така че ако информацията не се опреснява често, няма страшно – не е бъг ;) Връзките със „cgi-bin“ в тях са леееко променени, за да се заобиколи недостатък от хостинга (изключване на ScriptAlias „cgi-bin“ или каквато и да е тъм магия), така че и това не е бъг ;)

Скриптът, Schtrack!,  който прави възможно функционирането на огледалното копие, ми се върти в главата някъде от 2004, обаче все нямам време или повод, за да го направя. Е, ето сега се появи добър повод, и резултата е налице. На който му се занимава, може да намери кода на приложението тук (а самото приложение тук), и да си го ползвате за каквото си искате (в рамките на GPL, разбира се).

1 февруари 2009: Една седмица по-късно вече има стотина страници индексирани от огледалото на правителствения сайт, което може да се отбележи като някакъв относителен успех, особено като се има предвид некадърните адреси на сайта (под некадърни разбирайте такива, които не прилагат най-добрите практики, а точно обратното – супер антични). Друг успех е променения robots.txt, който вече позволява индексиране в дълбочина. Хайде да видим колко други неща ще се променият до преди изборите ;)

„SEO срещу правителството“

Тази сутрин прочетохинтересен блог пост при Юнуз, който е забелязал едно електронно „извращение“ – сайтът на правителството е забранен за индексиране:

Инструкциите в robots.txt

Това е стандартен файл, който, сложен в основната директория на даден домейн, съдържа инструкции към търсачките какво от съответния сайт да индексират и какво — не. Съдържанието на този файл на сайта на българското правителство е:

User-Agent:*
Disallow:/

Преведено, това означава: “Ако сте търсеща машина, моля напуснете този сайт и не индексирайте неговото съдържание”.

Така се роди и веселата инициатива за показване на SEO среден пръст на правителството.

Една интресна инициатива породена от публикациите в два блога  – Yunuz & Oggin. Накратко – само с един линк от Вашият сайт или блог можете да покажете отношението си към това правителство (а и всички предни в по-новата ни история). Общо взето , продължаваме да си живеем в същият бомбок благодарение на неадекватните действия на хората, които избираме.

Схемата не е нова, има доста забавни примери в световен мащаб. Целта е чрез елементарна SEO техника – множество линкове към даден сайт ( http://www.government.bg/ ) да сочат с определена дума, за да може този сайт да се вдигне максимално високо в резултатите на Google. Съответно думата за сайта на нашето правителство е “Провал” .

Ето най-елементарният код за добавяне в сайта ви

<a href=”http://www.government.bg”>Провал</а>
можете да си го разкрасите както желаете, например с title таг

или просто добавете линка към  http://www.government.bg/ в блога си с заглавие Провал

Сега, няколко часа по-късно, вече има и Facebook група на инициативата, „SEO срещу правителството“ ;)

Как вие може да помогнете ? Ако имате сайт, поставете връзка към www.government.bg с текст „провал“. Може да е в блог пост, може да е в блогрола, може да е в подписа ви за форумите, които използвате … важното е да има повече връзки ;)