Все страницы, формируемые методом POST, надо закрывать от индексирования

14.06.2007

Возьмем, например, тот же поиск. Ведь попадание страницы с поиском в индекс всегда не предвещает ничего хорошего. Ибо поиск – это не уникальный контент. Это всегда выжимка из других страниц, уже существующих на сайте. Для поисковиков это не есть гут. Попадет в supplemental и все, больше ее никто не увидит, а база поисковика будет замусорена раз и навсегда.

Спрашивается, почему я вдруг стал на эту тему беседовать. А все из-за адсенса. Ведь не секрет, что основная цель адсенса в России – это не заработок (ну нереально на нем много заработать), а если и заработал – то вывод денег это длиннющая эпопея на несколько месяцев. А ставят адсенс для того, что бы гугль индексировал сайт как можно лучше и чаще. Нет, гугль конечно не яндекс и нормально индексирует, но так скорость еще быстрее.

Так вот, засветился в логах у меня поисковый запрос, не важно какой. И тут же на него пошел робот гугля и естественно добавил в свой индекс. Страничка выглядит примерно так:

index.php?q=слово&x=4&y=13

На X и Y внимания можно не обращать, а вот внимание на то, что в индексе появилась еще непонятная страница обращать надо. Плохо это. Представьте себе, если на серьезном сайте в день ищут по 100 раз – и это значит, что в поисковике каждый день будет появляться еще около сотни страниц, не несущих уникального контента. Пускай даже не видимых из ссылок на самом сайте.

Я думаю, что единственный выход из этого – делать noindex на страницы поиска. В robots.txt закрывать бессмысленно.

Но с другой стороны, если мы у формы поиска, как в Joomla, сделаем action равным ‘index.php’, то получается, что страница index.php, которая еще и главная морда сайта, будет иметь разный контент, всегда! (в те моменты когда у пользователя не отключен адсенс и он видит его). Гугля сойдет с ума, и noindex тоже ставить нельзя.

И что же я думаю – а нельзя ставить адсенс сквозняком на все страницы. Его можно ставить только там, где предвидится контент. Или изменять движок адсенса, что бы яваскрипт смотрел (по-моему так можно), что если метод страницы это не GET – то лучше не вносить эту страницу в индекс. Рекламу показать, но не считать это новой страницей.

Иэххх, рассказал бы кто это парням из гугль-лабс :-)


Комментирование этой статьи закрыто

Комментарии [3]

  1. Июн 18, 07:48 , chilly_bang

    1. заработать можно. но не в россии.
    2. думается мне, гуглиный алгорытм допускает некое количество дублированного контента. этот допуск делается именно на дублирование не из злого умысла, а изза движков и тд. гугл не такая сволочь, чтоб кикнуть всех, у кого сдваивание произошло.
    3. страницы с адсенс стоят на худших позициях чем страницы без – гугл барыг не уважает, хотя сам зарабатывать не стесняется.

  2. Янв 10, 19:57 , tenshi

    гугол в принципе не может проиндексировать пост запросы :)

  3. Янв 10, 22:57 , Dead Krolik

    О какой номер. А я и не знал. Как же так.

    Хотя стоп, надо просто вчитаться в пост. Я говорю об урлах и тому, что контент этого урла, показываемый пользователю не соответствует контенту полученному гуглом при методе гет.

Комментирование этой статьи закрыто

Кто я


Возраст: 23
Профессия: заяц


Категории


Полезные ссылки


Стишок

Зайчик-зайчик, скок-поскок!
Н-нна тебе дробину в бок!
Не с капустой же мы будем
Жрать на Новый год пирог...

eu-shestakov.livejournal.com