Xpoint
   [напомнить пароль]

Удаление из URL ненужных символов

Метки: [без меток]
2006-09-03 19:15:43 [обр] Роман Маркин[досье]
Такая проблема: поисковики непонятно почему проиндексировали ссылки форума в виде:
http://www.домен.ru/............/cgi-bin/board/............./topic.cgi?forum=4&topic=131
Понятное дело, что это создает много проблем. Необходимо как то сделать переброс с этого неправильного URL на URL без точек... Если это возможно сделать с помощью mod_rewrite, то подскажите правило для этого. Спасибо!
спустя 47 минут [обр] Алексей В. Иванов(25/2861)[досье]
поисковики непонятно почему проиндексировали ссылки форума в виде:
Всмысле? URL'ы прям так с точками идут или вместо них что-то другое?
спустя 12 часов [обр] Роман Маркин[досье]
Алексей В. Иванов[досье], URL'ы идут с точками.
спустя 1 месяц 7 дней [обр] Роман Маркин[досье]
В общем справился сам. Делаю я это самим скриптом, который генерирует страничку, в данном примере это topic.cgi. Смысл такой: смотрю какой сейчас открыт у юзера URL и проверяю с тем, который должен быть. Если они не совпадают, то делаю редирект на правильный URL. Если кому то пригодится, то вот как это выглядит на практике:
$actualurl = "http://".$ENV{'HTTP_HOST'}.$ENV{'REQUEST_URI'};
$correcturl = "правильный_URL";
if ($actualurl !~ /^$correcturl/i) {
print "Status: 301 Moved Permanently\n";
print "Location: правильный_URL\n\n";
exit;
}
спустя 1 час 6 минут [обр] Алексей Севрюков(47/1280)[досье]
Роман Маркин[досье] А можно узнать домен и поисковик, который так интересно индексирует?
спустя 1 час 20 минут [обр] Роман Маркин[досье]

да легко. домен bg.nnov.ru, и исключительно все поисковики проиндексировали сайт не верно. возжно когда то был глюк либо сервака, либо скрипта, и ссылки выдавались непонятно как и видимо в это время сайт проиндексировался. поехали:

Google - проиндексировал с пробелом после cgi-bin/
Яndex - после /board стоит %20 и точки в URL
Rambler - после /board стоит %20 и аналогичные точки в URL

надеюсь, что после очередных апдейтов всё встанет на свои места...

спустя 9 минут [обр] Алексей Севрюков(47/1280)[досье]

Я все таки полагаю что это не глюк поисковых систем, ни разу ни с чем подобным не сталкивался, причем в трех сразу. Возможны следующие варианты:

  1. Глюк движка, маловероятно.
  2. Ссылки такого вида кто-то ставит на Вас или они есть где то на Вашем сайте - наиболее вероятно.

Пробегитесь по логам, может по рефереру станет понятно на каких страницах нашлись такие ссылки.

спустя 58 секунд [обр] Алексей Севрюков(47/1280)[досье]
Да, и в дополнение можете воспользоваться каким-нибудь роботом для проверки ссылок на своем сайте.
спустя 3 часа 58 минут [обр] Роман Маркин[досье]
Я все таки полагаю что это не глюк поисковых систем

Если Вы заметите, то я даже и не думал (и не писал), что это глюк поисковика. Хотя конечно я так думал до того момента, как не увидел, что это не только в одном поисковике...

Да, и в дополнение можете воспользоваться каким-нибудь роботом для проверки ссылок на своем сайте.

А как проверить? Эти ссылки были рабочие...

спустя 2 часа 23 минуты [обр] Алексей Севрюков(47/1280)[досье]
Я уже проверил, на Вашем сайте вроде как проблем нет. Значит на каком то внешнем сайте стоят такие.
Powered by POEM™ Engine Copyright © 2002-2005