Xpoint
   [напомнить пароль]

Подскажите касательно гугла

Метки: [без меток]
2005-11-08 18:52:46 [обр] Yuriy[досье]

Ввожу в гугле "site:autoline.com.ua" выдает, что проиндексировано 147000 страниц... Откуда столько, у нас столько нет. Пробывал спросить у гугла - отвечают, что такую информацию не выдают....

Может кто знает, что происходит?

спустя 7 часов [обр] VIG(0/839)[досье]

Посмотрите на URL'ы:

    autoline.com.ua/news.phtml?CODE=050221204434&a...
    autoline.com.ua/sales_full.php?CODE=051018104732&a...

и так далее и тому подобное.

Т.е., сценарий примерно такой: заходит робот на сайт, там ему присваиваются некие коды, и эти коды проходят по ссылкам. Следующий раз заходит робот на сайт, получает совсем другие коды (и для него это совершенно новые страницы!) ...

Тщительнее надо сайты проектировать, товарищи, с учетом роботов, однако ...

спустя 11 часов [обр] Yuriy[досье]

Насколько я понял Вы думаете, что каждая страница выдает код динамически??? Нет такой ситуации нет, у каждой страницы код статический, этих страниц много но не 147тысяч...

Может знаете как в гугле происходить переиндексайия и др, у меня ощущение что все страницы которые когда либо были на сайте гугл индексирует, а старые, т.е. те которых уже нет - не убирает.

спустя 43 минуты [обр] Алексей В. Иванов(4/2861)[досье]
Что такое "CODE" на Вашем сайте?
спустя 3 часа 26 минут [обр] Yuriy[досье]
параметр.
спустя 15 минут [обр] Алексей В. Иванов(4/2861)[досье]
Что в себе содержит?
спустя 19 минут [обр] Yuriy[досье]
Ну код конкретного объявления.
спустя 10 минут [обр] Алексей В. Иванов(4/2861)[досье]
Он никогда не меняется для конкретного объявления? Почему такой длинный-то?
спустя 2 часа 9 минут [обр] Yuriy[досье]
Никогда, а длинный на всякий случай, чтоб не совпало никогда..
спустя 2 часа 6 минут [обр] Алексей В. Иванов(4/2861)[досье]
Что такое "a" и "c"?
спустя 1 час 12 минут [обр] VIG(0/839)[досье]

Yuriy[досье]

а старые, т.е. те которых уже нет - не убирает

Именно так. И это очень удобно — иногда нужной страницы на сайте уже нет, но ее можно извлечь из кэша гугла.

спустя 7 минут [обр] Алексей В. Иванов(4/2861)[досье]
Не, страницы с одинаковыми URL гугл хранить не станет, а, насколько я понял, 140К страниц отродясь не было. Скорее всего, дело в зацикленности параметров.
Кстати, надо обратить внимание на то, что документы с двух адресов сразу идут (с "www." и без такового), что автоматически увеличивает кол-во страниц вдвое.
спустя 10 часов [обр] Старынин Валерий(0/57)[досье]
А еще можно параметры в URL местами поменять. Тоже разные страницы получатся. Я с этим столкнулся, когда скачивал сайты сам.
Вы попробуйте wget'ом, посмотрите. Может, и наберется страниц. Только сначала дома сервак поставьте.
Powered by POEM™ Engine Copyright © 2002-2005