Xpoint
   [напомнить пароль]

Фильтрация бот-трафа

Метки: [без меток]
2009-08-03 02:06:08 [обр] JIEXA[досье]

Здравствуйте
Под "бот-трафом" я имею ввиду трафик, который не является людьми, а является сгенерированый программами.

Представим что у нас есть сайт, с двумя скриптами
a.php и b.php

Сайты-партнеры размещаю рекламу нашего сайта ссылаясь на страницу нашего сайта a.php
Но есть нечестные участники системы, которые создали программы, которые эмулируют переход с их сайта на нашу страницу a.php

Страница a.php должна определить является ли посетитель настоящим или это бот.
И уже переадресовать посетителя на страницу b.php

Есть идея создать на странице a.php JavaScript код, который будет исходя из каких-нибудь данных (еще не знаю каких) вычислять значение, и переадресовывать посетителя на страницу b.php передавая в GET запросе полученное значение.
На b.php скрипт написанный на PHP будет из тех же данных вычислять значение.
Затем значение переданное GET`ом и вычисленное PHP скриптом будет сравниваться, и если оно не совпадает - то это бот.

Так вот, хотелось бы у вас спросить.

  1. Как вы считаете, в правильную ли я сторону мыслю? Подходит ли данное решение к этой проблеме? Или здесь нужно применить какие-нибудь другие способы?(Какие?)
  2. Если решение является правильным, то на основе каких данных надо вычислять? Ведь нужно чтобы в данной сессии данные, из которых идет вычисление были доступны и в скрипте a.php и в b.php, но злоумышлиник не мог их подобрать.+--
спустя 4 часа 44 минуты [обр] Алексей Полушин(0/231)[досье]
Непонятно почему значение, вычисленное ботом, будет отличаться ?
спустя 2 часа 11 минут [обр] Филипп Ткачев(0/112)[досье]
JIEXA[досье], то, что вы написали - полная чепуха. Нормальные боты умеют работать и с сессиями, и с куками, и с скриптами. Единственный способ ограждения от подобных вещей основывается на поведенческих свойствах человека. Например: распределение времени клика на кнопку, у человека оно неравномерное, а у машины тот же random() дает равномерное распределение, это подделать сложнее. Но тоже возможно.
Можно отслеживать резкое увеличение числа кликов - т.е. запуск программы-бота.
Можно сравнивать посещаемость сайта-источника и получать CTR.
спустя 6 часов [обр] JIEXA[досье]
Филипп, ясно дело, что взломать можно все.
Речь идет о защите, которая оградит от школьников и т.д.
Если JavaScript еще закодировать, то большинство не станет тратить время, чтобы разобраться в этом. + так же не будут работать стандартные боты-кликеры, нужно уже будет писать чисто под наш проект бота.
Или я не прав?
спустя 18 часов [обр] Филипп Ткачев(0/112)[досье]
Советую почитать про библиотеку SpiderMonkey, ещё.
Я думаю, что при особом старании можно найти соответствующего бота.
Powered by POEM™ Engine Copyright © 2002-2005