Xpoint
   [напомнить пароль]

Опять про поиск

Метки: xpoint, google, поиск
[удл]
2005-09-10 13:02:05 [обр] Давид Мзареулян(13/1003)[досье]

Гугл — это хорошо. Наверное. В теории. На практике он покрывает не все темы XPoint-а. Если при старом поиске, долго поизвращавшись, можно было всё-таки составить поисковый запрос, выводящий куда нужно, то сейчас это невозможно — если страницы в базе гугла нет, то она и не найдётся. Вот мне нужно тему найти — Постоянное соединение с чат-сервером (308884) — и что делать? А ничего. Нет инструментов.

Господа, ну не нужны нам все эти релевантности с морфологиями. Прикрутите совсем простенький поиск, который тупо будет искать введённое слово в заголовке темы. Всё! Нагрузка на сервер нулевая. Пусть гугл остаётся, но пусть и это тоже будет.

спустя 1 час [обр] Rom McRitsky(9/441)[досье]
Кстати, поиск, который работал год назад, до введения БЗ, справлялся просто шикарно..
спустя 27 минут [обр] Давид Мзареулян(13/1003)[досье]
htDig-то? Да, он работал лучше многосёрча.
спустя 50 минут [обр] Евгений Бондарев aka Eugene Bond(49/1600)[досье]
Господа, ну не нужны нам все эти релевантности с морфологиями

Кстати, гугль действительно гораздо хуже (как это ни парадоксально) дает результаты поиска, по сравнению с тем же //htDig. Видимо сказывается "незаточенность".

Хуже то, что сайдбар искать не могет :(

спустя 2 часа 52 минуты [обр] Давид Мзареулян(13/1003)[досье]
Я простой пример приведу. У себя на сайте я ищу в сообщениях (их у меня сильно больше, чем тут, уверен) банальным ILIKE-ом и вывожу результаты в хронологическом порядке. Да, это ужасно неконцептуально, это достаточно медленно, тяжело для машины и не учитывает морфологию. Т.е. я не хвастаюсь — это в самом деле решение совсем уж наколенное. Но! Ещё не было случая, когда я не нашёл бы того, что искал максимум за пару запросов. На ХПоинте же даже во времена хтДига три-четыре уточняющих запроса были нормой.
спустя 5 часов [обр] 30-ый(-7/584)[досье]

На самом деле неочевидный вопрос. На мой взгляд часто лучше не иметь никакого поиска, чем плохой. Сколько раз я искал что-то, а потом поминал Андрея нехорошими словами, за этот поиск.

Может Гугл и не лучше, но пользователи хоть в этом случае буду плохо думать о Гугле, а не о XPoint'е... что менее опастно для дружеской атмосферы на форуме :-)

спустя 1 час 59 минут [обр] Давид Мзареулян(13/1003)[досье]
30-ый[досье] Мне тему найти надо. Я не хочу ни о чём думать — ни о ХПоинте, ни о Гугле, ни об атмосфере. Мне просто нужно найти тему, которая точно на сайте есть.
спустя 6 часов [обр] Алексей В. Иванов(40/2861)[досье]
сообщение промодерировано
Ну не знаю. Я сейчас проЯндексил xpoint.ru (а по словам Андрея Яндекс "старается" на сайте, как все участники вместе взятые) и тоже не нашел той темы.
"А был ли мальчик?"
спустя 2 часа 20 минут [обр] 30-ый(-7/584)[досье]
...когда я делаю запрос, специальный очень мощный компьютер начинает быстро-быстро прочитывать весь интернет. Вот такие там быстрые компьютеры стоят... наверное Пентиум 3.

Подполковник Схаба, МГТУ им. Баумана. "Монолог о поисковых машинах"

http://yandex.ru/yandsearch?st......E0%F2-%F1%E5%F0%E2%E5%F0%EE%EC

Ну как же это вы представляете нати тему от 2005-09-09 17:17:32 уже 2005-09-10 13:02:05? Вот сегодня 11-ое и в Яндексе тема уже есть. Подождем еще пару дней и в Гугле тоже появится.

спустя 12 минут [обр] 30-ый(-7/584)[досье]

... возможно я не вполне понял автора. Т.е. надо найти не тему из первой реплики, а тему из темы из первой реплики. Т.е. "как сделать чат по типу chat.php.spb.ru".

И у меня есть серьезные подозрения, что тема была просто переименована и теперь она называется Помогите придумать обновление окна браузера на Javascript или PHP.

спустя 1 час 56 минут [обр] Давид Мзареулян(13/1003)[досье]

Нашёл. Вспомнил одну ключевую фразу из обсуждения. А теперь сравните:

http://yandex.ru/yandsearch?te......EE%EA%E5%F2%EE%E2%22&stype=www
http://www.google.com/search?i......%22&btnG=%C8%F1%EA%E0%F2%FC%21

Нужны комментарии?

спустя 9 минут [обр] Давид Мзареулян(13/1003)[досье]

А вот так находится исходное название темы.

Причём Гугл по этому же запросу тоже её находит, но не на www.xpoint.ru, а на www.xpoint.net.ru (потому гугл с ограничением поиска по xpoint.ru ничего не даёт).

спустя 1 минуту [обр] Давид Мзареулян(13/1003)[досье]
Виноват, ссылка с «находит» должна выглядеть так.
спустя 1 час 38 минут [обр] Rom McRitsky(9/441)[досье]
при клике по ссылке "в других поисковых системах: Google" на странице http://yandex.ru/yandsearch?te......EE%EA%E5%F2%EE%E2%22&stype=www - тоже находит, но снова-таки на www.xpoint.net.ru
спустя 4 минуты [обр] 30-ый(-7/584)[досье]
Над сделать редирект с www.xpoint.net.ru. Точно также как он сделан с www.xpoint.ru, только он должен автоматически отключатся во второй половине февраля каждого года :-)
спустя 3 часа 9 минут [обр] Владимир Палант(122/4445)[досье]
Давид Мзареулян[досье]
Гугл — переходное решение. Мы уже убедились, что полноценной заменой поиска по сайту он быть не может. В конечном счете планируется восстановить поиск по сайту, но использовать более надежный и оптимизированный под Xpoint вариант.
спустя 4 часа 3 минуты [обр] Антон Клесс(-1/25)[досье]
А что именно? Если это не секрет...
спустя 11 часов [обр] Андрей Новиков(288/1242)[досье]
Антон Клесс[досье], неужели не очевидно? Всё хорошее приходится делать самим. :)
спустя 3 часа 16 минут [обр] Дмитрий Донцов+++(0/68)[досье]

Андрей Новиков[досье]
это же

бесполезная трата времени
(с) Владимир Палант

;)

спустя 4 часа 33 минуты [обр] Владимир Палант(122/4445)[досье]
Будем надеяться, что большую часть алгоритмов удастся где-нибудь содрать, поскольку это действительно бесполезная трата времени. Своё — только разбор документов и расстановка весовых факторов.
спустя 19 минут [обр] Антон Клесс(-1/25)[досье]
И все-таки, для тупых, почему нельзя заточить под себя многосерч?.. Он недостаточно функционален, или медлителен, или крив?.. В чем его недостатоки?
спустя 40 минут [обр] Андрей Новиков(288/1242)[досье]

Антон Клесс[досье], он постоянно мусорит базу и нагружает сервер.

Владимир Палант[досье], да в общем то составить словарь — дело нехитрое, пропарсить док и вроде тоже. Главное как раз и есть правильный подсчет весов.

спустя 2 часа 37 минут [обр] Владимир Палант(122/4445)[досье]
Нет, главное — по поисковому запросу найти именно то, что пользователь искал. А это очень нетривиальная задача, за этим целая теория стоит. Причём весовые коэффициенты — очень малая часть этой задачи. Да и построить словарь для эффективного поиска тоже не так просто, MnogoSearch с этим не справился.
спустя 1 час 12 минут [обр] Дмитрий Донцов+++(0/68)[досье]
то, что пользователь искал

Это то, что пользователь думал... Это действительно нереально...
Но, если есть продуманная (с учетом аспекта поиска) структура хранения информации, то построить словарь и вычислить вес слова (фразы) для каждого документа не так уж и сложно...

зы
Для конкретного сайта, остальное за рамками вопроса...

спустя 3 часа 18 минут [обр] Давид Мзареулян(13/1003)[досье]

ИМХО, поиск на сайте, населённом по преимуществу технарями, должен иметь минимальный AI. Поиск — это запрос к базе. Если я знаю логику обработки запроса, я всегда смогу его составить так, чтобы он нашёл то, что мне нужно. Например, если я знаю, что поиск просто ищет в сообщениях введённую мной подстроку и вываливает всё, что нашёл (самый тупой вариант), то я и сочинять эту строку буду соответствено. Если я знаю, что поиск отдаёт предпочтение заголовкам, то я буду прежде всего стараться вспомнить/представить заголовок нужного мне треда. И т.д. и т.п. Чем прозрачнее и проще алгоритм, тем лучше. А с навороченными алгоритмами, которые, якобы, лучше меня знают, что я ищу, приходится бороться, подстраиваясь под их тупизну и пытаясь угадать, что в них вложил автор.

Это как книга с подстрочным переводом — чтобы понять смысл, приходится синхронно переводить обратно на английский. Не надо за нас думать. Мы это и сами умеем. Дайте нам просто тупой и предсказуемый инструмент.

спустя 1 минуту [обр] Давид Мзареулян(13/1003)[досье]
Представьте, что SQL-базы начнут выдавать не то, что указано в запросе, а «то, что пользователь искал».
спустя 21 минуту [обр] Владимир Палант(122/4445)[досье]
Именно это он и должен делать — вываливать все результаты по вашему вопросу. Но сортировать он их должен так, чтобы то, что вы искали, находилось в числе первых результатов. Именно этим всегда страдал MnogoSearch — если я не помню точную подстроку из темы, которую ищу, то приходится перекапывать десяток страниц результатов поиска, чтобы найти нужную тему.
спустя 1 час 27 минут [обр] Давид Мзареулян(13/1003)[досье]
Ну, дай бог.
спустя 6 часов [обр] Андрей Новиков(288/1242)[досье]
Давид Мзареулян[досье], к тому же угадывать не придется. Мы его тут будем разрабатывать публично, сообща.
Powered by POEM™ Engine Copyright © 2002-2005