Xpoint
   [напомнить пароль]

Поиск на Xpoint: История

Внимание! Данный интерфейс находится в стадии глубокой переделки. Наберитесь терпения.

Последнее изменение

12 лет назад Владимир Палант[досье] изменил текст:
Текст: * Вариант: индексация страницы целиком, но с пометками к структуре. Поисковый клиент сможет определить, находятся ли все наденные слова в одном разделе страницы -- в этом случае он выдаст ссылку на конкретный раздел.¶
* В качестве ключевых фраз нужно поддерживать последовательности до трёх слов.¶
* Что считать однозначным разделителем фраз? точка/конец ссылки/конец параграфа/...¶
* Ключевые фразы различаются по категориям (метка/текст/ссылка/...), для каждой категории нужен отдельный индекс (хеш-таблица общая). В результатах поиска результаты по категориям нужно будет скомбинировать с соответствующими весовыми факторами.
* Информация для индексатора поставляется плагинами, по одному на каждый тип страницы. Задачи плагинов:¶
* Составить список страниц, обновлённых после определённой даты¶
* Для запрошенной страницы вернуть XHTML-код (возможно, уже прошедший предварительную обработку), дату последнего изменения, тип страницы (для определения её относительного веса)¶
* Парсер исходит из того, что на вводе валидный XHTML-код. Интерпретируется минимальное количество тегов (<a>, <p>), остальные удаляются. Категории (см. выше -- метка/текст/ссылка/...) определяются по классу элемента, реже -- по имени тега.

История предыдущих изменений

изменения дата автор
текст 2005-09-16 14:02:18 (12 лет назад) Владимир Палант[досье]
текст, заголовок 2005-09-16 12:49:36 (12 лет назад) Владимир Палант[досье]
RSS
Powered by POEM™ Engine Copyright © 2002-2005