Xpoint
   [напомнить пароль]

Что такое Таги (виа Автоматическая генерация тагов)

Метки: [без меток]
2007-02-16 19:33:48 [обр] Дмитрий Попов(15/509)[досье]

Вы, как мне кажется глобальным образом идеологически неверно понимаете понятие тагов.

Навеяно вот этой темой: http://xpoint.ru/forums/programming/PHP/thread/39648.xhtml.
У меня возникло ощущение, что либо я, либо автор, не понимают понимают понятия "таг".

Так вот мои мысли и доводы. Само понятие "таг" в наиболее популярном сейчас значении появилось в контексте Web2.0 и социальных сетей. И смысл тагов, как таковой именно в том, что они прославляются людьми. Как и смысл социальных сетей: "Контент делают посетители".

И по-моему именно как следствие вышесказанного, мне кажется что любая попытка полностью автоматизировать создание тагов автоматически превращает понятие таг в понятие "ключевые слова".

Почему я это пишу здесь а не в той теме:
Потому что я не уверен в правильности своих доводов и выводов. Потому выношу на суд общественности вопрос: Все таки, возможно ли идеологически создание тагов полностью автоматизированно? Ну и что вообще Вы думаете по этому поводу?

спустя 3 часа 48 минут [обр] Василий Свиридов(0/175)[досье]
Автоматически можно создавать список и предлагать его пользователю, на выбор. Но сами таги должны вешаться пользователем, IMHO.
В основном-то таги вешаются не на текстовый контент, а на всякое фото/видео... Его особо не поанализируешь..
спустя 1 час 37 минут [обр] Алексей Шоков(0/9)[досье]
Василий Свиридов[досье], хороший пример ваших слов — расширение FireFox для работы с сервером закладок del.icio.us. При добавление закладки проводится некий анализ и пользователю предлагаются на выбор таги, которые он может прикрепить к закладке.
спустя 2 дня [обр] Алексей В. Иванов(28/2861)[досье]
Полагаю, нет там никакого анализа. Просто, из базы предлагаются популярные варианты тагов (интерфейс для добавления URL загружается в ответ на указанный URL).
спустя 4 часа 13 минут [обр] Ярослав Витязев[досье]

Мне кажется, Дмитрий Попов[досье], вы совершенно правы и правильно понимаете смысл т.н. тагов (фолксономической категоризации контента). Такие маркеры определяются именно тем, что они создаются конечным пользователем и не налагают на него никаких ограничений (в отличие от других подходов, например, при таксономии).

В попытке предложения списка тегов, заранее подготовленных (автоматически сгенерированных) есть какое-то рациональное зерно; однако, если такое предлагать пользователю, возможно, он просто пропустит это поле и не будет его корректировать (добавлять таги, изменять неверные ассоциации тагов) — лень, великая сила.

Более того, если машина целиком за пользователя будет решать задачу категоризации контента, то все будет очень плохо. Пока в этом направлении ушли не так уж далеко от элементарного кластерного анализа, да и результаты практической реализации таких алгоритмов оставляют желать лучшего.

PS: Ресурс http://ponovomu.tomsk.ru/, к сожалению, отказался загружаться, поэтому текущую реализацию оценить не смог.
Релевантное: недавно писал на эту тему в своем блоге.

спустя 16 часов [обр] Сергей Чернышев(39/589)[досье]

Тэги (в переводе на русский - ярлыки). Их можно навешивать автоматически или просить пользователя это сделать.

Тему, на которую вы ссылаетесь, я не читал, но в принципе, тэги, которые вводят пользователи хороши тогда когда этих тэгов много, а использование алгоритмов выделения ключевых элементов (entity extraction) может быть полезно если вам нужно сделать это, а пользователей нету - тогда вы просто присваеваете тэги сами.

Возможно вы правы, говоря, что традиционно тэгами называются ярлыки присвоеные пользователями, но в общем случае это не так.

спустя 2 часа 28 минут [обр] Сергей Сирик(9/737)[досье]
Соглсен с Дмитрием. Если руками - то значит руками. Если автоматом - то чем это отличается от поиска? Если тегов руками не расставили - значит, не сочли данную единицу контента достойной. Ну и пусть ее. Есть много достойных единиц контента :)
спустя 2 дня 8 часов [обр] Сергей Чернышев(39/589)[досье]
Не всегда процесс позволяет расставить все тэги с нуля - порой нахождение всех имен участвующих лиц в какой-то статье может быть весьма полезным. Другой вопрос, что потом можно и ручками пройтись, но все перелапачивать вручную может быть слишком накладно.
спустя 1 день 8 часов [обр] VLAD(0/5)[досье]
Ярослав Витязев[досье]: сайт я прикрывал на время обновления
Обновил до версии 2 :-), предлагаю продолжить обсуждение в исходной теме http://xpoint.ru/forums/thread/39648.xhtml, с радостью выслушаю полезные комментарии
спустя 2 месяца 13 дней [обр] vlad+(1/38)[досье]
ну, если позволите - мои 5 копеек про тэги
что бы ни писал Великий и Ужастный - тэги может расставлять робот
по-моему — должен, ибо всем людям подряд не доверяю
только авторизованным
но и они могут ошибаться
даже если не думать об ошибках - кто будет до-расставлять новые тэги старым текстам?

но
это если этого робота будут правильным образом учить, время от времени корректировать
можете смеяться, а меня наш же контент-мастер спрашивал, кто расставляет тэги - он был уверен, что это или живой человек (всего 10-30 публикаций в день - почему бы и нет?) или какая-нибудь нейронная сеть, которая обучится и поработит Землю :)
спустя 7 часов [обр] Сергей Сирик(9/737)[досье]
vlad[досье]
А таки да поработит ... потому как будет фактически управлять потоком информации к человеку и оказывать тем самым на него огромное влияние ...
спустя 3 часа 1 минуту [обр] vlad+(1/38)[досье]
Сергей Сирик[досье]таки нет
патамушта оно (в моем варианте) тупое и без до-обучения через какое-то время зачахнет
Powered by POEM™ Engine Copyright © 2002-2005