На смартлабе авторы за 10 лет наплодили 150 тыс. тегов.
Очевидно, что среди них есть совершенно бессмысленные, никому не нужные.
Может быть нам стоит ограничить создание новых тегов, и дать возможность указывать только те, что есть или голосовать за введение новых.
Эту идею уже ни раз просили сделать, приводя в пример сайт Пикабу.ру.
На этой картинке например видно, что только одних «левых» тегов по S&P500 целая куча.
Кстати, кто-нибудь объяснит, почему вы считаете что предопределенные теги как на пикабу лучше, чем свободные?
Интересно ваше мнение
Определенные тэги лучше, т.к. кто то поставит тэг" золото", кто -то «золото лонг», кто-то «рыжуха», «голда», «голд», а должен быть на все это один тэг…
чтобы модерировать теги пристальнее
Но это слишком трудоёмко, потому что тег любой может быть именно к посту, упоминающий того же «сиплого», однако его изменение несёт иной смысл. Кроме того придётся досконально изучать админу текст поста на соответствие тегов самому смыслу.
Тупиковый путь.
Нормальный путь я описал ниже. простой.
Можно и в автомате чистить. Запросом SQL, по применимости, например. Несколько секунд все удовольствие. Статистика применимости есть, надеюсь.
Теги это же как якори. Т.е. по тегу КУРС ДОЛЛАРА создается страница и там выходят все новости по данному тегу.
Потом создается тег КУРС БАКСА и там тоже другая страница, хотя эти страницы можно объединить.
Попробуй объединить теги в админке, раз в месяц будете перебирать и объединять
А нафик они вообще нужны? Почему не оставить только эти?
1. Возможность подписывать на них.
2. Возможность блокировать определенные теги.
Да, я люблю пикабу)
Тег Носорог будет?
* «от улыбки станет всем светлей»....
и тэг «не умею ставить теги»
))
Сбывается?
Я бы даже приплачивал за heat maps, где и в чем больше всего бузят.
Кто хочет, что б его пост не увидели -пусть выдумывает дурацкие теги.
а на Пикабу ровняться не надо — это вообще днище рунета
мы на пикабу деградировать ходим
Теги новые помечать.
Если они просуществовали упоминаниями более 2х недель — оставить. если нет — стирать из базы.
Тег может быть временным, может быть зарождающимся.
В процентах от упоминаний выследить сложно и бесполезно.
Математически чистить — смысла нет.
По времени.
2 недели.
Можно внести критерий минимально упоминания за 2 недели.
5-10 раз — левый тег или попытка раскрутить, или просто оЧепятки.
Трём всё, что не употребляется 2 недели, кроме тех которые по ранжированию в базе занимают 90% первых объемов по упоминаниям.
Вот и 2 параметра, которые реализуются программированием буквально за 15 минут к базе!
Тим, всё же просто! включай мозг программистов!
Не надо даже менять базу… просто после перестройки 2 недели «карантина» на удаление, но ввести в базу отдельный параметр… первый день употребления тега нового.
Далее всё просто.
Проверка на «неприкасаемые» 90% (условно).
Проверка оставшихся, не попали ли они в 90%.
Проверка даты на 14 дней тех, которые в оставшихся 10%.
И Убираем из базы напрочь те, что не удовлетворяют 14 дням и 90% используемых.
Всё же просто.
Как «децильный анализ», только фильтрануть надо… проверку можно делать 1 раз в неделю, дабы не тратить машинное время ))))
меня например теги жутко бесят при написании постов. чаще всего просто не хочу никакие писать. я готов доверить это роботу
зачит пиши «не умею ставить тэги»
Ну то есть при написании статьи ты можешь вбить любой тег, но если в следующий год этот тег никто не активировал и не использовал повторно — он удаляется из статьи.
Это будет кстати мотивировать авторов использовать адекватные теги.
мой тэг «масонские новости» — вполне адекватный.
но им пользуюсь только я.
ок.
надо ещё будет на тэг авторское право забить ))