«Так, если коротко: берем пост, очищаем от всякого мусора в виде предлогов, числительных и так далее. Берем готовые теги, если они есть в посте. Если тегов не набралось шесть, пытаемся извлечь их самостоятельно. Прогоняем текст через алгоритм TextRank, определяем вес каждого слова на основе того, кто с кем рядом стоит; слово с большим весом придает больший вес стоящим рядом словам.
С помощью векторной близости ищем похожие посты и берем оттуда два тега. Объединяем всё вместе и получаем от 0 до 6 тегов».
🟪 MAX ❤ TG

Комментарии (10)