Лемматизация и нормализация фраз
Приводит слова в ключевых фразах к основе (стемминг по алгоритму Портера для русского) и схлопывает словоформы. Помогает увидеть, что «доставка цветов москва» и «цветы доставка москва» — одно и то же, и убрать дубли семантики (разные падежи, число и порядок слов), которые обычная дедупликация не ловит. Считается в браузере.
Фразы
0 строкРезультат
0 строкКак пользоваться
- Скопируйте ключевые фразы в левое поле — по одной на строку.
- «Нормализовать» — покажет каждую фразу в виде основ слов. «Умный дедуп» — оставит только уникальные по смыслу фразы, схлопнув словоформы и (по желанию) порядок слов.
- Справа — обработанный список и счётчик удалённых дублей. Скопируйте кнопкой.
Частые вопросы
Это настоящая лемматизация?
Строго говоря — стемминг: слова приводятся к основе по алгоритму Портера (Snowball) для русского, без словаря. Он отбрасывает окончания, поэтому формы по падежам, родам и числам — «доставка», «доставки», «доставке», «цветов», «цветы» — сходятся к одной основе. Полную словарную лемматизацию (которая знает, что «лучше» — форма «хороший», а «куплю» и «купить» — один глагол) браузерный инструмент без словаря не делает: редкие чередования и глагольные формы он схлопывает не всегда. Для чистки семантики от падежных дублей этого достаточно.
Чем умный дедуп лучше обычного?
Обычное удаление дублей убирает только полностью совпадающие строки. Умный дедуп сравнивает фразы по основам слов: «доставка цветов» и «доставка цветок» он считает одинаковыми, а с опцией «без учёта порядка» — ещё и «цветы доставка». Так из ядра уходят скрытые повторы.
Что делает опция «без учёта порядка слов»?
В режиме дедупа она считает дублями фразы из одних и тех же слов в любом порядке: «купить телефон» и «телефон купить» схлопнутся в одну. Без неё порядок важен. На нормализацию опция не влияет.
Данные куда-то отправляются?
Нет. Всё работает прямо в браузере на JavaScript — список никуда не загружается и не сохраняется на сервере.
Ещё инструменты для SEO и маркетинга
Кластеризатор запросов, генераторы sitemap и robots.txt, минус-слова, разметка Schema.org и калькуляторы — в разделе инструментов.