Итак у нас есть часто встречающаяся в суровых буднях оптимизатора задача - нужно удалить из массива строк (это или напарсеные ключи - или генерированные анкоры, или еще какая нибудь хрень, короче -нужно убрать все строки содержащие определенные слова.
Как это сделать с помощью текстового редактора Notepad++ и регулярных выражений.
Для чего это надо:
Предположим, у нас есть город Королев, московской области, и есть ключи из вордстата яндекса.
В этой куче нам надо выпилить все, что не имеет отношения к этому славному городу.
А именно:
Королев Сергей Павлович - город хоть и назван в его честь, но биография нам не нужна.
Наташа Королева - певичка, экс жена Николаева, жена Тарзана. Ее песни и голые фотографии нам тоже не нужны.
Делаем регулярное выражение:
.*Наташа.* и выпиливаем все строчки с Наташей.
.*Сергей.* и выпиливаем все строчки содержащие слово Сергей.
Собственно картинки, как это сделать:
Готово. Повторяем необходимое количество раз. Следите, чтобы не вынести случайно нужные нам строки.
Далее, удаляем пустые строки в Notepad++ (Выбираем Регулярные выражения: (\n\r\е..))
И меняем вот это \n\r
На вот это \0
Вот и всё!
Внимание! Эта формула не удалит пустую строку, если в ней есть [tab]