Перейти к содержанию
    • Ширина форума %
Перед созданием темы - убедитесь, что вы создаёте её в правильном разделе.
Темы оформленные не по образцу шаблона - не подлежат публикации на форуме.
  • 0

Порекомендуйте программу для поиск текста


GrandMouse

Рекомендуемые сообщения

Здравствуйте.

 

Нужна программа для поиска сходных тестовых фрагментов в текстовых файлах на домашнем компьютере.

Чтобы умела находить не только посимвольно совпадающий фрагмент, но и похожие, с небольшими изменениями.

Например: вместо точки поставлен восклицательный знак, или символ нового абзаца заменён на пробел, или пара слов заменены на другие, или вставлена пара лишних предложений.

Желательно, чтобы умела работать с различными кодировками, и поддерживать как минимум два формата: .doc и .txt

Желательно, бесплатную.

Накопилось множество текстовых файлов, с повторяющимся текстом.

Ссылка на комментарий
Поделиться на другие сайты

  • 0
В 25.02.2024 в 11:31, Std_fast сказал:

она первоначально индексируется т все документы

... Индексируется в документы? Т.е. меняет исходники и что-то туда прописывает?

Ссылка на комментарий
Поделиться на другие сайты

  • 0
7 часов назад, John_Doe сказал:

txt обычный Total Commander сравнивает.

doc вроде как своими средствами, Word может.

Word не ищет похожие фрагменты, только посимвольно равные.

 

TC через сравнение файлов сравнивает только между двумя документами. Для попарного сравнения нескольких сотен файлов уйдет много времени. +ТС не всегда верно распознаёт кодировку в сравниваемых файлах. 

А поиск по нескольким файлам с опцией "с текстом" работает только для посимвольно равных фрагментов. В таком варианте, насколько я помню, только игнорирование регистра(прописные/строчные буквы) можно выставить.

*Если только поиск не через какие-то внешние плагины, или в новых версиях ТС не добавили расширенные функции...

 

7 часов назад, Std_fast сказал:

нет формирует базу данных документов, потом по ним осуществляет поиск. 

Спасибо. Это важно, т.к. у меня были проблемы с программами меняющими исходник (IDtag - заполняла поля в .mp3 файлах, но при этом портила сами файлы, IMatch - хранила тэги и категории не в отдельном файле, а запихивала прямо в .jpg раздувая их размеры х2-х3 раза и т.д..) 

У вас уже установлена? Подскажите, похожие фрагменты определяет? Вроде "ма-ма мыла раму." и "МАМА   сегодня не мыла раму, а ТОЛЬКО подоконники!"

 

2 часа назад, ArktiBaiva сказал:

[url=https://arkti.ru]Арктика[/url] - северная полярная область Земли, включающая окраины материков Евразии и Северной Америки, почти весь Северный Ледовитый океан с островами и прилегающие к нему части Атлантического и Тихого океанов. Название её происходит от греческого слова arctos (медведь) и связано со звёздами: Полярная звезда, находящаяся почти точно в зените над Северным полюсом, принадлежит к созвездию Малая Медведица.

Познавательно.

Изменено пользователем GrandMouse
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Восстановить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...

Важная информация

Уважаемый гость, прежде чем пройти регистрацию или создать тему - ознакомьтесь с правилами форума - Правила