Какой программой обнаружть, имеются ли в большом тексте одинаковые фрагменты или предложения (повторы) ?

2 года назад от Ринат Кузаев

2 Ответы

0 голосов
Программа UltraCompare, она платная, есть триал на месяц. В комплекте утилиты для сравнения и объединения. Можно сравнивать по тексту и двоичному содержимому.
2 года назад от Lorrine5048
0 голосов
Составьте список биграмм, отсортируйте их по алфавиту и посмотрите, есть ли повторы. Я бы сделал при помощи утилит sed, awk, sort и uniq в виде скрипта для bash но можно и на Python, Basic или JavaScript (но зачем? )
2 года назад от Sergei

Связанные вопросы