Порог срабатывания модуля поиска перефразирования в антиплагиат ВУЗ, при работе с заспамленными (распространёнными) текстами

Из статьи в статью я пишу одну и ту же фразу – «высокий показатель уникальности текста, при проверке в антиплагиат ВУЗ, можно достичь при отличии текста после перефразирования от текста источника на 81% и больше». Это правило касается текстов, которые собраны методом компиляции, не имеющих высокую популярность.

Справедливо задать вопрос, какой процент отличия текстов, при сверке по шинглам, состоящим из двух слов, должен быть достигнут для заспамленных текстов, текстов, которые в базе проверки антиплагиат имеют тысячи и десятки тысяч вариантов перефразирования.

Мы, вместе с рерайтером Дианой Журавской (@id20823435) провели эксперимент, текст исходник перефразирован с помощью нейросети КонтрПлагиат, на рис. 1, ниже, видно, что в результате перефразирования достигнуто отличие текстов – 88%, использован метод проверки отличия по шинглам, состоящим из трех слов.

Рисунок 1 – Проверка отличия текстов, по шинглам, состоящим из двух слов, левое окно, текст после перефразирования, правое окно, текст источника

Как показала проверка в Антиплагиат ВУЗ, данный текст является заспамленым, поэтому мы получили уникальность 10 %, рис. 2, пример текста представлен на рис. 3.

Рисунок 2 – Достигнутое отличие, при проверке по шинглам, состоящим из двух слов – 88%, это дает показатель уникальности в антиплагиат ВУЗ – 10%

Рисунок 3 – Текст после перефразирования, отличие по шинглам 88%, показатель уникальности АП ВУЗ – 10 %

В результате ручного изменения шинглов, мы дополнительно изменили 10 шинглов, словосочетаний, состоящих из двух слов, рис. 4.

Рисунок 4 – Ручное изменение 10 шинглов, состоящих из дву3х слов, дало отличие текста – 97%

Результат проверки текста в антиплагиат, версии ВУЗ, представлен на рис. 5, пример текста на рис. 6.

 

Рисунок 5 - Результат проверки текста в антиплагиат, версии ВУЗ – 100% уникальности

Рисунок 6 – Пример текста после дополнительного, ручного перефразирования

Таким образом, как показал эксперимент, модуль поиска перефразирования, используемый Антиплагиат ВУЗ квалифицирует текст как плагиат, опираясь на незначительное число ключевых шинглов, наш эксперимент показывает, что изменение нескольких ключевых шинглов позволяет достичь резкого скачка уникальности, с 10 до 100%. В практическом плане, обретение умения находить ключевые шинглы будет обозначать, что разгадан алгоритм проверки текстов, используемый антиплагиат ВУЗ.