Повышение уникальности заспамленных академических текстов с помощью нейросети КонтрПлагиат, модель - ТОРНАДО, дает один из лучших результатов, в равнении с ближайшими конкурентами.
Текст является заспамленным, если множество авторов, в течении многих лет используют один и тот же текст источника целиком. В итоге такого использования, например заимствование текста из реферата на популярную тему, которую дают практически в каждом ВУЗе, в базу Антиплагиат ВУЗ поступает несколько сотен работ, каждая из которых стремиться быть уникальной, при этом, для достижения уникальности, предыдущие версии работы (варианты рерайта) проверяются несколько раз (с первого раза сложно достичь нужную уникальность).
В итоге, в базе Антиплагиата за год может скопиться от одной до пяти тысяч версий одной и той же работы. Если тема реферата классическая, то за 5 лет количество вариантов рерайта в базе антиплагиат вуз может составлять несколько десятков тысяч. Эти варианты рерайта уже перебрали все мыслимые и не мыслимые варианты изложение текста, поэтому сложность каждого нового рерайта сводится к увеличению процента отличия текста, сверяемого по шинглам, состоящим из двух слов.
Мы уже рассказывали, что работу после рерайта можно проверять локально, за считанные секунды, если достигнут показатель отличия текста 81%, при сверке отличия шинглов, состоящих из двух слов, то такая работа имеет шанс показать высокую уникальность при проверке в Антиплагиат ВУЗ.
Данное правило не распространяется на заспамленные работы, именно для высокочастотных текстов нами предложен алгоритм ТОРНАДО, версии 2023 года, который позволяет получить существенно большее отличие текстов.
Касаясь заспамленных текстов, стандартная ситуация клиентского заказа услуги перефразирования, рерайта выглядит следующим образом, присылается работа, полностью заимствована из коллекции рефератов, клиент сообщает, что уникальность текста 0%, а требуется 70%. Что это означает фактически? 0% – работы нет, 70% – работа есть, другими словами, это работа со 100% готовностью. Задача нейросети КонтрПлагиат – написать новую работу, с высокой уникальностью, ориентируясь на текст работы источника.
Итак, обратимся к алгоритму ТОРНАДО и покажем его преимущества перед популярными нейросетевыми решениями, обещающими повышение уникальности текста. Текст источника приведен в приложении 1.
1) Показатель уникальности полученный в ReText .AI – сервис для генерации и перефразирования любых текстов, пример текста, после НейроРерайта, см. Приложение 2.
Как видно из скринов, показатели уникальности полученные в результате рерайта текста в ReText .AI находятся на уровне 53%, что существенно ниже рекомендуемого уровня 81%, следовательно данный рерайт не сможет пройти антиплагиат проверку.
2) Показатель уникальности полученный в сервисе «Рерайтер» от «Сбера»
Как видно из скринов, показатели уникальности полученные в результате рерайта текста в "Рерайторе" от "Сбера" находятся на уровне 5о%, что существенно ниже рекомендуемого уровня 81%, следовательно данный рерайт не сможет пройти антиплагиат проверку.
3) Показатель уникальности полученный в сервисе КонтрПлагиат, базовый алгоритм