Подозрительные, генеративные тексты GPT – как КонтрПлагиат рушит фантазии Антиплагиата

30 сентября 2023 г. наш сервис потопили обращения клиентов, которые писали по всем нашим мессенджерам. Антиплагиат сменил алгоритм выявления плагиата и выявления генеративных текстов, поэтому все написанное студентами стало подозрительным. К сожалению мы этой новации не заметили, но с проблемой стали разбираться.

В чем заключается нивелирование новых "изобретений" антиплагиата РУ, связанных с обнаружением генеративных текстов.

Объективно мы имеем два факта:

- Когнитивные возможности ИИ, например GPT, ChatGPT, GigaChat, YaGPT, Claude и др., сильно переоценены - нейронные сети и антиплагиатный ИИ не являются исключением;

- Разработчик GPT, компания OpenAI, признала, что на сегодняшний день не существует способа точного распознавания генеративных текстов ИИ – поэтому громкое заявление Антиплагиат ВУЗ о том, что они умеют находить генеративные тексты на 50%, как минимум, фейк.

Позвольте нам, показать вам 4 скриншота. Обратите внимание, что содержание текста неизменно, однако в одном случае текст генеративный, в другой проверке НЕ генеративный. Представленные скриншоты подтверждают, что антиплагиат РУ не умеет определять генеративные тексты и ориентируется на несколько иные метрики. Если эти метрики выключить, то антиплагиат не сможет искать генеративный текст. Ниже приведены мысли Антиплагиата, как он ищет генеративные тексты.

У искусственно сгенерированных текстов есть особенности. Нейросети часто «придумывают» довольно правдоподобные ложные факты, создают недостоверные ссылки, допускают ошибки в логике построения текста, коверкают термины и клише, вставляют не несущие смысловой нагрузки формулировки и др.

В данной области не может быть доказательств, т.к. невозможно сказать с вероятностью 100%, что текст писал не человек. Рекомендуем проверяющему эксперту при анализе:
- проверить связность текста и наличие смысловой нагрузки;
- проследить логику и связь сгенерированных фрагментов с остальным текстом;
- сверить, нет ли повторяющихся практически дословно фраз;
- выявить, нет ли многократно повторяющихся, но перефразированных мыслей («вода»);
- удостовериться в наличии и корректности ссылок.
Наличие одного или нескольких подобных признаков уже достаточный повод для отправки текста на доработку, независимо оттого, кто его писал.

Дабы вы не теряли времени даром, мысли антиплагиата не несут нужной информации, проверка осуществляется с учетом перечисленного, но по другим показателям. Обратите внимание, на скриншотах чистый текст, но антиплагиат его считает генеративным, это подтверждает, что текст имеет вторичное значение при выявлении генеративности.