Сервис проверки Антиплагиат.ВУЗ готовится к крупным обновлениям, на свет рождена новая формулировка: "В документе обнаружена маскировка заимствований, предположительно, с помощью искусственного интеллекта".
GPT, или Generative Pre-trained Transformer, - одна из самых известных моделей машинного обучения для генерации текста. Ее использование поднимает вопрос о плагиате, поскольку GPT может генерировать текст достаточно высокого качества и эти тексты могут быть оригинальным.
Одним из способов идентификации текста, сгенерированного ChatGPT, является использование анализатора стиля письма. Этот подход основан на идее, что каждый автор имеет уникальный стиль письма, который может быть описан определенными параметрами, такими как длина предложения, порядок слов и т.д. Сравнивая полученные параметры между оригинальным текстом и текстом, созданным или перефразированным с помощью GPT, можно использовать ИИ для обнаружения сокрытия заимствований.
Другой подход основан на создании набора ключевых слов и фраз, характерных для оригинального текста. Затем этот набор ключевых слов и фраз сравнивается с текстом, созданным с помощью GPT, и если количество совпадений превышает определенный порог, то антиплагиат фиксирует применение ИИ для сокрытия плагиата.
Третий подход заключается в использовании алгоритма нейронной сети, обученной различать оригинальный текст и текст, созданный с помощью GPT. Для этого используется набор данных, содержащий как оригинальный текст, так и созданный текст. На основе этих данных создается модель, способная классифицировать новый текст в соответствии с тегами категорий.
Однако следует отметить, что ни один из вышеперечисленных методов не является абсолютно точным, и каждый из них имеет свои ограничения. Например, метод анализа стиля письма может не сработать, если автор имеет схожий стиль письма или если стиль оригинального текста был намеренно изменен. Алгоритмы нейронных сетей, с другой стороны, не работают эффективно, если сгенерированный текст слишком похож на оригинальный текст или если применяется дополнительная обработка, например, перефразирование с помощью академической нейронной сети КонтрПлагаиат (CounterPlagiarism).
Таким образом, обнаружение текстов, сгенерированных GPT, является довольно сложной задачей и требует применения различных методов и подходов. Уже этой весной в Антиплагиат ВУЗов начнет функционировать, в полном объеме модуль выявления маскировки заимствований, с помощью искусственного интеллекта.






