Как отличить научный текст, написанный человеком, от текста, сгенерированного ChatGPT, рассказываем про основы очеловечивания генеративных текстов

С момента появления ChatGPT в конце 2022 года искусственный интеллект (ИИ) стал мощным инструментом для генерации текстов. Он способен писать эссе, статьи, отвечать на вопросы, а также составлять тексты, которые внешне неотличимы от человеческих. Это вызывает как восхищение, так и серьезные опасения в научных кругах: как отличить, где стоит человеческое авторство, а где используется ИИ? В ответ на этот вызов учёные разработали метод, который с высокой точностью (более 99 %) может распознавать, написан ли научный текст человеком или с помощью ChatGPT.

Авторы исследования — команда из Университета Канзаса во главе с Хизер Дезэир — поставили перед собой две основные задачи. Во-первых, оценить, насколько хорошо современные нейросетевые детекторы распознают тексты ИИ в научной литературе. Во-вторых, разработать альтернативный подход, опирающийся на классические методы машинного обучения и простые лингвистические признаки.

Дифференциация научных текстов: человек vs ChatGPT

📊

Структурные признаки

Количество предложений в абзаце

ЧЕЛ

Человек

Количество слов в абзаце

ЧЕЛ

Человек

Стандартное отклонение длины предложений

ЧЕЛ

Человек

Разница в длине соседних предложений

ЧЕЛ

Человек

Максимальная длина предложения

ЧЕЛ

Человек

Минимальная длина предложения

ИИ

ChatGPT

Средняя длина предложения

ЧЕЛ

Человек

🔤

Пунктуационные признаки

Наличие символа «)»

ЧЕЛ

Человек

Наличие символа «–» (дефис/тире)

ЧЕЛ

Человек

Наличие символов «;» или «:»

ЧЕЛ

Человек

Наличие вопросительного знака «?»

ЧЕЛ

Человек

Наличие апострофа «'»

ИИ

ChatGPT

📝

Лексические признаки

Частота слова «однако»

ЧЕЛ

Человек

Частота слова «но»

ЧЕЛ

Человек

Частота слова «хотя»

ЧЕЛ

Человек

Частота слова «исследователи»

ИИ

ChatGPT

Частота слова «исследование»

ИИ

ChatGPT

Частота слова «результаты»

ИИ

ChatGPT

Частота слова «данные»

ИИ

ChatGPT

Частота слова «анализ»

ИИ

ChatGPT

Распределение признаков по категориям

Структурные
9 признаков

Пунктуационные
6 признаков

Лексические
8 признаков

Чаще у человека

Чаще у ChatGPT

Обозначения

Структурные признаки

Пунктуационные признаки

Лексические признаки

ЧЕЛ

Преобладает у человека

ИИ

Преобладает у ChatGPT

📊

Структурные признаки

🔤

Пунктуационные признаки

📝

Лексические признаки

Почему это важно?

Ранее существующие методы классификации искусственно созданных текстов применялись преимущественно к материалам неформального интернет-общения. Научные тексты, однако, отличаются более строгой структурой, формализованным стилем и устойчивыми риторическими шаблонами. Это означает, что методы, успешно работающие на блогах и форумах, могут оказаться малоэффективными в академической среде.

Методика исследования

Исследователи сформировали корпус текстов на основе раздела Perspectives журнала Science, содержащего аналитические материалы, написанные учёными. Для каждого текста с помощью ChatGPT был создан тематически аналогичный вариант. Таким образом, корпус включал как человеческие, так и ИИ-сгенерированные тексты, сопоставимые по объёму и тематике.

Для анализа были выделены двадцать количественных признаков, сгруппированных в четыре категории: характеристики абзацев, вариативность длины предложений, особенности пунктуации и частотность отдельных слов. Было установлено, что люди чаще используют выражения логического противопоставления, такие как «однако», «но» и «хотя», тогда как ИИ склонен к более сглаженному и нейтральному стилю.

Основные различия

Анализ показал, что тексты, написанные людьми, демонстрируют большую структурную неоднородность и более широкий диапазон синтаксических конструкций. ИИ-тексты, хотя и выглядят связными и грамматически корректными, чаще следуют шаблонной логике изложения и избегают сложных пунктуационных форм. Кроме того, ChatGPT чаще использует обобщённые обозначения исследователей, но реже апеллирует к конкретным авторам или точным формулировкам аргументов.

Результаты

Применение классических алгоритмов машинного обучения позволило достичь высокой точности классификации. На уровне отдельных параграфов точность превышала 90 %, а при анализе полного документа достигала примерно 99,5 %. Даже использование только первого параграфа обеспечивало крайне надёжные результаты, что подчёркивает устойчивость выявленных признаков.

Для сравнения, нейросетевые детекторы общего назначения показали заметно худшие результаты, особенно при анализе цельных научных текстов. Это указывает на то, что специализированные признаки оказываются эффективнее универсальных моделей.

Выводы

Авторы подчёркивают, что предложенный подход не является универсальным и требует адаптации под другие жанры научного письма. Тем не менее он демонстрирует, что даже относительно простые и интерпретируемые признаки позволяют с высокой точностью отличать тексты людей от текстов ИИ. Это особенно важно в условиях стремительного распространения генеративных моделей, однако требует дальнейших исследований по мере их развития.

Академия перефразирования и рерайта

Помощь с курсовыми, ВКР, дипломными, магистерскими

Как отличить научный текст, написанный человеком, от текста, сгенерированного ChatGPT, рассказываем про основы очеловечивания генеративных текстов

Дифференциация научных текстов: человек vs ChatGPT