В России технология детектирования генеративных текстов отстает от практики ровно настолько, насколько отстает разработка систем ИИ по генерированию данных текстов

Прикидочно, отечественные GPT-похожие системы отстают от американского GPT года на 2-3. Еще больше отстает умение детектировать тексты, созданные с помощью искусственного интеллекта. Вот уже полгода как Антиплагиат, который РУ и ВУЗ одновременно, зарабатывает на своем бета-детекторе, который, по мнению техподдержки АПа работает криво и косо, но денег люди стали платить больше, поэтому эта бета провесит еще бог знает сколько.

Итак, в мае 2023 г. печально известная система анализа дипломных работ, которую студентам велено использовать, под названием "Антиплагиат" была дополнена функцией обнаружения артефактов, созданных машинным способом. Теперь эта функция доступна в составе обязательных модулей сервиса, и любой текст, сгенерированный искусственным интеллектом или написанный руками, в любой момент может стать "подозрительным". По мнению Дмитрия Иванкова, эксперта Центра искусственного интеллекта СКБ Контур, в настоящее время не существует универсального механизма, который бы безошибочно определял генерируемый контент. Эту истину знают все и даже OpenAI признала, да, невозможно определить такой текст. Дмитрий уточняет, что в связи с увеличением количества и усложнением моделей генерации ИИ детекторы, откалиброванные под конкретные схемы, могут работать все хуже и хуже. Поясняем, OpenAI достигла эффективности 50%, в попытках выявить свои генеративные тексты, эта эффективность будет заметно ниже при попытке выявить генеративный текст других моделей и ничтожной при попытке выявления текстов десятка других разных моделей.

Эксперты не теряют свой пыл и заверяют, что данная область находится в стадии становления, а методологии и подходы все еще находятся в стадии зарождения. В этой связи есть желание спросить экспертов, покой тогда зарождающуюся технологию выпустили в коммерческий оборот?

Усиление роли ИИ-технологий в научной академической среде также вполне вероятно, считает Дмитрий Ходыкин, руководитель направления AI/ML компании ITentika. Он утверждает, что свидетельства такой интеграции наблюдаются уже сейчас: в рамках проектов языковые модели обучаются не только обработке текстовых данных общего назначения, но и вникают в тонкости научных статей.

Эксперты признают значительные успехи, достигнутые технологиями ИИ в науке к настоящему времени. Кроме того, они считают, что искусственный интеллект обладает огромным будущим потенциалом для помощи исследователям в решении таких трудоемких задач, как сложный анализ данных, выявление закономерностей и построение новых гипотез.

Сегодня научные работы, созданные искусственным интеллектом, еще не стали обычным явлением, в будущем, по мере развития технологий искусственного интеллекта, они не могут появиться, поскольку антиплагиат жив и переживет все инновации.

В июне 2021 года был проведен эксперимент, результаты эксперимента показали, что около 50% маркетологов не смогли отличить тексты, созданные нейросетями, от текстов, написанных людьми-копирайтерами, но антиплагиат ведь может, мы то это видим на десятках примеров, каждый день.