Все еще маетесь фигней? О еврейской точке, скрытых объектах кодировании, а прогресс ушел в нейросетевые технологии …

Поводом написать данную статью послужили перипетии в борьбе умных научных руководителей с хитрыми студентами и аспирантами. В общем то ничего нового мы не увидели, бородатые россказни о победе добра над злом.

Что делаем, берем статью из открытого источника, помещаем ее в нейросеть SEMANTICS-антиплагиат, читаем, что из этого получилось.

Преподаватели нескольких российских университетов заявили, что вскрыли отчаянные попытки обойти систему Антиплагиат, поймав аспирантов на месте преступления. Для тех, кто в танке напоминаем, Антиплагиат сравнивает текст исследований (например академических работ) с источниками, доступными в интернете - и показывает, какую часть текста автор заимствовал, а какую написал сам.

SEMANTICS-антиплагиат – сразу уточним, источники в базе Антиплагиата можно разделить на несколько частей, материалы из открытого Рунета, материалы библиотечных ресурсов, в том числе и закрытых, архивы работ ВУЗов. В общей сложности больше миллиарда документов, масса вариаций одного и того же научного знания, «другими словами», «своими словами» и т.д.

Когда Сергей Демченков, доцент ОмГУ имени Достоевского, просмотрел отчет об антиплагиате исследуемой докторской диссертации, он обнаружил, что в ней есть большой участок цитируемого текста в 50 000 знаков, который система сочла уникальным. Очевидно, это была статья из региональной газеты, которая была вставлена несколько раз подряд.

Г-н Демченков с удивлением обнаружил, что в газетном тексте предложение было вырвано из глагольных фраз. Он открыл изучаемую диссертацию в Microsoft Word, набрал поисковый запрос «уникальный», и текстовый процессор бросил его прямо в глагольную фразу. От «уникального» фрагмента не осталось и следа.

SEMANTICS-антиплагиат – в нашем понимании, доктор, это бедующий ВУЗовский генерал, каковым должен быть интеллектуальный потенциал автора докторской диссертации, чтобы применить на своем многолетнем труде метод, который виден в отчете проверки невооруженным глазом. Ну и второе, г-н Демченков не с удивлением, а с радостью обнаружил, ибо вот он аргумент - «я не зря кушаю хлеб с маслом …», поверьте, мы знаем какие реакции бывают при нахождении фактов подтасовок ))

Демченков говорит, что потратил около 20 минут, пытаясь понять, как писателю удалось спрятать 50 000 символов между буквами. Он изменил цвет шрифта и размер кегля всего текста, сбросил форматирование - но ничего не помогало.

Наконец, он обнаружил, что горе-будущий-доктор создал в документе объект «Caption» и вставил в него весь «пользовательский» текст. Вот как Демченков описывает это открытие:

«Я нахожу предмет размером полтора на два сантиметра, помещенный за предложением глаголов, внутри которого скрывается блок старого текста, написанного и покрашенного белой заливкой.

Приятной особенностью объекта надписи является то, что даже если содержимое документа полностью выделено, манипуляции со шрифтами и абзацами не влияют на текст надписи. Он также не выделяет отрывки, небезопасные для правописания. Wordboard рассматривает текст как изображение до тех пор, пока он не будет открыт для редактирования.

С другой стороны, Антиплагиат увидел скрытый текст, и тот факт, что треть текста была «уникальной», резко повысил «уникальность» всей диссертации.

SEMANTICS-антиплагиат – посмеем заметить, что простая вставка в текст специализированного документа – диссертации, обычной газетной статьи не вызвала у антиплагиата вопросов, а это значит, что ко всем глюкам работы Антиплагиат ВУЗ мы можем прибавить еще один косячок, неумение определять предметную направленность текста. Конечно Антиплагиат ВУЗ лобик морщит, и в отчете выдает свои соображения по предметной направленности, но как это используется при экспертировании текстов – видно никак ))

По словам Демченкова, популярен и другой изощренный способ обхода защиты от плагиата в Word - редактирование исходного кода документа. Файлы .docx - это обычные архивы со встроенными документами и помеченным текстом. Если его определенным образом «исправить», то текст не будет найден в Word, но его сможет увидеть программа проверки на плагиат и оценить уникальным.

SEMANTICS-антиплагиат – давайте так, метод кодирования популярен в силу скорости, но он не изощренный, скорей это рутинизированый метод, стремительно теряющий популярность. Его рыночная цена упала в десятки раз, все потому, что Антиплагиат ВУЗ потихонечку эти методы учится выявлять. Акты мазохизма Антиплагиат ВУЗ обусловлены мощностью системы и кривизной алгоритмов, SEMANTICS-антиплагиат точно знает, что все технические методы повышения уникальности, равно как и кодирование, теряют свою эффективность при проверке графических копий документов, другими словами – в процессе распознания текста. Распознавать текст можно по разному, можно распознавать, а можно залезть в текстовый слой и достать текст оттуда, в этом случае распознавание графической копии документа становится полной фикцией и по-видимому Антиплагиат ВУЗ это практикует.

В 2016 году Иван Печищев, доцент Пермского ГУ, рассказал о другом необычном документе, который он получил от друга. Программа проверки на плагиат не смогла проверить текст, хотя ранее она обнаружила несколько цитат.

Печищев обнаружил символы Юникода, разбросанные по всему документу. Одна из них была еврейской точкой, используемого шрифта иврита. В тексте этот символ появляется в виде точки над текстом.

В документе к «еврейским точкам» был применен скрытый текстовый стиль, который изменил цвет символов на белый и значительно уменьшил их размер. Проверяющий открыл файл и увидел простой текст без лишних деталей. Кроме того, программа проверки на плагиат отказалась проверять работу, потому что увидела нагромождение символов и букв, а точней - не увидела, что проверять.

SEMANTICS-антиплагиат – забавно, когда научные мужи ищут то, что вскрывается легким движением мышки за считанные секунды. Для обнаружения скрытых символов или перепутывания слов достаточно скопировать текст в текстовый редактор, и сразу становится все видно, до видать научные не ищут легких путей. Мы, например, каждую работу, перед повышением уникальности помещаем в текстовый редактор, это позволяет увидеть все попытки применения технических методов, а так же очищает текст от кучи стилей, которые были экспортированы в процессе скопировал-вставил.

Что сказать в итоге, конечно, советы в Интернет, типа: «56 работающих способов обхода Антиплагиат в 2022 году» - имеют право выступать в качестве познавательного исторического материала генезиса технического роста клиентов Антиплагиат ВУЗ. Но не более, т.к. все, что знает Интернет, знают разработчики Антиплагиат ВУЗ, а то, чего Интернет не знает, это технологическая основа бизнес-модели любого сервиса повышения уникальности текстов.

Какой метод повышения уникальности текстов эффективен – глубокое перефразирование? И здесь имеются проблемы, т.к. в силу ограниченности тем исследований и источников, с которых работы списываются, сори, компилируются, предшественники уже упражнялись с перефразированием и имеется некое критическое количество перефразированных текстов, значит перед исследователем стоит задача, перефразировать то, что уже было перефразировано, а это вероятно к научным знаниям относится опсоредовано.

Академия перефразирования и рерайта

Помощь с курсовыми, ВКР, дипломными, магистерскими

Все еще маетесь фигней? О еврейской точке, скрытых объектах кодировании, а прогресс ушел в нейросетевые технологии …