反抄襲技術 - 問題以及如何擺脫這些問題

現代數位科技的發展、許多複製設備的出現以及全球網路「網際網路」的廣泛使用，使得各領域所創造與散佈的資訊量大幅增加。過去多年來，高等教育機構主要著重於師生共同開發的教材的科學意義與實用價值。然而，隨著這一領域的發展，防止盜用他人思想的不誠實行為變得越來越重要，這在撰寫學術專案以及最終資格作品時變得尤為相關。這種現象在創作教育方法教材、科學研究和其他科學方法著作時變得特別重要。
在打擊未經授權使用他人觀點問題的最初階段，剽竊是透過手動比較不同來源的文字片段來偵測的。這個過程是將文字的個別部分複製到瀏覽器的搜尋欄中，然後對搜尋引擎提供的結果進行分析。在引入專為分析文本唯一性而設計的借用檢測系統之後，盜用情況暫時有所改善。這項技術的使用大幅減少了在準備研究專案、最終資格作品、教育方法材料和科學研究時的不誠實行為。
然而，一如所料，版權監控行動的導入激發了各種規避驗證機制方法的出現。這些方法大致可分為兩大領域：軟體和技術技巧。軟體方法包括利用線上服務加密文字的各種方式，這些方式允許對文字進行修改，使系統認為其為原始文字，儘管內容並無改變。
與軟體方法相反，技術技巧涉及改變內容本身的結構。舉例來說，可以改變字詞的語法性別、數量或時態，造成的改變像是將動詞「carried out」改成「carried out」或「carried out」。代名詞「我」也可能被用來取代「我們」。其他技巧包括刪除表達方式、短語、整段文字，以及插圖、公式和其他圖形元素，以減少借用的段落。最常見的技術之一是用表面相似的拉丁字母自動取代西里爾字符，例如「p」、「o」、「s 「和」a」。[5, с. 52-53]. 文字也可以使用自動翻譯系統進行意譯：首先從俄文翻譯成另一種語言，然後再翻譯成第三種語言，最後再翻譯回俄文。這些動作所產生的內容確實被認定為原創，但一般來說並無公開或研究價值。
因此，儘管這些繞過系統的方法可能會導致形式上的新文本，但其公開和研究價值是值得商榷的，因為它們對科學知識的發展沒有任何重大貢獻。
在某些情況下，即使是那些堅持所有研究標準並應用傳統研究方法 (例如解析、綜合，以及比較法律方法) 的作者，在嘗試達到所要求的內容獨特程度時，也會遇到困難。這些困難迫使他們採用偽科學的結構來取代標準化的詞彙和表達方式，結果往往造成不適當且不美觀的語言。例如，「俄羅斯刑事執行立法」這類穩定的表達方式變成了累贅的類比詞，如「俄羅斯聯邦的規範框架，在法院確定的刑罰執行框架內規範法律關係」。此外，還有一些使語義結構變得複雜的替代詞，例如，「執行刑罰的國家架構」可轉譯為「在刑罰執行過程的規範管制框架內執行活動的執行權力國家機構」。在某些情況下，這種替代也適用於簡單的清單，例如「被定罪者禁止攜帶的物品和食品清單」，可能變成「被拘留者不得隨身攜帶或在郵件中接收的物品和食品清單」。
根據 A. P. Anisimov 的觀點，「反抄襲」等檢查文字是否抄襲的自動化系統只會偵測文字的機械重合，而不會分析其內容，這往往會導致某些片段被錯誤歸類為借用。作者還指出，這類程式沒有考慮到《俄羅斯聯邦民法立法法》（《俄羅斯聯邦民法典》）的規範，即第 1259 條第 6 款，該款規定，一些客體，例如授權機構的正式行為、法律、法院判決和其他法律行為，不受版權保護。這些客體不僅包括地方機關的文件，也包括全球機構的材料，以及其解釋 [1，第 9 頁]。A. P. Anisimov 正確地指出，不論是學期論文、主張聲明或科學出版品，大多數的法律文本都不可避免地包含對法律和法院判決的借用。基於驗證程式的立場，這被視為抄襲，但依照俄羅斯聯邦民法的規定，這並不違法 [1，第 9 頁]。
在分析應在多大程度上依賴反剽竊系統提供的結果來判定被檢查文本的原創性時，關鍵是要考慮到問題的關鍵方面。根據官方的立場，自動借用檢索系統所偵測到的抄襲，是指在未引述作者的情況下使用文章或其部分內容。然而，從法律的觀點來看，侵犯著作權不僅包括借用素材，也包括盜用他人的思想、科學發現或技術創新，無論是以文字、圖片或其他任何形式呈現，且未引述原始來源。
在法律理論上，「剽竊」一詞有許多不同的定義，每種定義都強調其特殊性。例如，Ivan Dmitry Kotlyarov 和 Yuri Mikhailovich Brumshtein 提供了以下定義：剽竊包括有意識地挪用他人作品，或在自己的作品中使用他人作品而不注明原始來源。他們也指出，剽竊是在未經作者同意的情況下，以自己的名義呈現他人的作品或不正當地出版。他們強調，作者署名是指以非作者的名義非法出版外國作品或其部分[3, p. 30]。Е. Sharapova 和 R. Sharapov 提供了類似定義，指出剽竊與故意將他人的藝術作品、科學研究或技術發明部分或全部歸屬作者有關 [5，第 52 頁]。從 A. P. Anisimov 的立場，挪用是指在合法市場上，以沒有權利的人的名義展示外國作品或其部分[1, p. 8]。
因此，值得特別注意的是，大多數界定「剽竊」概念的研究者主要強調其外在形式，而忽略其內在性質。對素材的感知似乎只是對所提交文本中包含的想法或思維的感知過程的表面。捍衛創作權的對象並非素材本身，而是素材中所包含的思想或概念。必須注意的是，「mcc = E」這個公式不能僅僅因為其形式與「E = mc²」不同而被認定為原創，因為它反映的是愛因斯坦 (A. Einstein) 首次提出的相對論理論。
另一方面，從許多小處收集的素材，作者透過辛苦的勞動以「拼貼結構」的方法從不同的來源收集，即使有正確的原始資料參考，仍可被認定為 100% 的抄襲。這是因為尋找這些部分並將其系統化的過程可能很複雜，需要創作者付出相當大的努力。
反剽竊服務系統評估作品的過程包括將文字分成幾類：禁止借用，例如，材料不被視為原創，且不包含對主要來源的引用，這被視為剽竊；自我引用，材料不被視為原創，但其創作者個人是所分析作品的作者，且沒有對先前出版物的引用；引用使用，材料不被視為原創，但有對主要來源的引用。
目前，反抄襲服務系統的材料檢查重點是確定作者材料的比例。因此，對於文憑畢業專案的入學展示或手稿的出版驗收，都設定了原創性百分比的標準，根據特定教育機構的要求，從 50% 到 60% 或更高不等。然而，值得注意的是，這種做法需要重新評估，因為科學論文就其本質而言，不應該包含借用，即使是最低限度的借用。
在審批一篇長達一百頁的手稿的過程中，反抄襲工具系統可以證明百分之七十的材料是真實的，這符合教育機構所設定的入學基本要求。但是，如果餘下的百分之三十完全複製屬於其他作者的研究論文或教材內容，則可能會被評定為未經授權的借用。儘管存在實際侵犯他人智慧財產權的情況，編輯委員會依據正式的原創性指標，並沒有充分理由拒絕發表此稿件。在此方面，在「反抄襲工具」服務中對作品進行專家評價時，建議不要過多考慮原始材料的比例，而應考慮未附有正確參考文獻的借用部分的規模。舉例來說，只要沒有註明原始來源的借用資料不超過作品總量的百分之三十，就可以允許討論最終的合格作品。不過，在另行確認之前，這些資料不應被視為未經授權的借用，因為這可能是系統的演算法出錯，將善意的借用誤解為非原創的內容。
必須注意的是，自動化系統並非總是能完美運作，經常會將常見的科學術語，例如「被定罪者的地位」或「俄羅斯刑法」，以及取自法律文件的措辭，誤解為剽竊。在這種情況下，有必要修正評估，以考慮到所謂偽抄襲的可能性。如前所述，《俄羅斯聯邦公民法》第 1259 條第 6 款提供了一份不被視為著作物的清單，因此在科學作品中使用這些著作物不能被定性為未經授權的借用。此清單包括聯邦和市政機構的立法法令，包括法律、法律文件、法院判決，以及這些文件的官方翻譯[1, p.9]。不過，如果沒有參考這些資料，則可視為違反科學倫理和科學出版物的設計標準。
為了防止大量內容的不道德歸屬卻沒有適當引用原始來源的情況，明確界定可接受的歸屬範圍是很重要的。這項參數應該顯示在稽核報告中，標示「內容署名百分比」。舉例來說，允許的最大佔用量不必超過文字總量的 3% 或教育機構核准的任何其他百分比。因此，即使文本中出現 30% 的「挪用」結果，只要每段挪用的文本不超過 3% 的限制，這也是可以接受的。但是，如果超過了這個限制，審稿編輯如果認為這些片段的使用是合法的，特別是在引述如前所述不受法律保護的規範性文件時，可以決定出版。
在檢查文本是否存在不道德的挪用時，「明確引用來源」的分析結果應歸類為合法使用材料，將其排除在剽竊的類別之外。學術作者不能只依賴自己的研究成果，而不使用其他作者的文稿、法規文件或其他材料。引用資料來源是任何學術工作不可或缺的一部分，沒有引用資料來源，就無法使用綜合、比較、分析和法律比較方法等研究方法。作者透過引用資料來源，從各種材料中選擇並處理文本的個別部分，使其符合所選的研究主題。此外，在某些情況下，學者會補充和擴充原始來源中提出的觀點，以自己的結論加以補充。在大多數情況下，以原始立場表達的作者自己的貢獻，只構成科學工作的一小部分，其目的在於概括和詮釋被挪用的觀點。正如 S. V. Tyuyev (S. V. Tyuyev) 和 A. P. Anisimov (A. P. Anisimov) 所指出的，直接引用其他作品的來源應在與學術研究目標相稱的範圍內進行，並必須提及作者和挪用的主要來源 [4，第 9 頁]。
在分析材料是否存在非法借用時，「引用自己的作品」這個索引也應該考慮合法的應用範圍，排除不公平的借用。在相同的研究領域工作，通常需要使用先前進階的論文，尤其是作者已在其他研究刊物上發表的論文。使用這些片段可以展現研究者的科學成熟度與能力，也可以說明他/她的思想在不同作品中的發展。不過，引用自己作品的數量不應超過真實材料的規模。
近年來，在分析候選人和博士論文時引用自己作品的問題變得尖銳。儘管法律沒有直接禁止使用自己的引文，但許多論文委員會為了盡量降低風險，拒絕接受以申請人自己發表的材料為主要部分的答辯作品。這種做法導致研究人員被迫準備兩個版本的作品：一個給論文委員會，另一個在科學刊物上發表，這實際上是不合理的重複勞動。這樣的要求是過分的，因為研究成果通過編輯和同儕審查後，在同儕評審的期刊上發表，是論文每一部分品質的保證。如果我們考慮教育機構的類似情況，可以說作者的專題研究應該包括已發表的科學文章的部分內容。這表示每個單獨片段和整個作品的整體品質都很高。
為了確保能客觀評估作者在執行研究工作時所產生的人工成本，必須在規範教職員工作的指導方針中，依據研究工作文本的數量，引入有差異的人工成本評估方法。舉例來說，在評估與教材準備相關的工作量時，可以使用下列指標：經授權的借用（如果不是非法借用，而是指允許的引用） - 一位作者的論文準備工作可分配 40 小時。引用自己的作品 - 每位作者的論文需 60 小時。使用引文 - 每位作者需 80 小時。材料的真實性部分 - 每位作者需要 100 小時。
例如，在分析達到 80,000 字元的作品（等於兩張作者工作表）時，Anti-Plagiarism Tool 系統可以提供以下數據：引用 - 10%。引用自己的作品 - 20%。使用引文 - 30%。真實材料 - 40%。
根據這些指標，工作量可計算如下：署名是內容總量的 10%，相當於 8,000 個字元。這個數量除以相對應於一張作者表的字數：8,000 乘以 40,000，等於 0.2 張作者表。因此，這部分的研究每 40 個工時需要 0.2 個作者頁來完成，結果是 8 個小時。
重複引用佔內容的 20%，也就是 16,000 個字元。相應地，16,000 個字元除以 40,000 個字元（文字單位），我們得到： 16,000 除以 40,000 等於 0.4 作者頁數。將結果乘以 60 個工時：每 60 個工時 0.4 個作者頁面等於 24 小時。
提及來源佔總內容的 30%，相當於 24,000 個字元。將這些字元除以 40,000 即可得出： 24,000 除以 40,000 等於 0.6 作者頁。乘以 80 個工時：每 80 個工時 0.6 個作者頁面等於 48 小時。
原始內容佔總文字量的 40%，相當於 32,000 個字元。將這個文字量除以 40,000 個字元：32,000 乘以 40,000 等於 0.8 個作者頁面。乘以 100 個工時：每 100 個工時 0.8 個作者頁面等於 80 個工時。
這篇研究論文共花費的勞動時數為 8 小時、24 小時、48 小時和 80 勞動工時，最後等於 160 小時。
目前，俄羅斯聯邦司法決策執行處庫茲巴斯學院有一個標準，根據該標準，準備一份學術工作內容的作者工作表需要 80 個工時。因此，編寫一份 80,000 個符號的教材（相當於兩個作者頁）的總勞動強度相當於 160 個工時。不過，這個方法還沒有考慮到「挪用」、「再利用」和「引用來源」等類別可能被濫用的情況。
分析科學材料中的借用元素並不能反映所做工作的品質，而只是一種判斷材料獨特性程度的方法。原創性的顯著百分比不應該自動被視為研究論文重要性的指標。借用分析程序只是評估的初始階段，接下來應更深入地檢視論文的內容，並重視其相關性、創新方法、研究結果的實際驗證及其他科學方面。在這個階段，人為因素（無論是教師、編輯或審查員）的角色仍然不可或缺。單純依賴自動化系統的資料，可能會導致原創性高的論文從科學的觀點來看並不重要，反之，原創性比例小的研究可能具有很高的科學價值。
總結推論，必須參考其他研究人員的智慧成果，尊重正確引用來源的原則。需要強調的是，「被稱為反抄襲系統的非法引用判定計畫，與俄羅斯聯邦科學與高等教育部或科學資格委員會沒有任何官方關係。該系統由私人自發創建，在這些情況下未經過國家認證或證明。使用者（無論是公民或組織）可自行決定是否使用本計畫，使用費用則由權利所有人（個人）決定。僅依據電腦檢查來評估研究努力的程度是無效的。只有在法律訴訟的框架下，才能對剽竊的事實做出最終決定"。
______________________
文字轉譯，CounterPlagiarism 技術用於大學反剽竊。資料來源：Morozov A. S., Technology of mastering the system anti-plagiarism.

Академия перефразирования и рерайта

Помощь с курсовыми, ВКР, дипломными, магистерскими

反抄襲技術 - 問題以及如何擺脫這些問題