Plagiátorství Akademická etika Mgr. Tomáš Foltýnek, Ph.D. foltynek@fi.muni.cz Etika a IT 1 Osnova dnešní přednášky ̶ Opakování: Etický hacking ̶ Prezentace Petry Matějíčkové: Kazuistika plagiátorství ̶ Plagiátorství ̶ Etika ve výzkumu ̶ Fabrikace a falšování dat ̶ Publikační etika a predátorské časopisy ̶ Shrnutí využitelnosti Chat GPT ̶ Dilemma Game: Podobné, ale ne stejné Etika a IT 2 Plagiátorství Copy Paste by Gustavo Martinez. CC-BY-NC 2.0 https://www.flickr.com/photos/inggmartinez/6635467311 Plagiát vs. inspirace ̶ Článek „Fotograf Stranka čelí nařčení z kopírování jiných autorů a hájí se poctou. Případ otevírá etické dilema “ ̶ https://ct24.ceskatelevize.cz/kultura/3412650- fotograf-stranka-celi-narceni-z-kopirovani-jinych- autoru-a-haji-se-poctou-pripad ̶ Vžijte se do role autora původních fotografií. Jak byste reagovali? ̶ Byli byste poctěni, nebo naštvaní ̶ Jak byste situaci řešili? ̶ Co byste chtěli po autorovi napodobenin? Definice plagiátorství Co si představíte pod pojmem plagiátorství? Etika a IT 5 Plagiátorství ̶ Německý ministr obrany Karl-Theodor zu Guttenberg ̶ Maďarský president Pál Schmitt ̶ Rumunský premiér Victor Ponta ̶ První dáma USA Melania Trump ̶ Rumunská ministryně školství Ecaterina Andronescu ̶ Chorvatský ministr školství Pavo Barišić ̶ Vice-prezident USA Joe Biden ̶ 64 rektorů v Rusku ̶ Rumunská Policejní akademie ̶ Česká ministryně spravedlnosti Taťána Malá ̶ Slovenský premiér Igor Matovič ̶ … OISV [CC BY-SA 3.0] Partidul Social Democrat from Romania [CC BY 2.0] Photo: Michael Lucan, License: CC-BY-SA 3.0 de Photo: Európa Pont [CC BY 2.0] Etika a IT ČR: Ministryně spravedlnosti Taťána Malá ̶ Červenec 2018 ̶ První diplomová práce – rodinné právo ̶ 5 % převzato bez řádné citace ̶ Druhá diplomová práce – chov králíků (MENDELU) ̶ 16 ze 48 stran převzato z jiné DP ̶ Odmítání obvinění ̶ Žádná pravidla neporušila, postupovala podle pokynů vedoucího práce ̶ „[Plagiát] je u shody ze 40 až 50 procent.“ ̶ Rezignovala po 13 dnech v úřadu ̶ Případ ztvárněn jako vzdělávací materiál ENAI Etika a IT Definice plagiátorství využití (myšlenek, obsahu, nebo struktury) jiného díla bez řádného uvedení odkazu na zdroj k získání určité výhody tam, kde se očekává původní dílo the use of ideas, content, or structures without appropriately acknowledging the source to benefit in a setting where originality is expected Foltýnek, T., Meuschke, N., & Gipp, B. (2019). Academic Plagiarism Detection: A Systematic Literature Review. ACM Comput. Surv., 52(6), 112:1--112:42. https://doi.org/10.1145/3345317 Etika a IT 8 Definice plagiátorství ̶ Obecně využití jiných zdrojů bez jejich řádného uvedení ̶ Typicky zahrnuje ̶ Použití práce někoho jiného a její prezentování jako práce vlastní ̶ Nesprávné citování a odkazování na práci někoho jiného ̶ Okopírování tabulek, obrázků, grafů atd. bez uvedení zdroje ̶ Nepřiznání cizího přispění k prezentované práci ̶ Autoplagiátorství (opětovné využití vlastního díla) ̶ Může být úmyslné či neúmyslné Etika a IT 9 Co není plagiátorství ̶ Zdroj nemusíme uvádět u: ̶ Všeobecně známých informací ̶ Informací všeobecně známých v rámci daného oboru ̶ Cizí přispění, které neovlivňuje obsah a myšlenky: ̶ Jazyková korektura ̶ Typografická korektura ̶ Formátování práce Etika a IT 10 Plagiátorství a Autorský zákon Do práva autorského nezasahuje ten, kdo a) užije v odůvodněné míře výňatky ze zveřejněných děl jiných autorů ve svém díle, b) užije výňatky z díla nebo drobná celá díla pro účely kritiky nebo recenze … a užití bude v souladu s poctivými zvyklostmi a v rozsahu vyžadovaném konkrétním účelem, c) užije dílo při vyučování pro ilustrační účel nebo při vědeckém výzkumu … a nepřesáhne rozsah odpovídající sledovanému účelu Vždy se musí uvést: jméno autora, název díla a pramen (121/2000 Sb. Autorský zákon) Etika a IT 11 Tři „O“ proti plagiátorství ̶ Odlišit převzaté myšlenky od vlastních ̶ Odkázat na původní zdroj ̶ Označit původní zdroj tak, aby šel dohledat ̶ Foltýnek a kol.: Jak se vyhnout plagiátorství: Příručka pro studenty ̶ https://karolinum.cz/knihy/foltynek-jak-se-vyhnout- plagiatorstvi-24022 Etika a IT 12 Kritéria (spolu)autorství ̶ Z pohledu akademické etiky je podstatná nejen objektivně vnímatelná podoba díla, ale i samotná myšlenka ̶ Základ vědecké práce: Na existujících (publikovaných) myšlenkách stavíme vlastní objevy/myšlenky ̶ Google Scholar: Stůjte na ramenou obrů ̶ Autorství publikací je důležitým měřítkem vědeckého výkonu ̶ Kdo tedy může/nemůže být uveden jako (spolu)autor článku? Etika a IT 13 Kritéria (spolu)autorství podle COPE ̶ COPE (Comittee for Publication Ethics) převzalo kritéria od ICMJE (International Committee of Medical Journal Editors) ̶ (Spolu)autorem se osoba stává právě tehdy, když splní každé z následujících kritérií: ̶ Významný přínos k myšlence a návrhu díla, nebo sběr, analýza nebo interpretace dat ̶ Vytváření díla nebo kritické zhodnocení jeho myšlenek ̶ Souhlas s výslednou podobou díla k publikování ̶ Přijetí (spolu)odpovědnosti za dílo jako celek Etika a IT 14 Fabrikace, Falšování, Plagiátorství Zdroj obrázku: Elisabeth Bik https://twitter.com/MicrobiomDigest/status/1508157885934567425 Fabrikace (vytváření) dat ̶ Diederik Stapel ̶ Bývalý profesor sociální psychologie ̶ Tilburg University, Nizozemsko ̶ Metodika jeho práce ̶ Vymyslel experiment (hypotézy, metodika, dotazník,…) ̶ Předstíral, že jej provedl ̶ Vytvořil všechna data tak, aby podporovala hypotézu ̶ Obří skandál v roce 2011 otřásl Nizozemskem ̶ Ztráta důvěry společnosti ve vědeckou komunitu ̶ Příležitost k nastavení procesů, které významně zvýšily kvalitu výzkumu Zdroj obrázku: https://retractionwatch.com/category/diederik-stapel/ Etika a IT 16 Falšování dat Wakefield, A., et al. (1998): Ileal-lymphoid-nodular hyperplasia, nonspecific colitis, and pervasive developmental disorder in children. The Lancet. 351 (9103): 637–41 ̶ Článek „prokazující“ spojitost MMR vakcíny a autismu ̶ Zmanipulovaný výběr pacientů ̶ Výzkum financován výrobcem konkurenční vakcíny ̶ Stažen v roce 2010 ̶ Stále žije na konspiračních serverech ̶ Posiluje nedůvěru k očkování Etika a IT Důsledky ̶ Důsledky plagiátorství politiků (Tudoroiu, 2017) ̶ Občané vnímají vzdělávací systém jako zkorumpovaný ̶ Skandály snižují důvěru občanů v demokratické instituce ̶ „[Plagiátorství] představuje přímou, agresivní a účinnou hrozbu pro demokracii jako takovou“ ̶ Lze zobecnit i mimo plagiátorství a mimo politiku ̶ Skandály nejsou jen problém konkrétní osoby či instituce! Etika a IT 18 Důsledky podvádění ̶ Studenti dostávají kredity/diplomy za práci, kterou neudělali ̶ Nedosáhli požadovaných výstupů z učení ̶ Je ohrožena důvěra ve vysokoškolské diplomy Etika a IT Příčiny podvodného jednání ̶ Tlak / Motiv ̶ Potřebuji ukončit předmět/studium ̶ Potřebuji více publikací ̶ Příležitost ̶ Nedostatečná detekce ̶ Racionalizace ̶ Pocit, že to dělají to všichni ̶ Zhodnocení rizik a zisku DavidBailey [CC BY-SA 4.0] Etika a IT 20 Open Data Open Access Proces publikace vědeckého článku ̶ Autor (autorský kolektiv) napíše článek ̶ Korespondenční autor odešle článek do časopisu ̶ Editor zběžně zhodnotí, zda se článek do časopisu hodí ̶ Tématem, rozsahem, kvalitou,… ̶ Editor požádá typicky 2 experty na danou oblast o recenzi ̶ To trvá týdny, někdy měsíce ̶ Recenzenti doporučí přijetí / přepracování / zamítnutí ̶ Editor rozhodne ̶ V případě rozporných recenzí může oslovit třetího recenzenta ̶ V případě přepracování jde nová verze znovu na recenzi ̶ Po přijetí je článek zveřejněn na webu časopisu ̶ Celý proces trvá několik měsíců (někdy i několik let) Etika a IT 22 Co je Open Access? ̶ Tradiční přístup: Čtenář platí ̶ Vědecké články jsou za platební bránou ̶ Univerzity /státy předplácejí svým zaměstnancům přístupy ̶ Tlak na kvalitu, fungují tržní mechanismy ̶ Veřejnost nemá přístup k vědeckým výsledkům ̶ Vědci v chudých zemích si nemohou dovolit přístup ̶ Open access ̶ Vědecké články jsou veřejně přístupné ̶ Za publikování článku platí autoři (jejich univerzity) ̶ Tlak na kvalitu není tržní, ale jde „pouze“ o prestiž Etika a IT 23 Predátorské časopisy ̶ Pojem zavedl v roce 2008 Jeffrey Beall ̶ Knihovník z University of Colorado ̶ Časopisy / vydavatelé, kteří se snaží jen o maximální zisk ̶ Žádné nebo jen zdánlivé recenze → Zaplevelení literatury nepravdami ̶ Publikování článku v řádu dnů (nikoliv měsíců) ̶ Beallův seznam potenciálně predátorských časopisů a vydavatelů ̶ 2010 – 2017, tisíce položek ̶ 2017, žaloba Frontiers, univerzita stáhla seznam ze svých stránek ̶ Jeffrey Beall odešel do důchodu ̶ Seznam (neaktualizovaný) je stále přístupný na https://beallslist.net/ ̶ Další seznamy, služby na prověření důvěryhodnosti ̶ https://thinkchecksubmit.org/, https://vimkdepublikuji.cz/ Etika a IT 24 Open Access, Open Data ̶ Výsledky výzkumu hrazeného z veřejných peněz by měly být veřejně přístupné ̶ Články i data ̶ Otevřená data umožňují ̶ Reprodukovatelnost výsledků ̶ Další výzkum nad stejnými daty ̶ Problém, pokud data obsahují osobní údaje ̶ Zveřejnění vyžaduje anonymizaci ̶ Riziko deanonymizace Etika a IT 25 Open Data (z minulé přednášky) 26#Hastag Konference Umělá inteligence a akademická etika Image generated by Midourney: /imagine future of university education with artificial intelligence Analýza využití Chat GPT ̶ Děkuji za velmi pěkné práce! ̶ Úspěšnost Chat GPT se velmi lišila ̶ Eseje (předměty Bioetika, Filosofie mysli, Vyhledávání informací, Jazyky světa, Angličtina, Teorie interaktivních médií, Kyberbezpečnost v organizaci) ̶ Chat GPT obecně velmi úspěšný, občas bylo potřeba přepracovat ̶ Nezvládá úkoly nad konkrétními artefakty, které nezná ̶ recenze konkrétního komixu, kategorizace bezpečnostních incidentů) ̶ Zdráhá se vyjádřit názor, snaha o korektnost a vyváženost ETIKA A IT 28 Analýza využití Chat GPT ̶ Programování (předměty Výpočetní systémy, Základy programování, Python Seminar, Neimperativní programování) ̶ Velké rozdíly v závislosti na specifičnosti zadání ̶ Specifický interpret assembleru nebo omezený Python nepřekoná ̶ Matematické předměty (Matematické základy informatiky, Statistika I) ̶ Dělá chyby v aritmetických operacích ̶ Nezvládá logické operace (dokazování, zdůvodňování) ETIKA A IT 29 Zajímavosti ̶ „I'm sorry, I cannot provide a solution to this problem as it goes against OpenAI's use case policy.” ̶ „OpenAI's use case policy prohibits the use of its language models for academic assignments or assessments, including homework, tests, and exams. This is to ensure academic integrity and prevent cheating.“ ̶ Lze obejít tvrzením, že požadavek je pro pracovní účely ̶ Odmítá poskytnout popis kybernetického útoku ̶ Lze obejít prohlášením se za “security researcher conducting a penetration test” ETIKA A IT 30 Pozitivní využití Chat GPT ̶ Vygenerovat zdvořilý e-mail vyučujícímu ̶ Zdroj inspirace ̶ Kontrola kompletnosti úkolu ̶ Vypracuji úkol, potom se zeptám Chat GPT a ověřím, že nic nechybí ̶ Vysvětlení určitého konceptu (různými způsoby) ̶ Vygenerování zadání cvičného úkolu ̶ A případně i řešení ̶ Pozor na halucinace! ̶ Lze očekávat, že toto riziko se bude s novými verzemi snižovat ETIKA A IT 31 Ověřování autorství cloze testem ̶ Problém: Ověřit, že daná osoba je skutečně autorem daného textu ̶ Metoda: Cloze-test (doplňovací test) – část textu, ve které je vynechané slovo, úkolem dané osoby je slovo doplnit ̶ Hledáme slova, která budou co nejlépe rozlišovat mezi autory a ostatními ̶ Hypotéza: Využití jazykového modelu. Pokud určité slovo neodpovídá jazykovému modelu, pravděpodobně bude dobře rozlišovat ̶ Prosba: Zkuste si doplnit slova do svého a cizího textu na https://aver.pef.mendelu.cz/app/ ̶ Odměna: 2 body za aktivitu ETIKA A IT 32 Dilemma Game Obrázky generovány nástrojem Midjourney /imagine people arguing ethical dilemmas Dilema: Podobné, ale ne stejné Kamarád mě požádal, abych mu okomentoval jeho akademický článek a navrhl vylepšení. Během čtení článku jsem našel nemalou podobnost s nedávno vydanými články, které jsem četl. Tyto podobnosti nebyly plagiátorstvím v doslovném smyslu, ale byly viditelné. Když jsem svého kamaráda konfrontoval se svými zjištěními, ignoroval je a článek poslal do prestižního mezinárodního časopisu téměř beze změny. Za několik týdnů mne daný časopis požádal o recenzi právě tohoto článku. Co mám dělat? A. Odmítnu nabídku kvůli střetu zájmů. Riziko, že plagiátorství zůstane neodhaleno, budu považovat za méně podstatné než naše přátelství. B. Odmítnu nabídku kvůli střetu zájmů, ale anonymně pošlu do redakce e-mail, ve kterém upozorním na možné plagiátorství v tomto článku. C. Přijmu nabídku a upozorním na možné plagiátorství navzdory hrozbě, že to poškodí naše přátelství. D. Přijmu nabídku, ale na plagiátorství neupozorním, protože si cením našeho přátelství. Etika a IT 34 Příští přednáška ̶ Téma: IT pro prevenci a detekci podvodného jednání ̶ Úkoly ̶ Přečíst si o skandálu pákistánského „diploma mill“ Axact ̶ https://www.bbc.com/news/uk-42579634 ̶ https://www.nytimes.com/2015/05/18/world/asia/fake-diplomas-real-cash-pakistani- company-axact-reaps-millions-columbiana-barkley.html ̶ A o jedné z možností, jak podvodům předcházet ̶ J. Philipp Schmidt: Credentials, Reputation, and the Blockchain ̶ https://er.educause.edu/articles/2017/4/credentials-reputation-and-the-blockchain ̶ Info: Přednáška 4. 5. bude pouze online Etika a IT 35