Sociální média Mgr. Tomáš Foltýnek, Ph.D. foltynek@fi.muni.cz Etika a IT 1 Osnova dnešní přednášky ̶ Opakování: Data ̶ Prezentace Veronika Dvořáčková ̶ Bioetika a medicínská etika ̶ Sociální sítě a sociální média ̶ Kapitalismus dohledu ̶ Dilema game: Esej ̶ Rychlý úvod do LLM Etika a IT 2 OPAKOVÁNÍ: Etika internetového výzkumu Opakování: GDPR ̶ Osobní údaj = každý údaj týkající se identifikované nebo identifikovatelné osoby ̶ Zákonnost – musí existovat důvod pro zpracovávání dat ̶ Transparentnost – subjekt musí vědět, jaká data se uchovávají ̶ Omezení účelu – data nesmí být využívána v rozporu s tímto účelem ̶ Omezení uložení – uložení ve formě umožňující identifikaci ̶ Minimalizace – uložení jen nezbytných dat ̶ Integrita, přesnost, důvěrnost Etika a IT 4 Opakování: Otázky pro nakládání s daty ̶ 10 otázek podle Data Science Process Alliance ̶ Jaké zákony a předpisy se vztahují na daný projekt? ̶ Jak víme, že je etické data využít k danému účelu? ̶ Kdo je zodpovědný za minimalizaci etických rizik? ̶ Jak se využití dat dotkne práv jednotlivců? ̶ Jak se propojování dat dotkne soukromí a anonymity jednotlivců? ̶ Jak víme, že data jsou k danému účelu vhodná? ̶ Jak rozpoznat a snížit zkreslení v datech? ̶ Jak zmírnit subjektivitu při návrhu systému? ̶ Jak velká transparentnost je potřeba a jak ji dosáhnout? ̶ Jak pravděpodobný je mylný výklad výsledků a jak mu zabránit? Etika a IT 5 Opakování: Koncepty ochrany soukromí ̶ Pseudonymita – identita není odhalena, ale lze ji dohledat ̶ Anonymita – konkrétní osobu nelze (z daného zdroje) odhalit ̶ Nepropojitelnost – identitu konkrétních osob nelze odhalit ani po propojení s jinými zdroji ̶ Nepozorovatelnost – není možné zjistit, že konkrétní služba/zdroj je vůbec využíván(a) (natož kým) ̶ Podrobněji viz FI:PV080 Information security and privacy Etika a IT 6 Opakování: Etika internetového výzkumu ̶ Je výzkum nad daty sociálních sítí výzkumem na lidech? ̶ Živý jedinec se stává subjektem výzkumu, pokud výzkumník ̶ Shromažďuje informace nebo biologické vzorky pomocí intervence či interakce ̶ Interakce zahrnuje komunikaci nebo jiný kontakt mezi výzkumníkem a subjektem výzkumu ̶ Získává, využívá, studuje, analyzuje či generuje identifikovatelné soukromé informace či identifikovatelné biologické vzorky ̶ Soukromá informace ̶ lze důvodně očekávat, že nebyla vůbec zaznamenána, nebo ̶ byla poskytnuta pro stanovený účel a lze důvodně očekávat, že nebude zveřejněna ̶ Různé výklady „důvodného očekávání“, „stanoveného účelu“ a „zveřejnění“ ̶ Více viz např. https://plato.stanford.edu/entries/ethics-internet-research/ ̶ Etika internetového výzkumu je relativně mladá ̶ Nejsou konkrétní závazné předpisy; Aplikují se obecnější normy Etika a IT 7 Opakování: Norimberský kodex (1947) ̶ První kodifikace etických zásad výzkumu na lidech ̶ Reakce na výzkumy prováděné nacisty během 2. světové války 1. Dobrovolný souhlas lidské osoby je absolutně nevyhnutelný. 2. Pokus by měl být takový, aby přinesl plodné výsledky pro dobro společnosti, nebyl zjistitelný jinými metodami nebo studijními prostředky a neměl by být ve své podstatě náhodný a zbytečný. 3. Pokus by měl být navržen a založen na výsledcích experimentů na zvířatech a na znalosti přirozené historie onemocnění nebo jiného studovaného problému tak, aby očekávané výsledky ospravedlňovaly provádění pokusu. 4. Pokus by měl být prováděn tak, aby se zabránilo veškerému zbytečnému tělesnému a duševnímu utrpení a zranění. 5. Neměl by být prováděn žádný pokus, pokud lze předpokládat, že dojde ke smrti nebo poranění. Snad kromě pokusů, kde experimentující lékaři slouží jako pokusné objekty. 6. Stupeň rizika, které je třeba podstoupit, by nikdy neměl překročit míru určenou humanitárním významem problému, který má být pokusem vyřešen. 7. Měly by být provedeny vhodné přípravy a zajištěno náležité vybavení na ochranu účastníků pokusu proti sebemenší možnosti zranění, zdravotního postižení nebo smrti. 8. Pokus by měly provádět pouze vědecky kvalifikované osoby. Měl by být vyžadován nejvyšší stupeň dovedností a péče při všech fázích pokusu u všech účastníků pokusu. 9. Během pokusu by měl mít účastník možnost pokus ukončit, pokud se dostal do takového tělesného nebo duševního stavu, kdy mu pokračování v pokusu přijde nemožné. 10. Odpovědný vědec musí být připravený ukončit pokus v kterékoli fázi, má-li, na základě svých nejlepších zkušeností, důvod věřit, že by pokračování v pokusu mohlo mít za následek zranění, postižení nebo smrt pokusného objektu. Etika a IT 8 Opakování: Belmontská zpráva (1978) ̶ Reakce na „Tuskegee Syphyllis Study v USA “ (1972) ̶ Zkoumání průběhu syfilitidy na afroameričanech, kterým nebyl podán penicilin ̶ Základní principy ̶ Úcta k lidem: Respekt lidské autonomie, důstojnost účastníků výzkumu ̶ Anonymita, důvěrnost ̶ Užitečnost: Maximalizovat přínosy výzkumu, minimalizovat rizika pro účastníky, požadavek neškodit ̶ Spravedlivost: férovost při výběru subjektů, rovnost ̶ Vodítko pro posuzování výzkumu etickými komisemi ̶ Základní principy převzaté i do evropských a dalších předpisů ̶ Ženevská deklarace (1947), Helsinská deklarace (1964),… Etika a IT 9 Sociální sítě a sociální média Zdroj obrázku: https://www.maxpixel.net/Network-Social-Network-Social-Media-Business-People-5508549 Terminologie ̶ Sociální síť = skupina lidí, kteří spolu udržují komunikaci různými prostředky ̶ Formálně se jedná o dvojici: Množina aktérů a množina vazeb ̶ Analogie grafu v teorii grafů (resp. praktická aplikace grafů) ̶ Sociální médium = nástroj umožňující sdílení a výměnu informací mezi lidmi ̶ Klasická pošta, telefon, pravidelná setkání (kostel, sport,…) ̶ E-mail, WhatsApp,… ̶ Facebook, Twitter, LinkedIn, Instagram, TikTok,… Etika a it 17 Komnaty ozvěn a sociální bubliny ̶ Komnata ozvěn (echo chambre) ̶ Skupina osob se vzájemnou komunikací utvrzuje ve svých názorech ̶ Opakování a zesilování shodných názorů ̶ Zeslabování nebo vylučování odlišných názorů ̶ Sociální bublina (social bubble, filtter bubble) ̶ Imaginární bariéra mezi skupinami osob zamezující vzájemné výměně informací ̶ Bariéra filtruje zprávy a názory, s nimiž nesouhlasíme Etika a it 18 Polarizace společnosti ̶ Uzavírání do sociálních bublin ̶ Utvrzování ve vlastních názorech ̶ Opačný názor je považován za nebezpečný pro společnost ̶ Označuje míru nesouhlasu s jinými stranami (zatímco vlastní strana je názorově homogenní) ̶ Polarizace elit – představitelé stran ̶ Masová polarizace – voliči ̶ Polarizace roste společně s konzumací zpráv z internetu ̶ Korelace, nebo kauzalita? Etika a it 19 Zdroj grafů: https://reutersinstitute.politics.ox.ac.uk/sites/defa ult/files/2022-06/Digital_News-Report_2022.pdf Argumenty proti teorii sociálních bublin ̶ Lidé si vždy vybírali (i dávno před internetem) ̶ jaké noviny a časopisy odebírat ̶ jaké zprávy číst ̶ jaké televizní kanály sledovat ̶ Je důležité odlišit samostatné filtrování od algoritmického ̶ Studie (Fletcher & Nielsen, 2017) srovnala 3 skupiny uživatelů 1. Vůbec nepoužívají sociální média 2. Používají sociální média primárně jako zdroj zpráv 3. Používají sociální média primárně k jinému účelu, ale čtou z nich zprávy ̶ Zjistili, že lidé ze 3. skupiny jsou vystaveni zprávám z více různých zdrojů než lidé z 1. skupiny ̶ Tj. i těm, které by sami jinak nenašli Etika a it 20 Argumenty proti teorii sociálních bublin ̶ Studie (Bail et al., 2018) z USA ̶ Zkoumali uživatele Twitteru vystavené opačným názorům ̶ Republikáni a Demokraté; Obě skupiny dostaly zaplaceno za sledování botů retweetujících názory z opačné strany ̶ Uživatelé tyto tweety četli ̶ Čtení tweetů z opačné strany posílilo polarizaci ̶ Zejména u Republikánů; u Demokratů statisticky nevýznamné ̶ Závěr: ̶ Společnost se polarizuje (to je měřitelný fakt) ̶ Polarizace má zejména negativní důsledky ̶ Teorie sociálních bublin správně nepopisuje mechanismus polarizace ̶ Může nás odvést od skutečných příčin polarizace Etika a it 21 Diskuse ̶ Vaše pozorování polarizace společnosti ̶ na sociálních médiích ̶ v offline životě ̶ Co je příčinou? ̶ Jaké důsledky pozorujete? ̶ Co se s tím dá dělat? etika a it 22 Kapitalismus dohledu GETTY IMAGES, zdroj https://www.forbes.com/sites/ibmsecurity/2020/01/14/surveillance-capitalism-will-it-erode-the-promise-of-byod-and-mobile- privacy/ Vaše využití sociálních médií? ̶ Facebook ̶ Twitter ̶ LinkedIn ̶ Instagram ̶ TikTok ̶ Jiné? ̶ Kdo je zákazník? ̶ Co je produkt? Etika a IT 24 Využití dat ze sociálních médií ̶ Agregovaná data ze sociálních médií, blogů, diskusních fór… ̶ Behviorální vzorce → Cenné zboží ̶ Cílená reklama ̶ Influencer marketing ̶ který influencer se nejlépe hodí na propagaci našich výrobků? ̶ Průzkum trhu ̶ demografická struktura zákazníků, tržní potenciál… ̶ Analýza a předpovídání trendů ̶ Data jsou veřejná, ALE… ̶ Kde je hranice jejich etického využití? Etika a it 25 Shoshana Zuboff: Surveillance capitalism ̶ Česky “kapitalismus dohledu” ̶ Soukromé společnosti vytvářejí zisk pomocí informací o svých uživatelích ̶ Poskytovaná služba není smyslem jejich existence ̶ Je prostředkem k získání co nejvíce informací ̶ Informace jsou prostředkem k vytváření zisku ̶ Posun paradigmatu ̶ Hledáme na Googlu → Google hledá v nás ̶ Využíváme sociální sítě → Sociální sítě využívají nás ̶ Zásady ochrany osobních údajů → Zásady sledování (dohledu) ̶ Nejde však jen o pasivní využití sesbíraných údajů… Etika a IT 26 Výzkum “nakažlivosti” nálady ̶ 2012 výzkum Facebook + Cornell University ̶ 2014 publikován v Proc. of the National Academy of Sciences of the USA ̶ Experiment na 689 003 uživatelích ̶ Vynechání citově zabarvených slov ze zpravodajského kanálu ovlivňuje náladu ̶ Vynechání pozitivních slov → Sdílení spíše negativního obsahu ̶ Vynechání negativních slov → Sdílení spíše pozitivního obsahu ̶ Prokázání masivního šíření dobré/špatné nálady v sociální síti ̶ Důkaz, že “nakažlivost nálady” nevyžaduje přímou sociální interakci ̶ Výzkum proveden bez souhlasu uživatelů a v rozporu s podmínkami používání služby ̶ Facebook se omluvil za “špatnou komunikaci” experimentu ̶ Do podmínek používání byla přidána část týkající se výzkumu Etika a IT 27 Skandál Cambridge Analytica ̶ 2013: Aplikace “This is your digital life” ̶ Dotazník k vytvoření psychologického profilu uživatele ̶ Přihlášení přes Facebook ̶ Aplikace měla přístup k osobním údajům uživatelů a k údajům o přátelích ̶ 2013 – 2014 vyplnilo 270 tis. uživatelů ̶ Aplikace získala přístup k údajům o 87 milionech uživatelů ̶ Většina z nich nikdy s poskytnutím údajů nesouhlasila ̶ Využití získaných údajů pro cílený politický marketing ̶ Např. kampaně Donalda Trumpa, Brexit,… ̶ Odhalení v roce 2018 ̶ Cambridge Analytica zbankrotovala ̶ Facebook zaplatil pokutu 500 000 GBP za neoprávněné poskytnutí dat Etika a IT 28 Shoshana Zuboff: Surveillance capitalism ̶ Pasivní využívání našeho nitra → Jeho aktivní ovlivňování ̶ Nálada uživatelů, na co kliknout, co si koupit, koho volit… ̶ Za účelem zisku dochází k “dálkovému ovládání lidí” ̶ Ohrožení lidské svobody a demokracie ̶ Řešení: Regulace ̶ Kapitalismus je regulován – antimonopolní zákony, ochrana zaměstnanců ̶ Vybrané segmenty trhu jsou nelegální – obchod s lidmi, s orgány,… ̶ Stejně tak by mělo být nelegální obchodování s lidskou budoucností ̶ Souhlasíte? Etika a IT 29 Dilemma Game Obrázky generovány nástrojem Midjourney /imagine people arguing ethical dilemmas Esej Studuji informatiku na vysoké škole a v jednom dobrovolném teoretickém předmětu mám za úkol odevzdat zápočtovou esej. Od starších studentů vím, že vyučující, který daný předmět vede, je velmi benevolentní a pro úspěšné ukončení stačí poslat i prázdný dokument, který nepůjde otevřít. Vyučující totiž vždy kontroluje jen to, jestli studenti něco poslali, nekontroluje však obsah dokumentu. Mám poslední 2 týdny na předání eseje, přičemž čas na napsání eseje by se dal efektivně využít na jiné předměty, které končí zkouškou. Co mám dělat? A. Rozhodnu se poslat prázdný dokument a nepodniknu žádné další kroky. B. Rychle napíšu esej nízké kvality a odevzdám ji, díky čemuž nebudu mít výčitky svědomí za zneužití benevolence učitele, a zároveň budu mít dost času na důležité zkoušky. Nepodniknu žádné další kroky. C. Rozhodnu se poctivě napsat esej a nepodniknu žádné další kroky. D. Přístup učitele se mi nelíbí, protože neplní své pracovní a pedagogické povinnosti, a proto se rozhodnu daný problém formálně nahlásit vedení fakulty. E. Rozhodnu se jít za daným učitelem a upozorním ho na nevhodnost jeho jednání a vyzvu ho, aby si plnil poctivě své povinnosti. Počítám s tím, že taková výzva ho nepotěší a může mít pro mě následky. Etika a it 31 Rychlý úvod do fungování velkých jazykových modelů V této sekci využity materiály z workshopu Generativní AI v univerzitním vzdělávání, jejichž autorem je Filip Lux 32 Midjourney /imagine artificial intelligence writing student essay in blue and yellow, white background Strojové učení a Neuronové sítě Generativní AI 33 - Vědní obor o vytváření jednoúčelových modelů (funkcí) pomocí analýzy dat. - Principy známé od šedesátých let 20. století - Programátor definuje úlohu, kterou model řeší. Chování modelu je dané dostupnými daty o úloze. - Finální model se vytváří iterativně - proces vytváření modelu se personifikuje - “učí se”, “trénuje se” BrunelloN, Wikimedia Commons Model (strojové učení) ̶ Matematická struktura „naučená“ z dat ̶ Analyzuje vztahy mezi atributy trénovacích dat ̶ Cílem odpovědět na zadanou otázku ̶ I pro data, na nichž se model netrénoval ̶ Tedy pro daný vstup dát požadovaný výstup ̶ Jazykový model „kóduje“ vztahy v rámci přirozeného jazyka ̶ Odpovídá na otázku: Jaké je následující slovo v textu? #Hastag Konference 34 Latentní prostor - Obrazy i text jsou reprezentovány latentními vektory - Poloha zachycuje významové vztahy mezi objekty např. King - Man + Woman = Queen - Velké jazykové modely (LLM) - mnohadimenzionální latentní prostory 35 Word2Vec Generativní AI Transformers ̶ 2017 Google Brain (Attention is all you need) ̶ Encoding ̶ Vector representation of each token ̶ Based on word embeddings (i.e. context of words) ̶ Attention (relations) between tokens ̶ Feed-forward neural network ̶ Vector representation of the “meaning” of the input text ̶ Decoding ̶ Based on the input from the encoder and the previous output of the decoder ̶ Output vector → Output token ̶ Useful for many NLP tasks ̶ Machine translation, paraphrase, summarization, question answering… 36Generative language models Generátor textu 37Generativní AI Q: Prezidentem České republiky je DOPLŇ DO TEXTU NÁSLEDUJÍCÍ SLOVO p ( | Q ) Generátor textu 38Generativní AI Q: Prezidentem České republiky je DOPLŇ DO TEXTU NÁSLEDUJÍCÍ SLOVO p ( | Q ) : Petr 70%, Pavel 20%, Miloš 5%, … Generátor textu 39Generativní AI Q: Prezidentem České republiky je Petr DOPLŇ DO TEXTU NÁSLEDUJÍCÍ SLOVO p ( | Q ) : Petr 70%, Pavel 20%, Miloš 5%, … doplnění odpovědi Generátor textu 40Generativní AI Q: Prezidentem České republiky je Petr DOPLŇ DO TEXTU NÁSLEDUJÍCÍ SLOVO p ( | Q ) Pavel 95%, Čtvrtníček 4%, … Generátor textu 41Generativní AI Q: Prezidentem České republiky je Petr DOPLŇ DO TEXTU NÁSLEDUJÍCÍ SLOVO p ( | Q, prompt ) Pavel 95%, Čtvrtníček 4%, … prompt: Kdo je prezidentem České Republiky? Chat GPT ̶ Chatovací robot postavený na GPT ̶ GPT = Generative Pre-trained Transformer ̶ Jazykový model natrénovaný na předpovídání (generování) dalšího slova na základě kontextu ̶ Generuje nejpravděpodobnější slovo bez ohledu na faktickou správnost ̶ Chat GPT je virtuální asistent natrénovaný na odpovídání na otázky a generování obsahu, který vypadá jako od člověka ̶ Filtry na nelegální, urážlivý nebo jinak závadný obsah 42Generativní AI Vyhledávací nástroje ̶ Elicit.org ̶ Najde a shrne nejrelevantnější zdroje ̶ Získávání dat z PDF ̶ Seznam konceptů ̶ Perplexity.ai ̶ Odpovídání na otázky ̶ Consensus.app ̶ Najde a shrne nejrelevantnější zdroje ̶ Meta analýza ̶ Tyto nástroje poskytují odkazy na zdroje ̶ …jsou však tyto zdroje spolehlivé? 43Generativní AI #Hastag Konference 44 #Hastag Konference 45 Příští týden ̶ Příští týden (14. 3.) přednáška odpadá! ̶ Analýza Chat GPT ve zvoleném předmětu (20 bodů) ̶ Zkuste vyřešit zadané úkoly pomocí Chat GPT ̶ Kriticky zhodnoťte užitečnost Chat GPT pro řešení úkolů ̶ Identifikujte hrozby a příležitosti ̶ Navrhněte způsob, jak smysluplně využít Chat GPT ̶ Místo Chat GPT lze využít jakýkoliv jiný nástroj založený na LLM ̶ Termín: 31. března ̶ Za každý den zpoždění penalizace 2 body ̶ Odevzdávárna v IS Etika a IT 46 Přednáška 21. 3. ̶ Mediální manipulace a dezinformace na internetu ̶ Zkreslení zpravodajských serverů ̶ Šíření misinformací a dezinformací na sociálních médiích ̶ Detekce dezinformací ̶ Přečtěte si článek ̶ ‘Nothing on this page is real’: How lies become truth in online America Etika a it 47