Jak moc umělá je umělá inteligence

1. 11. 2021Barbora MrázkováRecenze

Fenomén umělé inteligence, stejně jako téma algoritmů, se v oblasti umění a galerijním prostředí objevuje již delší dobu. Výstava AI: All Idiots v MeetFactory, o které píše v recenzi Barbora Mrázková, se nezabývá jen problematikou samotných algoritmů, ale také významem dat, na kterých se algoritmy trénují. Těmito daty jsou převážně digitální fotografie. Záměrně didakticky a s nadsázkou pojednaná výstava nabízí podle slov kurátorů ScreenSaverGallery přiblížení tématu divákovi jasně, srozumitelně a zážitkově, a to skrze vlastní prostředky umělé inteligence.

Jak moc umělá je umělá inteligence

Základním tématem výstavy je dataset. Algoritmy počítačového vidění mají za úkol napodobovat způsob, jakým lidé vidí a interpretují obrazy. K napodobení těchto kognitivních funkcí se využívají takzvané datasety. Tím nazýváme soubor digitálních fotografií, který se používá k testování, trénování a vyhodnocování výkonnosti algoritmů. Algoritmus se z fotografií obsažených v datové sadě učí, a to tříděním podle čistě vizuálních podobností, např. barvy, tónu, kontrastu, ploch, hran apod. K rozpoznávání obsahů vizuálních materiálů jsou dnes kromě algoritmů využívány i neuronové sítě. Ty už se nesnaží jen statisticky odhadnout obraz, ale spíše ho pochopit skrze identifikaci objektů a vztahů mezi nimi. Stejné sady fotografií jsou sdíleny mezi vývojáři a ti pak mají možnost porovnávat výsledky své práce. Největší datasety jako například Google Open Image nebo ImageNet jsou volně k dispozici na internetu a jsou využívány různými typy aplikací používané třeba pro autonomní automobily, dohledové systémy, lékařské zobrazování nebo obrazové filtry a úpravy.

Schéma, ze kterého výstava vychází, nalezneme na stěně galerie, je jím seznam českých umělců, umělkyň a uměleckých skupin převzaný z Artlistu – databáze současných českých umělců a umělkyň. Seznam je rozdělen na dvě skupiny, v první jsou ti, co mají své vlastní webové stránky nebo blog a jejichž vizuální materiály se staly vstupem do datasetu vytvořeného pro tuto výstavu. Druhou tvoří téměř stejně velká skupina umělců nereprezentujících sama sebe na internetu, ti v datasetu zastoupeni nejsou. Celkem tedy umělá inteligence zpracovala 136 458 obrázků stažených ze 398 webových stránek českých umělců a umělkyň.

Naše průvodkyně, vygenerovaná mladá nadějná umělkyně Amy, nás vede do světa složeného z klíčových bodů, transformací prvků, klasifikátorů, tréninkových sad a dalších termínů, kde se neuronové sítě umělé inteligence nazvané All Idiots učí třídit fotografie českého umění. Třídí ne podle souvislostí, které v obraze „vidí” tak jako my, ale podle již zmíněných vizuálních podobností. V galerii jsou prezentovány čtyři skupiny sestavené podle barvy, kompozice, plochy a linky. S těmito výstupy pak dál pracují umělci, již byli osloveni kurátorským týmem. V galerii tak potkáme jezdící robotické vysavače s připevněnými tablety nebo videoprojekce s pokusy All idiots o napodobení českého umění, o němž si „udělala obraz” skrze vytvořený dataset.

Za zmínku stojí projekt umělců Viléma Duhy a Andrease Gajdošíka, kteří v MeetFactory prezentují krátké video, v němž divákům odkrývají proces označování fotografií datasetu tagem české umění. Tento dataset pak v budoucnu nahrají do jedné z předních datových sad Google Open Images. Ta obsahuje přes 9 milionů obrázků, ale jen malé množství fotografií je označených tímto tagem. Tímto gestem by mělo být české vizuální umění povýšeno v obrazové hierarchii, získalo by pomyslné privilegium ovlivňovat a spoluvytvářet internet, ze kterého se budou příští generace umělé inteligence učit.

Datových sad je vzhledem k náročnosti na výrobu stále málo. Jeden z největších datasetů tohoto typu je projekt ImageNet. Tato databáze obsahuje více než 14 milionů fotografií posbíraných na internetu. Snímky jsou ručně anotovány, tříděny a uspořádávány do dalších souborů, z nichž každý obsahuje minimálně 1000 snímků. ImageNet obsahuje více než 20 000 kategorií, na kterých pracovalo 25 000 pracovníků po dobu dvou let. Ti musí projít krátkým testem, aby se během definování obsahu na obrázku a napsání krátké anotace zabránilo nejasnému označování snímků. Vztah jazyka a obrazu, tedy jak reprezentovat svět, je problém přímo zakódovaný do historie obrazových datasetů. Po zadání klíčového slova, třeba „kočka“, začne síť shromažďovat obrazy spojené s tímto slovem a snaží se generovat podstatu toho, co by slovo mohlo znamenat. Podkategorie zahrnují širokou škálu témat od různých typů živočichů a rostlin po lidskou typologii. Některé nejednoznačné či rozporuplné pojmy jako budoucnost, nebo různé emoce (třeba strach) můžou být zkreslené, navíc do nich při anotaci zaměstnanci vpisují své vlastní kulturní nebo sociální zázemí. Skupina umělců a kurátorů, kteří vytvářeli dataset pro výstavu AI: All idiots si chytře tuto práci definování kategorie ulehčili převzetím již hotové databáze Artlist.

Stereotypně vypadající syntetická avatarka Amy pokládá rétorickou otázku, „zda si je české umění navzájem dostatečně podobné, aby jej mohla umělá inteligence napodobit.” Fotografie reprezentující české umění, stažené z webových stránek umělců a umělkyň, v datasetu zastupují umělecké dílo pouze samy za sebe, tedy bez názvu, bez popisu díla, bez ukázky dalších snímků projektů, tedy bez kontextu. Ocitají se v automatizovaném, technologickém prostředí, kde se ztrácí individualita, kreativita, autenticita. Můžeme se stejně tak ptát, jakou hodnotu takový obraz může mít, když ho absorbuje databáze nepřeberného množství fotografií, které vypadají všechny skoro stejně?

Databáze jsou plné takových fotografických obrazů, které se pro vědce a vývojáře stávají určitou neutrální plochou s barvami, tvary, vzory a kontrasty, bez dalšího historického kontextu. Tyto obrazy jsou ale fotografie uživatelů internetu, tedy naše fotografie, které jsou shromažďovány a uchovávány bez našeho vědomí a souhlasu. Pocházejí z tzv. „lidových“, uživatelsky generovaných sbírek na internetu, které provozuje například Flicker nebo Facebook, dále z různých blogů a internetových vyhledávačů. Jde o snímky, o nichž ani jejich autoři ani lidé na samotných fotografiích netuší, že jsou součástí dalších databází. Jsou to pasivně produkovaná data z různých zdrojů, které se dál šíří online prostorem a stávají se komerčními, ať už úmyslně nebo ne. Internetový prostor, který máme stále tendenci vnímat jako veřejný, je zároveň vlastněný korporacemi. Tím, že se naše osobní fotografie, aniž bychom o tom věděli, stávají součástí podobných databází, sami dobrovolně přispíváme, zlepšujeme a posilujeme společnosti typu Google.

Možná že umělci druhé skupiny, ti nezařazení, neklasifikovaní, neviditelní, nabyli svou neviditelností hodnotu novou. Nepodílí se sice na utváření nových rozšířených sad na učení pro budoucí generace umělé inteligence, ale ani nehrají roli komodity v projektech, které posilují a upevňují soukromé instituce a korporace, kterým umělá inteligence slouží.

O problému vytěžování dat píše Salomé Viljoen ve svém eseji z minulého roku Data as Property? Zabývá se otázkou, zda je řešením považovat data spíše za formu majetku, nebo formu práce. Datová reforma by se každopádně musela přizpůsobit právním pojmům a aparátu, které se vážou k „vlastnictví“ nebo „práci“. Zařazení do těchto regulačních režimů, ale vzhledem k nedostatkům v právu ustavující práci i kapitál v této oblasti vede bohužel spíše ke skepsi. Řešením by mohlo být řídit data kolektivními metodami – ve formě majetku je zařadit například pod společnou správu, nebo jako práci řídit prostřednictvím kolektivu pracovníků. Variantou je i vytvořit úplně nové alternativy demokratické správy.

Autorství ale není jediný problém, který datasety od začátku provází. K velkým databázím, jako jsou imageNet nebo Google Open Images, se vážou kontroverze spojené třeba s aplikacemi Google Arts a Culture selfie. Google získal skrze tyto aplikace obrovský dataset snímků obličejů s biometrickými údaji propojenými se skutečnými lidmi v reálném světě. Kritika se kromě nezákonných sběrů fotografií pro vyvíjení aplikací Facial recognition zaměřuje především na kulturní, rasovou a genderovou předpojatost algoritmů. Umělec Trevor Paglen společně s výzkumnicí v oblasti AI Kate Crawford se v roce 2019 ve svém výstavním projektu ImageNetRoulette zaměřili právě na ImageNet a jejich systém, který je používán na klasifikaci objektů a lidí. Tento proces navazuje na zakořeněné systémové předsudky, jako je právě rasismus nebo misogynie, a kopíruje předpoklady a geografické a socioekonomické postavení svých klasifikátorů. Těmi jsou většinou prekarizovaní pracovníci, placeni obvykle 1 až 4 centy (US$) za jednu anotaci, kteří zároveň svými popisy rozhodují o tom, co obrazy znamenají, a vykonávají tím určitý druh sociální a politické práce. Manuálně přiřazují fotografie ke kategoriím jako kočka, auto, tenista nebo roztleskávačka, ale i coura nebo buran. Lidé jsou tak tříděni jako objekty podle věku, osobního charakteru, pohlaví, nebo rasy. Jak se ukazuje, umělá inteligence tak, jak ji používáme dnes, nemůže být objektivní, ani univerzální nebo neutrální. Je vytvářena lidmi a její schopnost „vidět” je závislá na nich.

Na výstavě AI: All Idiots je strojové vidění dáváno do kontrastu k vidění lidskému, skrze technické parametry a limitované schopnosti vnímání. Například rychlost zobrazení, jakým neuronová síť umělé inteligence All Idiots prochází obrázky datasetu, je pro lidské oko téměř nepostřehnutelná. Na druhou stranu, aby se AI naučila obrázky rozpoznávat, musí si je nejprve rozložit do řádků. Jedno z děl nám nabízí pohled na celkový takto rozložený dataset – obraz, který je stonásobně zmenšený. V dalším díle, videu složeném ze sesbíraných fotografií děl a dokumentací z webových stránek umělců a umělkyň, je divák instruován ke sledování videoprojekci, jak nejdéle je to možné. Pro člověka je tento proces náročný, protože řazením obrazů za sebe mozek vytváří souvislosti, které umělá inteligence „nevnímá“. Celá jedna místnost je pak věnovaná novému vygenerovanému českému vizuálnímu umění, které AI na základě procesu učení vytváří. Tyto materiály jsou, jak se dá předvídat, vizuálně podobné všem generovaným obrazům, které jsme v minulosti měli možnost vidět v podobných projektech.

Jak je ze stručného popisu patrné, výstava je především zaměřená na edukaci a na představení atraktivního tématu datových sad. Nabádá nás, abychom o těchto sbírkách obrazů začali uvažovat nejen z technického hlediska, ale i z pohledu kulturního artefaktu, vizuální kultury nebo skrze významy obrazu i z pohledu dějin fotografie. Tím se obrací nejen k technickým aspektům umělé inteligence, ale nabízí také sebereflexi vlastních uměleckých strategií a pokládá podstatné otázky ve vztahu k tomu, kdo a jak ovlivňuje vývoj kultury a našeho vnímání.

Jana Bernartová, Vilém Duha, Andreas Gajdošík, Aimee Zia Hasan, Vladimír Havlík, Tomáš Javůrek, Marie Meixnerová, Petr Racek, Matěj Smetana, Petra Ševců, Michal Škapa, Barbora Trnková / AI: All Idiots / kurátoři: ScreenSaverGallery / Galerie MeetFactory / Praha / 15. 9. – 5. 12. 2021

Foto: Katarína Hudačinová

Barbora Mrázková | Barbora Mrázková absolvovala na FAMU obor fotografie. Po škole spolupracovala v umělecké dvojici s Filipem Lábem. V současné době studuje doktorský program na pražské UMPRUM. Ve své práci a výzkumu se zabývá operacemi a procesy skrytými za produkcí a distribucí současného fotografického obrazu.