Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorzinātne un organizāciju tehnoloģijas
Nosaukums Daudzslāņainu no teksta uz attēlu ģenerētu komiksu paneļu izstrādes tehniskā iespējamība
Nosaukums angļu valodā Feasibility Analysis for Multi-Layered Text-to-Image Generation of Comic Strips
Struktūrvienība 01B00 Rīgas Biznesa skola
Darba vadītājs Pēteris Paikens
Recenzents Agris Ņikitenko
Anotācija Šī disertācija pēta mākslīgā intelekta radītu komiksu spēju saglabāt stāsta konsekvenci, loģisko secību un vizuālo saskaņu, tādējādi imitējot cilvēka radītu komisku. Disertācijā tiek iztirzāti komiksu mākslas unikālie izaicinājumi, izpētot komiksu īpatnības. Atbilstoši atklātajam tiek ģenerēti komiksi kopā ar padziļinātiem to aprakstiem izmantojot pašreizējās MI tehnoloģijas, konkrēti, difūzijas un no teksta-uz-tekstu modeļus. Literatūras apskatā atklājās, ka OpenAI DALL-E algoritms ir vispiemērotākais šī pētījuma mērķu sasniegšanai. Pētījuma metodoloģija ietver pielāgota GPT algoritma izstrādi, kas apstrādā lietotāja ievadīto komiksa ideju, lai izveidotu komiksa iezīmju sarakstu un atbilstošus paneļu aprakstus tālākai attēla ģenerācijai. Izmantojot stabilās difūzijas tehniku, kas integrēta DALL-E ģeneratorā, šie apraksti tiek pārvērsti trīs un vairāk paneļu komiksos. Darbā tika analizēti 100 MI ģenerēti attēli un salīdzināti ar 10 cilvēka radītiem komiksiem, izmantojot tīmekļa spēli, kurā dalībnieki izvēlas, kurš attēls, pēc viņu domām, ir cilvēka radīts. Visiem attēliem tika piešķirts Elo reitings, un lietotāja izvēles rezultāti tika izmantoti, lai palielinātu vai samazinātu reitingu katram attēlam. Tāpat tika pētīts, vai komikss satur tekstu, un kā tas ietekmē salīdzinājuma rezultātus. Secinājumi atklāj, ka 32% no MI ģenerētajiem komiksiem atrodas cilvēka komiksu Elo robežās. Turklāt viens no pieciem labākajiem reitingiem bija MI ģenerētam attēlam. Vidējais MI komiksu reitings bija 487,78, bet cilvēkiem - 622,20. Dalībnieki varēja pārliecinoši apgalvot, ka attēls ir cilvēka radīts tikai ar 35,8% precizitāti. Šie rezultāti norāda, ka daļa MI ģenerēto komiksu var tikt uztverta kā cilvēka radīti, parādot, ka ģeneratīvo algoritmu radīto attēlu kvalitāte un naratīva konsekvence var būt līdzvērtīga cilvēka. Tas pierāda vairākslāņu teksta-uz-attēla ģenerēšanas algoritmu potenciālu kā noderīgu rīku komiksu mākslas nozarē.
Atslēgas vārdi Teksts-uz-attēlu, Komiksi, ģeneratīvais MI
Atslēgas vārdi angļu valodā Text-to-image, Comic Strip, generative AI
Valoda eng
Gads 2024
Darba augšupielādes datums un laiks 15.04.2024 04:17:08