Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Science and Organizational Technologies
Title in original language Daudzslāņainu no teksta uz attēlu ģenerētu komiksu paneļu izstrādes tehniskā iespējamība
Title in English Feasibility Analysis for Multi-Layered Text-to-Image Generation of Comic Strips
Department 01B00 Riga Business School
Scientific advisor Pēteris Paikens
Reviewer Agris Ņikitenko
Abstract Šī disertācija pēta mākslīgā intelekta radītu komiksu spēju saglabāt stāsta konsekvenci, loģisko secību un vizuālo saskaņu, tādējādi imitējot cilvēka radītu komisku. Disertācijā tiek iztirzāti komiksu mākslas unikālie izaicinājumi, izpētot komiksu īpatnības. Atbilstoši atklātajam tiek ģenerēti komiksi kopā ar padziļinātiem to aprakstiem izmantojot pašreizējās MI tehnoloģijas, konkrēti, difūzijas un no teksta-uz-tekstu modeļus. Literatūras apskatā atklājās, ka OpenAI DALL-E algoritms ir vispiemērotākais šī pētījuma mērķu sasniegšanai. Pētījuma metodoloģija ietver pielāgota GPT algoritma izstrādi, kas apstrādā lietotāja ievadīto komiksa ideju, lai izveidotu komiksa iezīmju sarakstu un atbilstošus paneļu aprakstus tālākai attēla ģenerācijai. Izmantojot stabilās difūzijas tehniku, kas integrēta DALL-E ģeneratorā, šie apraksti tiek pārvērsti trīs un vairāk paneļu komiksos. Darbā tika analizēti 100 MI ģenerēti attēli un salīdzināti ar 10 cilvēka radītiem komiksiem, izmantojot tīmekļa spēli, kurā dalībnieki izvēlas, kurš attēls, pēc viņu domām, ir cilvēka radīts. Visiem attēliem tika piešķirts Elo reitings, un lietotāja izvēles rezultāti tika izmantoti, lai palielinātu vai samazinātu reitingu katram attēlam. Tāpat tika pētīts, vai komikss satur tekstu, un kā tas ietekmē salīdzinājuma rezultātus. Secinājumi atklāj, ka 32% no MI ģenerētajiem komiksiem atrodas cilvēka komiksu Elo robežās. Turklāt viens no pieciem labākajiem reitingiem bija MI ģenerētam attēlam. Vidējais MI komiksu reitings bija 487,78, bet cilvēkiem - 622,20. Dalībnieki varēja pārliecinoši apgalvot, ka attēls ir cilvēka radīts tikai ar 35,8% precizitāti. Šie rezultāti norāda, ka daļa MI ģenerēto komiksu var tikt uztverta kā cilvēka radīti, parādot, ka ģeneratīvo algoritmu radīto attēlu kvalitāte un naratīva konsekvence var būt līdzvērtīga cilvēka. Tas pierāda vairākslāņu teksta-uz-attēla ģenerēšanas algoritmu potenciālu kā noderīgu rīku komiksu mākslas nozarē.
Keywords Teksts-uz-attēlu, Komiksi, ģeneratīvais MI
Keywords in English Text-to-image, Comic Strip, generative AI
Language eng
Year 2024
Date and time of uploading 15.04.2024 04:17:08