| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Datorsistēmas |
| Nosaukums |
Uzvedņu iesprauduzbrukumi lielajos valodu modeļos un to mazināšanas stratēģijas |
| Nosaukums angļu valodā |
Prompt Injection Vulnerabilities in Large Language Models and Their Mitigation Strategies |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Alla Anohina-Naumeca |
| Recenzents |
Ainārs Auziņš |
| Anotācija |
Saistībā ar lielo valodu modeļu (LVM) un ar tiem integrēto lietojumu straujo izplatību, šajā bakalaura darbā ir pētīts viens no LVM drošības draudiem - uzvedņu iesprauduzbrukumi. Darba mērķis ir analizēt šo uzbrukumu mehānismus un mazināšanas stratēģijas.
Autors ir izstrādājis gpt-3.5-turbo, gpt-4o, claude-3-haiku un claude-3-opus integrētu sistēmu, kurā ir veicis uzvedņu iesprauduzbrukumus, piemēram, pielietojot konteksta manipulācijas, atsoļa rakstzīmes un citas metodes. Šajā kontekstā ir izpētīta uzvedņu inženierijā un ārējo servisu integrācijā balstīto aizsardzības stratēģiju efektivitāte.
Iegūtie rezultāti parāda, ka gpt-4o un claude-3-opus ir mazāk ievainojami pret uzvedņu iesprauduzbrukumiem, taču arī gpt-3.5-turbo un claude-3-haiku izmantošanas gadījumā var samazināt šo uzbrukumu izdošanos par 50-80%, ievērojot autora izstrādātos ieteikumus.
Bakalaura darbā ir 53 lappuses., 5 attēli, 16 tabulas, 2 pielikumi, 65 izmantotie avoti. |
| Atslēgas vārdi |
Lielais valodas modelis, uzvedņu iesprauduzbrukums, uzvedņu inženierija |
| Atslēgas vārdi angļu valodā |
Large language model, prompt injection, prompt engineering |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
25.05.2025 13:21:44 |