Abstract |
Bakalaura darbā tiek aprakstīts uzdevums, kas saistīts ar ģenētisko algoritmu pielietošanu klasifikācijas likumu ieguvei. Klasifikācijas uzdevums ir viens no klasiskiem datu ieguves uzdevumiem, kura risināšanai var pielietot vairākas metodes, kuras tiek sauktas par klasifikācijas likumu ieguves algoritmiem.
Darba aktualitāte pamatojas uz tā, ka pastāv arī tādi algoritmi, kas nav domāti klasifikācijas likumu ieguvei, bet tiem piemīt nepieciešamā funkcionalitāte, kas ļauj to darīt. Ģenētiskais algoritms pieder pie šāda veida metodēm. Darbā tiek pētītās un analizētas ģenētiskā algoritma iespējas klasifikācijas likumu ieguvē un tiek veikta tā pielietošana e veikala klientu novērtēšanai, kur tika jānosaka vai klients veiks atkārtoto pirkumu nākamo 90 dienu laikā.
Par darba teorētisko pamatojumu kalpo ģenētisko algoritmu un klasifikācijas jēdzienu un pamatprincipu pētīšana. Darbā tiek pielietots ģenētiskais algoritms, kas atšķiras no klasiskā ģenētiskā algoritma, tika veikta tā pielāgošana klasifikācijas likumu ieguvei. Definētā klasifikācijas uzdevuma risināšanai tika apskatīti JRip, J48 un Naivais Baijesa klasifikators.
Darba gaitā tika izveidota lietojumprogramma Microsoft Visual Studio 2010 vidē, pielietojot programmēšanas valodu Visual Basic 2010, kas veic ģenētiskā algoritma izpildi un kā rezultātu izdod klasifikācijas likumu kopu. Lietojumprogrammai tiek nodrošināts savienojums ar *.csv datni, kurā glabās informācija par datu kopas atribūtiem, un ar SQL Server 2008 datu bāzi, kurā glabās apmācības un testa kopas.
Eksperimenti tika veikti ar ģenētisko algoritmu un, pielietojot datu ieguves paketi Weka 3.6.4, ar JRip, J48 un Naivo Baijesa klasifikatoriem.
Iegūtie rezultāti apkopoti tabulu un, atbilstoši algoritma raksturīpašībām, klasifikācijas koka vai likumu veidā (izņemot NBk), kas ļauj veikt to salīdzinošo analīzi.
Darba apjoms - 72. lpp., 12 tabulas, 30 attēli. |