Klasteranalüüs

Klasteranalüüs (ingl. cluster analysis) on informaatikas objektide klastriteks rühmitamise ehk klasterdamise moodus[1].

Klasterdamine toimub objektidevahelist "kaugust", "lähedust" või "sarnasust" iseloomustavate parameetrite alusel. Klasteranalüüs on mitmemõõtmeline.

Kahemõõtmeline klasteranalüüs (kahe erineva parameetri alusel saadud klastrid)

Klasterdada võib nii suvalisi objekte kui ka kindlat liiki objekte erinevatest aspektidest. Kui parameetrid on vaatlusandmed (valimid), siis on klasterdamine seotud statistilise andmetöötlusega (ingl. data clustering). Kui klasterdamine on hierarhiline, siis kattub see taksonoomiaga.

Klasteranalüüsi võtteid kasutatakse ka kujundite äratundmises (ingl. pattern recognition), isokvantanalüüsis, masinõppes jm. Klasterdamine (ingl. clustering) on uurimisandmete analüüsi esmaülesanne.

Viited muuda

  1. B. S. Everitt, S. Landau, M. Leese. 2009. Cluster Analysis (4th edition) ISBN 978-0340761199

Vaata ka muuda