Odkrivanje skupin

  1. Kaj želimo pri odkrivanju skupin
    Hočemo da je razdalja med skupinami čim večja in razdalja med primeri v skupini čim manjša
  2. Metoda k-voditeljev (k-means)
    • Vsaka skupina ima svojega voditelja(centroid)
    • Vsak primer pripišemo najbližjemu voditelju
    • Podati moramo K-število voditeljev(skupin)

    • Algoritem:
    • Postavim naključno K točk ki predstavljajo centroide
    • Ponavljaj, dokler se točke centroidom spreminjajo
    •     Točko dodaj najbližjemu centroidu
    •     Izračunaj novo pozicijo centroida, glede na povprečje vseh točk, ki so mu bile dodeljene.


    • bližino ponavadi merimo z evklidsko razdaljo
    • Ta algoritem konvergira hitro le v nekaj korakih

    Slabost tega algoritma je, da moramo podati število skupin
  3. Hirearhično razvrščanje
    • Rezutat je hierarhija skupnih primerov
    • Prikažemo jo z dendogramom
Author
wolf
ID
347311
Card Set
Odkrivanje skupin
Description
df
Updated