Odkrivanje skupin

 1. Kaj želimo pri odkrivanju skupin
  Hočemo da je razdalja med skupinami čim večja in razdalja med primeri v skupini čim manjša
 2. Metoda k-voditeljev (k-means)
  • Vsaka skupina ima svojega voditelja(centroid)
  • Vsak primer pripišemo najbližjemu voditelju
  • Podati moramo K-število voditeljev(skupin)

  • Algoritem:
  • Postavim naključno K točk ki predstavljajo centroide
  • Ponavljaj, dokler se točke centroidom spreminjajo
  •     Točko dodaj najbližjemu centroidu
  •     Izračunaj novo pozicijo centroida, glede na povprečje vseh točk, ki so mu bile dodeljene.


  • bližino ponavadi merimo z evklidsko razdaljo
  • Ta algoritem konvergira hitro le v nekaj korakih

  Slabost tega algoritma je, da moramo podati število skupin
 3. Hirearhično razvrščanje
  • Rezutat je hierarhija skupnih primerov
  • Prikažemo jo z dendogramom
Author
wolf
ID
347311
Card Set
Odkrivanje skupin
Description
df
Updated