Eerst opruimen, dan clusteren: waarom PCA en K-means de beste data-vrienden zijn
Iedereen die wel eens met data heeft gewerkt, kent het gevoel: je opent een dataset en je weet niet waar je moet beginnen. Te veel kolommen, te veel variabelen, en vaak ook nog overlap. Het lijkt een beetje op een zolder vol dozen die je in twintig jaar hebt verzameld. Je weet dat er iets van waarde in zit, maar hoe ga je orde scheppen?
Nieuws,Data-analyse,