gegevenstypen zijn een belangrijk begrip van statistieken, dat moet worden begrepen, om statistische metingen correct toe te passen op uw gegevens en daarom om bepaalde aannames hierover correct te concluderen. Deze blog post zal u kennismaken met de verschillende soorten gegevens die u moet weten, om de juiste verkennende data-analyse (EDA), dat is een van de meest onderschatte onderdelen van een machine learning project.,
Table of Contents:
Introduction to Data Types
Categorical Data (Nominal, Ordinal)
Numerical Data (Discrete, Continuous, Interval, Ratio)
Why Data Types are important?,
statistische methoden
samenvatting
een goed begrip van de verschillende gegevenstypen, ook wel meetschalen genoemd, is een cruciale voorwaarde voor het uitvoeren van verkennende gegevensanalyse (Eda), omdat u bepaalde statistische metingen alleen voor specifieke gegevenstypen kunt gebruiken.
u moet ook weten met welk gegevenstype u te maken hebt om de juiste visualisatiemethode te kiezen. Denk aan gegevenstypen als een manier om verschillende soorten variabelen te categoriseren. We zullen de belangrijkste soorten variabelen bespreken en kijken naar een voorbeeld voor elk., We noemen ze soms meetschalen.
categorische gegevens
categorische gegevens vertegenwoordigen kenmerken. Daarom kan het dingen vertegenwoordigen zoals iemands geslacht, taal, enz. Categorische gegevens kunnen ook numerieke waarden aannemen (Voorbeeld: 1 Voor vrouw en 0 voor man). Merk op dat deze getallen geen wiskundige betekenis hebben.
Nominale gegevens
nominale waarden vertegenwoordigen afzonderlijke eenheden en worden gebruikt om variabelen te etiketteren die geen kwantitatieve waarde hebben. Zie ze maar als ‘labels’. Merk op dat nominale gegevens die geen orde heeft., Dus als je de volgorde van de waarden zou veranderen, zou de betekenis niet veranderen. U kunt twee voorbeelden van nominale eigenschappen hieronder zien:
Leave a Reply