logo

Nominelle vs Ordinale data

Datavidenskab drejer sig om behandling og analyse af data ved hjælp af en række værktøjer og teknikker. I nutidens datadrevne verden støder vi på typer af data, der hver især kræver håndtering og fortolkning. Det er vigtigt at forstå forskellige typer data for korrekt dataanalyse og statistisk fortolkning. Typen af ​​data bestemmer de korrekte statistiske metoder og operationer, der skal bruges. Forskellige datatyper har brug for forskellige analyse- og fortolkningsmetoder for at drage væsentlige konklusioner. I denne artikel vil vi udforske begrebet data, og dets betydning giver eksempler fra den virkelige verden og guider dig gennem måder at arbejde med det på.

Måleniveauer

Inden man analyserer et datasæt, er det afgørende at identificere den type data, det indeholder. Heldigvis kan alle data grupperes i en af ​​fire kategorier: nominelle, ordinære, interval- eller forholdsdata. Selvom disse ofte omtales som datatyper, er de faktisk forskellige måleniveauer. Måleniveauet afspejler den nøjagtighed, som en variabel er blevet kvantificeret med, og det bestemmer de metoder, der kan bruges til at udtrække indsigt fra dataene.



De fire kategorier af data er ikke altid ligetil at skelne og tilhører i stedet et hierarki, hvor hvert niveau bygger på det foregående.

1

Der er fire typer data: kategorisk, som yderligere kan opdeles i nominel og ordinal, og numerisk, som yderligere kan opdeles i interval og forhold. De nominelle og ordinære skalaer er relativt upræcise, hvilket gør dem nemmere at analysere, men de giver mindre præcise indsigter. På den anden side er interval- og forholdsskalaerne mere komplekse og svære at analysere, men de har potentialet til at give meget rigere indsigter.



  • Nominelle data – Nominelle data er en grundlæggende datatype, der kategoriserer data ved at mærke eller navngive værdier såsom køn, hårfarve eller dyretyper. Den har ikke noget hierarki.
  • Ordinaldata - Ordinaldata involverer klassificering af data baseret på rang, såsom social status i kategorier som 'velhavende', 'mellemindkomst' eller 'fattige'. Der er dog ingen faste intervaller mellem disse kategorier.
  • Intervaldata – Intervaldata er en måde at organisere og sammenligne data på, der inkluderer målte intervaller. Temperaturskalaer, som Celsius eller Fahrenheit, er gode eksempler på intervaldata. Intervaldata har dog ikke et sandt nul, hvilket betyder, at en måling af nul stadig kan repræsentere et kvantificerbart mål (såsom nul grader Celsius, som bare er endnu et punkt på skalaen og faktisk ikke betyder, at der ikke er nogen temperatur til stede) .
  • Forholdsdata – Det mest indviklede måleniveau er forholdsdata. På samme måde som intervaldata kategoriserer og arrangerer den data ved at bruge målte intervaller. Men i modsætning til intervaldata inkluderer forholdsdata et ægte nul. Når en variabel er nul, er der ingen tilstedeværelse af denne variabel. En vigtig illustration af forholdsdata er højdemåling, som ikke kan være negativ.

Hvad er nominelle data?

Kategoriske data, også kendt som nominelle data, er en afgørende type information, der bruges inden for forskellige områder som forskning, statistik og dataanalyse. Det består af kategorier eller etiketter, der hjælper med at klassificere og arrangere data. Det væsentlige træk ved kategoriske data er, at de ikke har nogen iboende orden eller rangordning blandt sine kategorier. I stedet er disse kategorier adskilte, adskilte og gensidigt udelukkende.

2

For eksempel bruges nominelle data til at klassificere information i forskellige etiketter eller kategorier uden nogen naturlig rækkefølge eller rangering. Disse etiketter eller kategorier er repræsenteret ved hjælp af navne eller termer, og der er ingen naturlig rækkefølge eller rangordning blandt dem. Nominelle data er nyttige til kvalitativ klassificering og organisering af information, hvilket gør det muligt for forskere og analytikere at gruppere datapunkter baseret på specifikke attributter eller karakteristika uden at antyde nogen numeriske sammenhænge.



  • Øjenfarvekategorier som blå eller grøn repræsenterer nominelle data. Hver kategori er særskilt uden rækkefølge eller rangering.
  • Smartphonemærker som iPhone eller Samsung er nominelle data. Der er intet hierarki blandt mærker.
  • Transportformer som bil eller cykel er nominelle data. De er diskrete kategorier uden iboende rækkefølge.

Karakteristika for nominelle data

  • Data, der er klassificeret som nominelle, består af kategorier, der er fuldstændig adskilte og adskilte fra hinanden.
  • Data, der falder ind under den nominelle kategori, er kendetegnet ved beskrivende etiketter snarere end nogen numerisk eller kvantitativ værdi
  • Nominelle data kan ikke rangeres eller sorteres hierarkisk, da ingen kategori er bedre eller ringere end en anden.

Eksempel

Her er et par eksempler på, hvordan nominelle data bruges til at klassificere og kategorisere oplysninger i særskilte og ikke-ordnede kategorier:

1. Bilens farver: Bilfarver er nominelle data med klare kategorier, men ingen iboende rækkefølge eller rangering. Hver bil falder ind under én farvekategori, uden nogen logisk eller numerisk sammenhæng mellem farver.

2. Typer af frugter: Frugtkategorier i en kurv er nominelle. Hver frugt tilhører en bestemt kategori uden hierarki eller orden. Alle kategorier er adskilte og diskrete.

3. Filmgenrer: Filmgenrer er nominelle data, da der ikke er nogen rangordning blandt kategorier som action eller komedie. Hver genre er unik, men vi kan ikke sige, om den ene er bedre end en anden baseret på disse data alene.

Hvad er Ordinal Data?

Ordinaldata er en form for kvalitative data, der klassificerer variabler i beskrivende kategorier. Det er kendetegnet ved, at de kategorier, den anvender, er rangeret på en slags hierarkisk skala, såsom fra høj til lav. Ordinaldata er den næstmest komplicerede type måling efter nominelle data. Selvom det er mere indviklet end nominelle data, som mangler nogen iboende rækkefølge, er det stadig relativt forenklet.

3

For eksempel er Ordinaldata en type data, der bruges til at kategorisere varer med et meningsfuldt hierarki eller rækkefølge. Disse kategorier hjælper os med at sammenligne og rangere elevers forskellige præstationer, positioner eller præstationer, selvom intervallerne mellem dem ikke er ens. Ordinaldata er nyttige til at forstå ordnede valg eller præferencer og til at vurdere relative forskelle.

  • Skolekarakterer: Karakterer som A, B, C er ordinære data, rangeret efter præstation, men intervallerne mellem dem varierer.
  • Uddannelsesniveau: Niveauer som gymnasium, bachelor, master er ordinære data, sorteret efter uddannelse, men hullerne mellem niveauerne er forskellige.
  • Anciennitetsniveau: Jobniveauer som entry, mid, senior er ordinære data, der indikerer hierarki, men forskellen varierer efter job og branche.

Karakteristika for Ordinal Data

  • Ordinaldata falder ind under kategorien ikke-numeriske og kategoriske data, men de kan stadig gøre brug af numeriske værdier som etiketter.
  • Ordinaldata er altid rangeret i et hierarki (deraf navnet 'ordinal').
  • Ordinaldata kan rangeres, men deres værdier er ikke jævnt fordelt.
  • Med ordinaldata kan du beregne frekvensfordeling, tilstand, median og række af variable.

Eksempel

Her er et par eksempler på, hvordan ordinære data bruges i felter og domæner:

1. Uddannelsesniveauer: Ordinaldata bruges almindeligvis til at repræsentere uddannelsesniveauer, såsom skole, bachelorgrad, kandidatgrad og ph.d. Disse niveauer har en rækkefølge.

2. Kundetilfredshedsvurderinger: En anden anvendelse af data er i kundetilfredshedsundersøgelser. Disse undersøgelser beder ofte respondenterne om at vurdere deres oplevelse på en skala, fra dårlig til fremragende.

3. Økonomiske klasser: klasser, herunder klasse middelklasse og overklasse, kan klassificeres som ordinære data baseret på deres rangering.

Disse eksempler viser de måder, hvorpå ordinære data bruges på tværs af felter og domæner.

Nominelle vs almindelige data

Egenskaber

Nominelle data

Ordinaldata

Kategoriernes art

Distinkt og diskret

Diskret og distinkt

Ordre/rangering

Ingen iboende orden

Har en klar rækkefølge eller rangering

Numeriske værdier

Ingen meningsfulde numeriske værdier

Ingen meningsfulde numeriske værdier

Analyse teknikker

Frekvenstællinger, procenter, søjlediagrammer

Rangordning, median, ikke-parametriske test, ordnede søjlediagrammer, ordinal regression

Eksempel

Farver, køn, typer af dyr

hvad er en skærm

Skolekarakterer, uddannelsesniveau, anciennitetsniveau

Fortolkning

Bruges til klassificering og gruppering baseret på kategori

Bruges til at vurdere ordnede præferencer, hierarki eller rangeringer