Processen med konvertering af data fra en form til en anden form er kendt som kodning. Det bruges til at transformere dataene, så data kan understøttes og bruges af forskellige systemer. Kodning fungerer på samme måde som at konvertere temperatur fra Celsius til Fahrenheit, da den bare bliver konverteret i en anden form, men den oprindelige værdi forbliver altid den samme. Kodning bruges hovedsageligt i to felter:
Bemærk: Kodning er forskellig fra kryptering, da dens hovedformål ikke er at skjule dataene, men at konvertere dem til et format, så de kan forbruges korrekt.
I dette emne vil vi diskutere de forskellige typer af kodningsteknikker, der bruges i databehandling.
Type kodningsteknik
Tegnkodning
Tegnkodning koder tegn til bytes . Den informerer computerne om, hvordan de skal fortolke nul og et til rigtige tegn, tal og symboler. Computeren forstår kun binære data; derfor er det nødvendigt at konvertere disse tegn til numeriske koder. For at opnå dette konverteres hvert tegn til binær kode, og til dette gemmes tekstdokumenter med kodningstyper. Det kan gøres ved at parre tal med tegn. Hvis vi ikke anvender tegnkodning, vil vores hjemmeside ikke vise tegnene og teksten i et korrekt format. Derfor vil det mindske læsbarheden, og maskinen vil ikke være i stand til at behandle data korrekt. Yderligere sørger tegnkodning for, at hvert tegn har en korrekt repræsentation i computer- eller binært format.
Der er forskellige typer tegnkodningsteknikker, som er angivet nedenfor:
HTML-kodning
HTML-kodning bruges til at vise en HTML-side i et korrekt format. Med kodning får en webbrowser at vide, hvilket tegnsæt der skal bruges.
I HTML er der forskellige tegn brugt i HTML Markup som f.eks. For at kode disse tegn som indhold skal vi bruge en kodning.
URL-kodning
URL (Uniform resource locator) Kodning bruges til konvertere tegn i et sådant format, at de kan overføres over internettet . Det er også kendt som procentkodning. URL-kodningen udføres for at sende URL'en til internettet ved hjælp af ASCII-tegnsættet. Ikke-ASCII-tegn erstattes med en %, efterfulgt af de hexadecimale cifre.
UNICODE-kodning
Unicode er en kodningsstandard for et universelt tegnsæt. Det tillader kodning, repræsentation og håndtering af teksten repræsenteret på de fleste af de sprog eller skrivesystemer, der er tilgængelige over hele verden. Det giver et kodepunkt eller nummer for hvert tegn på alle understøttede sprog. Det kan repræsentere omtrent alle mulige tegn på alle sprogene. En bestemt sekvens af bit er kendt som en kodningsenhed.
En UNICODE-standard kan bruge 8, 16 eller 32 bit til at repræsentere tegnene.
Unicode-standarden definerer Unicode Transformation Format (UTF) til at kode kodepunkterne.
UNICODE-kodningsstandarden har følgende UTF-skemaer:
UTF8 er defineret af UNICODE-standarden, som er tegnkodning med variabel bredde, der bruges i elektronisk kommunikation. UTF-8 er i stand til at kode alle 1.112.064 gyldige tegnkodepunkter i Unicode ved hjælp af en til fire en-byte (8-bit) kodeenheder.
UTF16-kodning repræsenterer et tegns kodepunkter ved hjælp af et af to 16-bit heltal.
UTF32-kodning repræsenterer hvert kodepunkt som 32-bit heltal.
Base64-kodning
Base64 Encoding bruges til at kode binære data til tilsvarende ASCII-tegn. Base64-kodningen bruges i Mail-systemet, da mailsystemer som SMTP ikke kan arbejde med binære data, fordi de kun accepterer ASCII-tekstdata. Det bruges også i simpel HTTP-godkendelse til at kode legitimationsoplysningerne. Desuden bruges det også til at overføre de binære data til cookies og andre parametre for at gøre data ulæselige for at forhindre manipulation. Hvis et billede eller en anden fil overføres uden Base64-kodning, vil den blive beskadiget, da mailsystemet ikke er i stand til at håndtere binære data.
Base64 repræsenterer dataene i blokke på 3 bytes, hvor hver byte indeholder 8 bits; derfor repræsenterer det 24 bit. Disse 24 bits er opdelt i fire grupper af 6 bits. Hver af disse grupper eller bidder konverteres til tilsvarende Base64-værdi.
ASCII-kodning
Amerikansk standardkode for informationsudveksling (ASCII) er en type tegnkodning. Det var den første tegnkodningsstandard, der blev udgivet i 1963.
ASCII-koden bruges til at repræsentere engelske tegn som tal, hvor hvert bogstav er tildelt et tal fra 0 til 127. De fleste moderne tegnkodningsskemaer er baseret på ASCII, selvom de understøtter mange ekstra tegn. Det er en enkelt byte-kodning, der kun bruger de nederste 7 bits. I en ASCII-fil er hvert alfabetisk, numerisk eller specialtegn repræsenteret med et 7-bit binært tal. Hvert tegn på tastaturet har en tilsvarende ASCII-værdi.
Billed- og lyd- og videokodning
Billed- og lyd- og videokodning udføres for at spare lagerplads. En mediefil såsom billede, lyd og video er kodet for at gemme dem i et mere effektivt og komprimeret format.
Disse kodede filer indeholder det samme indhold med sædvanligvis lignende kvalitet, men i komprimeret størrelse, så de kan gemmes på mindre plads, nemt kan overføres via mail eller kan downloades på systemet.
Vi kan forstå det som en . WAV-lydfil konverteres til .MP3-fil for at reducere størrelsen med 1/10thtil sin oprindelige størrelse.