logo

Læser CSV-filer i Python

EN CSV (kommaseparerede værdier) fil er en form for almindeligt tekstdokument, der bruger et bestemt format til at organisere tabeloplysninger. CSV-filformat er et afgrænset tekstdokument, der bruger et komma til at skelne mellem værdierne. Hver række i dokumentet er en datalog. Hver log er sammensat af et eller flere felter, divideret med kommaer. Det er det mest populære filformat til import og eksport af regneark og databaser.

Læser en CSV-fil

Der er forskellige måder at læse en CSV-fil i Python der bruger enten CSV-modulet eller pandas-biblioteket.



  • csv modul: CSV-modulet er et af modulerne i Python, der giver klasser til læsning og skrivning af tabeloplysninger i CSV-filformat.
  • pandas bibliotek: Pandas-biblioteket er et af de open source Python-biblioteker, der leverer højtydende, praktiske datastrukturer og dataanalyseværktøjer og -teknikker til Python-programmering.

Læsning af et CSV-filformat i Python:
Overvej nedenstående CSV-fil med navnet 'Giants.CSV' :

Brug af csv.reader()

Først åbnes CSV-filen ved hjælp af åben() metode i 'r'-tilstand (specificerer læsetilstand under åbning af en fil), som returnerer filobjektet, så læses det ved at bruge reader()-metoden i CSV-modulet, der returnerer læserobjektet, der itererer gennem linjerne i det angivne CSV-dokument.
Bemærk: Det 'med' nøgleordet bruges sammen med open()-metoden, da det forenkler håndtering af undtagelser og automatisk lukker CSV-filen.



tilfældig talgenerator i c

Eksempel: Denne kode læser og udskriver indholdet af en CSV-fil med navnet 'Giants.csv' brugercsv>modul i Python. Den åbner filen i læsetilstand, læser linjerne og udskriver dem én efter én ved hjælp af enfor>sløjfe. Det csv.reader()> funktionen bruges til at læse CSV-filen, og dataene fra hver række udskrives til konsollen.

Python3






ubuntu build vigtigt

import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>)as>file>:> >csvFile>=> csv.reader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

>

>

Produktion:

['Organization', 'CEO', 'Established'] ['Alphabet', 'Sundar Pichai', '02-Oct-15'] ['Microsoft', 'Satya Nadella', '04-Apr-75'] ['Amazon', 'Jeff Bezos', '05-Jul-94']>

Brug af csv.DictReader() klasse

Det ligner den tidligere metode, CSV-filen åbnes først ved hjælp af open() metode derefter læses den ved at bruge DictReader-klassen af ​​csv-modulet, der fungerer som en almindelig læser, men kortlægger informationen i CSV-filen til en ordbog. Den allerførste linje i filen består af ordbogsnøgler.

Eksempel: Denne kode læser og udskriver indholdet af en CSV-fil med navnet 'Giants.csv' ved hjælp afcsv>modul medDictReader>. Den åbner filen i læsetilstand, læser linjerne og udskriver dem én efter én.csv.DictReader()>læser CSV-filen og behandler den første række som overskrifter, og opretter en ordbog for hver række, hvor overskriftsværdierne er nøglerne. Koden udskriver hver række som en ordbog, hvilket gør det nemmere at arbejde med strukturerede CSV-data.

Python3


jpa vs dvale



import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>) as>file>:> >csvFile>=> csv.DictReader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

>

>

Produktion:

OrderedDict([('Organisation', 'Alphabet'), ('CEO', 'Sundar Pichai'), ('Etableret', '02-Oct-15′)])
OrderedDict([('Organisation', 'Microsoft'), ('CEO', 'Satya Nadella'), ('Etableret', '04-Apr-75′)])
OrderedDict([('Organisation', 'Amazon'), ('CEO', 'Jeff Bezos'), ('Etableret', '05-Jul-94′)])

Bruger pandas.read_csv() metoden

Det er meget nemt og enkelt at læse en CSV-fil ved hjælp af pandas biblioteksfunktioner. Her read_csv() metode af pandas-biblioteket bruges til at læse data fra CSV-filer.

Eksempel: Denne kode brugerpandas>bibliotek for at læse og vise indholdet af en CSV-fil med navnet 'Giants.csv.' Den læser CSV-filen og gemmer den som en DataFrame ved hjælp af pandas.read_csv()> fungere. Endelig udskriver den hele DataFrame, som giver en struktureret og tabelformet repræsentation af CSV-dataene. Dette er en almindelig tilgang, når man arbejder med tabeldata i Python, sompandas>tilbyder kraftfulde værktøjer til datamanipulation og -analyse.

powershell vs bash

Python3




import> pandas> csvFile>=> pandas.read_csv(>'Giants.csv'>)> print>(csvFile)>

>

ulv eller ræv

>

Produktion:

Organization CEO Established 0 Alphabet Sundar Pichai 02-Oct-15 1 Microsoft Satya Nadella 04-Apr-75 2 Amazon Jeff Bezos 05-Jul-94>

Bemærk: For at vide mere om pandas.csv_read() Klik her .