Ero sivun ”CSV” versioiden välillä

Linux.fista
Siirry navigaatioon Siirry hakuun
fix
Artikkelin parannus
Rivi 17: Rivi 17:
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin [[taulukkolaskenta]]-, [[tietokanta]]- ja [[ohjelmointi|ohjelmointiohjelmistoihin]].
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin [[taulukkolaskenta]]-, [[tietokanta]]- ja [[ohjelmointi|ohjelmointiohjelmistoihin]].


===Tiedoston rakenne ja erotinmerkit (DSV)===
=== Tiedoston rakenne ja erotinmerkit (DSV) ===
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.


==Erotinmerkit==
==== Erotinmerkit ====
​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
Rivi 27: Rivi 27:
* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values).
* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values).


==Rivinvaihdot==
==== Rivinvaihdo ====
​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
Rivi 33: Rivi 33:
* ​LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.
* ​LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.


==Otsikkorivi==
==== Otsikkorivi ====
​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
==Lainausmerkit ja erikoismerkit==
==== Lainausmerkit ja erikoismerkit ====
​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn.
​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn.
​* Arvon ympäröiminen: Jos kentän arvo sisältää:
​* Arvon ympäröiminen: Jos kentän arvo sisältää:
Rivi 45: Rivi 45:




Esimerkki .csv-tiedostosta:
{| class="wikitable sortable"
|+
|-
! Arvo (sellaisenaan) !! CSV-muotoon kirjoitettuna !! Selitys
|-
| Audi; A6 || "Audi; A6" || Erotin (;) on arvon sisällä.
|-
| "Hieno" auto || """Hieno"" auto" || Lainausmerkit arvon sisällä escapoidaan ("").
|}
 
Esimerkki .csv-tiedoston sisällyksestä.
<syntaxhighlight lang="CSV">  
<syntaxhighlight lang="CSV">  
Vuosi,Merkki,Malli,Pituus
Vuosi,Merkki,Malli,Pituus
Rivi 65: Rivi 75:
|}
|}


==Ohjelmat jotka avaavat ja luovat .csv-tiedostoja==
== CSV-työkalut Linuxissa ==
Linuxissa taulukkomuotoisen datan käsittelyyn soveltuvat perinteiset komentorivityökalut sekä erikoistuneet paketit.
'''Graafinen käyttöliittymä'''
 
 
 
== Ohjelmat jotka avaavat ja luovat .csv-tiedostoja ==
* [[LibreOffice Calc]]
* [[LibreOffice Calc]]
* [[Tekstieditori]]t
* [[Tekstieditori]]t

Versio 7. marraskuuta 2025 kello 00.31

CSV (.csv)

Tiedostopääte .csv
Mediatyyppi text/csv
Lisenssi RFC 4180, Avoin standardi

CSV (Comma-Separated Values) on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin.

Tiedoston rakenne ja erotinmerkit (DSV)

CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.

Erotinmerkit

​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: ​

  • Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä.
  • Puolipistettä (;) käytetään laajalti Suomessa ja monissa muissa Euroopan maissa. Tämä on välttämätöntä, jos arvoissa itsessään käytetään pilkkua desimaalierottimena (esim. 12,34).
  • Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein TSV-muodoksi (Tab-Separated Values).

Rivinvaihdo

​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: ​

  • CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema.
  • ​LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.

Otsikkorivi

​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). ​

Lainausmerkit ja erikoismerkit

​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. ​* Arvon ympäröiminen: Jos kentän arvo sisältää:

  • erotinmerkin (esim. ; tai ,),
  • rivinvaihdon, tai
  • lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä (").

​* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä ("").


Arvo (sellaisenaan) CSV-muotoon kirjoitettuna Selitys
Audi; A6 "Audi; A6" Erotin (;) on arvon sisällä.
"Hieno" auto """Hieno"" auto" Lainausmerkit arvon sisällä escapoidaan ("").

Esimerkki .csv-tiedoston sisällyksestä.

 
Vuosi,Merkki,Malli,Pituus
1994,Audi,A6,"4,916"
2001,Honda,Civic,"4,545"
2006,Volkswagen,Golf IV,"4,397"

Jonka tulostus olisi tämän tyylinen.

Vuosi Merkki Malli Pituus
1994 Audi A6 4,916
2001 Honda Civic 4,545
2006 Volkswagen Golf IV 4,397

CSV-työkalut Linuxissa

Linuxissa taulukkomuotoisen datan käsittelyyn soveltuvat perinteiset komentorivityökalut sekä erikoistuneet paketit. Graafinen käyttöliittymä


Ohjelmat jotka avaavat ja luovat .csv-tiedostoja

Katso myös

v  k  m
Asiakirjamuodot
Tekstiasiakirjamuodot .ODT | .FODT | .PDF | .DOC | .DOCX | .TXT
Tekstiasiakirjamallit .OTT
Taulukkolaskentamuodot .ODS | .OTS | .FODS | .XLS | .XLSX | .CSV | .TSV
Taulukkolaskentamallit .OTS
Esitysgrafiikka .ODP | .FODP | .PPTX | .SXI
Tietokanta .ODB
Vektorigrafiikka .ODG | .FODG
Kaavamuokkain .ODF
HTML-muokkain .HTML