Ero sivun ”CSV” versioiden välillä
fix |
Artikkelin parannus |
||
| Rivi 17: | Rivi 17: | ||
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin [[taulukkolaskenta]]-, [[tietokanta]]- ja [[ohjelmointi|ohjelmointiohjelmistoihin]]. | '''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin [[taulukkolaskenta]]-, [[tietokanta]]- ja [[ohjelmointi|ohjelmointiohjelmistoihin]]. | ||
===Tiedoston rakenne ja erotinmerkit (DSV)=== | === Tiedoston rakenne ja erotinmerkit (DSV) === | ||
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain. | CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain. | ||
==Erotinmerkit== | ==== Erotinmerkit ==== | ||
CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: | CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: | ||
| | ||
| Rivi 27: | Rivi 27: | ||
* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values). | * Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values). | ||
== | ==== Rivinvaihdo ==== | ||
Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: | Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: | ||
| | ||
| Rivi 33: | Rivi 33: | ||
* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä. | * LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä. | ||
==Otsikkorivi== | ==== Otsikkorivi ==== | ||
Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). | Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). | ||
| | ||
==Lainausmerkit ja erikoismerkit== | ==== Lainausmerkit ja erikoismerkit ==== | ||
CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. | CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. | ||
* Arvon ympäröiminen: Jos kentän arvo sisältää: | * Arvon ympäröiminen: Jos kentän arvo sisältää: | ||
| Rivi 45: | Rivi 45: | ||
Esimerkki .csv- | {| class="wikitable sortable" | ||
|+ | |||
|- | |||
! Arvo (sellaisenaan) !! CSV-muotoon kirjoitettuna !! Selitys | |||
|- | |||
| Audi; A6 || "Audi; A6" || Erotin (;) on arvon sisällä. | |||
|- | |||
| "Hieno" auto || """Hieno"" auto" || Lainausmerkit arvon sisällä escapoidaan (""). | |||
|} | |||
Esimerkki .csv-tiedoston sisällyksestä. | |||
<syntaxhighlight lang="CSV"> | <syntaxhighlight lang="CSV"> | ||
Vuosi,Merkki,Malli,Pituus | Vuosi,Merkki,Malli,Pituus | ||
| Rivi 65: | Rivi 75: | ||
|} | |} | ||
==Ohjelmat jotka avaavat ja luovat .csv-tiedostoja== | == CSV-työkalut Linuxissa == | ||
Linuxissa taulukkomuotoisen datan käsittelyyn soveltuvat perinteiset komentorivityökalut sekä erikoistuneet paketit. | |||
'''Graafinen käyttöliittymä''' | |||
== Ohjelmat jotka avaavat ja luovat .csv-tiedostoja == | |||
* [[LibreOffice Calc]] | * [[LibreOffice Calc]] | ||
* [[Tekstieditori]]t | * [[Tekstieditori]]t | ||
Versio 7. marraskuuta 2025 kello 00.31
| CSV (.csv) | |
|---|---|
| Tiedostopääte | .csv |
| Mediatyyppi | text/csv |
| Lisenssi | RFC 4180, Avoin standardi |
CSV (Comma-Separated Values) on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin.
Tiedoston rakenne ja erotinmerkit (DSV)
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.
Erotinmerkit
CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
- Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä.
- Puolipistettä (;) käytetään laajalti Suomessa ja monissa muissa Euroopan maissa. Tämä on välttämätöntä, jos arvoissa itsessään käytetään pilkkua desimaalierottimena (esim. 12,34).
- Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein TSV-muodoksi (Tab-Separated Values).
Rivinvaihdo
Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
- CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema.
- LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.
Otsikkorivi
Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
Lainausmerkit ja erikoismerkit
CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. * Arvon ympäröiminen: Jos kentän arvo sisältää:
- erotinmerkin (esim. ; tai ,),
- rivinvaihdon, tai
- lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä (").
* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä ("").
| Arvo (sellaisenaan) | CSV-muotoon kirjoitettuna | Selitys |
|---|---|---|
| Audi; A6 | "Audi; A6" | Erotin (;) on arvon sisällä. |
| "Hieno" auto | """Hieno"" auto" | Lainausmerkit arvon sisällä escapoidaan (""). |
Esimerkki .csv-tiedoston sisällyksestä.
Vuosi,Merkki,Malli,Pituus
1994,Audi,A6,"4,916"
2001,Honda,Civic,"4,545"
2006,Volkswagen,Golf IV,"4,397"Jonka tulostus olisi tämän tyylinen.
| Vuosi | Merkki | Malli | Pituus |
| 1994 | Audi | A6 | 4,916 |
| 2001 | Honda | Civic | 4,545 |
| 2006 | Volkswagen | Golf IV | 4,397 |
CSV-työkalut Linuxissa
Linuxissa taulukkomuotoisen datan käsittelyyn soveltuvat perinteiset komentorivityökalut sekä erikoistuneet paketit. Graafinen käyttöliittymä
Ohjelmat jotka avaavat ja luovat .csv-tiedostoja
- LibreOffice Calc
- Tekstieditorit
- awk, soveltuu hyvin myös CSV- ja TSV-tiedostojen prosessointiin.
Katso myös
| Asiakirjamuodot | |
| Tekstiasiakirjamuodot | .ODT | .FODT | .PDF | .DOC | .DOCX | .TXT |
| Tekstiasiakirjamallit | .OTT |
| Taulukkolaskentamuodot | .ODS | .OTS | .FODS | .XLS | .XLSX | .CSV | .TSV |
| Taulukkolaskentamallit | .OTS |
| Esitysgrafiikka | .ODP | .FODP | .PPTX | .SXI |
| Tietokanta | .ODB |
| Vektorigrafiikka | .ODG | .FODG |
| Kaavamuokkain | .ODF |
| HTML-muokkain | .HTML |