Ero sivun ”Awk” versioiden välillä
Siirry navigaatioon
Siirry hakuun
ei muokkausyhteenvetoa
(→Johdanto: typo) |
Ei muokkausyhteenvetoa |
||
Rivi 1: | Rivi 1: | ||
{{DISPLAYTITLE:{{lcfirst:{{PAGENAME}}}}}} | |||
'''awk'''-työkalun avulla voi helposti muuntaa tekstitiedoston rakennetta. awk ja sen laajennettu versio gawk kuuluvat Unix/Linux-käyttäjän perustyökaluihin silloin, kun kyseessä on: | '''awk'''-työkalun avulla voi helposti muuntaa tekstitiedoston rakennetta. awk ja sen laajennettu versio gawk kuuluvat Unix/Linux-käyttäjän perustyökaluihin silloin, kun kyseessä on: | ||
* puhtaan tekstitiedoston muuntaminen riveittäin toiseen muotoon | * puhtaan tekstitiedoston muuntaminen riveittäin toiseen muotoon | ||
Rivi 5: | Rivi 6: | ||
== Johdanto == | == Johdanto == | ||
awk on skriptikieli ja samanniminen tulkki tälle skriptikielelle. Se on tarkoitettu tiedon hakemiseen selkeän rakenteen omaavista tekstitiedostoista ja tämän tiedon esittämiseen siistissä muodossa. Sen kehittäminen aloitettiin jo 1977 AT&T:n tutkimuslaboratoriossa (''Bell Labs''). Samassa paikassa aloitettiin myös [[Unix]]in kehittäminen. | |||
awk:n tilalla on monesti käytetty [[Perl]]iä, joka on kehitetty mm. ratkaisemaan samankaltaisia ongelmia kuin awk. awk:n opettelu ei silti ole turhaa, sillä: | |||
* | *awk on yksinkertaisempi (tärkeää jos mietit, kumman opettelisit ensin) | ||
* | *awk:n syntaksi on säännöllisempi | ||
* | *awk löytyy lähestulkoon järjestelmästä kuin järjestelmästä, Perl-tulkki ei | ||
*[http://pubs.opengroup.org/onlinepubs/009695399/utilities/awk.html IEEE:n Unix-standardi] määrittelee | *[http://pubs.opengroup.org/onlinepubs/009695399/utilities/awk.html IEEE:n Unix-standardi] määrittelee awk:n melko kattavasti, kun taas Perlin parametrit ja syntaksi ovat eläneet päätoteutuksen mukana | ||
Tärkeää on siis ymmärtää, että | Tärkeää on siis ymmärtää, että awk ei ole ainoa työkalu tietyntyyppisten ongelmien ratkaisemiseen. Eikä se ole myöskään monipuolisin. Se saattaa kuitenkin monissa tilanteissa olla yksinkertaisempi käyttää kuin Perl-skriptit. | ||
== Syntaksi == | == Syntaksi == | ||
awk:n syntaksi on lähellä [[C]]:n syntaksia. Seuraavat asiat on kuitenkin syytä huomioida: | |||
* muuttujilla ei ole tyyppiä ja muunnokset tehdään automaattisesti. | * muuttujilla ei ole tyyppiä ja muunnokset tehdään automaattisesti. | ||
* taulukkoindekseinä voi käyttää periaatteessa mitä tahansa, tästä on paljon hyötyä niissä tehtävissä, joihin awk on ensisijaisesti tarkoitettu | * taulukkoindekseinä voi käyttää periaatteessa mitä tahansa, tästä on paljon hyötyä niissä tehtävissä, joihin awk on ensisijaisesti tarkoitettu | ||
Rivi 28: | Rivi 29: | ||
tulostaisi kaikki rivit, joilla esiintyy sana "linux". | tulostaisi kaikki rivit, joilla esiintyy sana "linux". | ||
== | == awk-ohjelman käyttö == | ||
awk:ta käytetään komentoriviltä antamalla sille syötteenä skripti ja tiedosto, jota tällä skriptillä käsitellään. Skripti voidaan antaa joko komentoriviparametrina tai pidempien skriptien kanssa antamalla parametrina tiedosto, josta skripti ladataan. Eli joko | |||
awk -f skripti.awk tiedosto.txt | awk -f skripti.awk tiedosto.txt | ||
tai | tai | ||
Rivi 35: | Rivi 36: | ||
== Kenttien käsittely == | == Kenttien käsittely == | ||
awk:n vahvin puoli on sen kyky käsitellä tiedoston sisältöä kenttinä. Esimerkiksi voimme helposti tulostaa tekstitaulukosta jokaisen rivin kolmannet solut. | |||
Tutkitaan esimerkiksi tiedostoa [[Passwd-tiedosto|/etc/passwd]] josta löytyy tietokoneen käyttäjien käyttäjätunnukset. Tämä tiedosto on muotoa | Tutkitaan esimerkiksi tiedostoa [[Passwd-tiedosto|/etc/passwd]] josta löytyy tietokoneen käyttäjien käyttäjätunnukset. Tämä tiedosto on muotoa | ||
Rivi 43: | Rivi 44: | ||
bin:x:2:2:bin:/bin:/bin/sh | bin:x:2:2:bin:/bin:/bin/sh | ||
</pre> | </pre> | ||
Leikitään, että haluamme tulostaa tiedostosta käyttäjien nimet. Käyttäjätunnus on jokaisella rivillä ensimmäinen kenttä, jos kentät erotellaan :-merkillä. Tehdään tällainen | Leikitään, että haluamme tulostaa tiedostosta käyttäjien nimet. Käyttäjätunnus on jokaisella rivillä ensimmäinen kenttä, jos kentät erotellaan :-merkillä. Tehdään tällainen awk-skripti. | ||
Määritellään ensin erotinmerkiksi kaksoispiste asettamalla se muuttujan FS komennolla | Määritellään ensin erotinmerkiksi kaksoispiste asettamalla se muuttujan FS komennolla | ||
Rivi 56: | Rivi 57: | ||
== BEGIN- ja END-lohkot == | == BEGIN- ja END-lohkot == | ||
awk käsittelee syötteensä [[grep]]in ja [[sed]]in tavoin rivi kerrallaan. BEGIN- ja END-lohkoissa suoritetaan asiat, jotka on kuitenkin tarkoitus tehdä suoritusaikana vain kerran ennen ja jälkeen varsinaisen syötteen käsittelyä. | |||
awk 'BEGIN {aluksi} lauseke1 {jokaiselle lauseke1:lle} \ | awk 'BEGIN {aluksi} lauseke1 {jokaiselle lauseke1:lle} \ | ||
lauseke2 ... END {lopuksi}' tiedosto | lauseke2 ... END {lopuksi}' tiedosto | ||
Rivi 108: | Rivi 109: | ||
== Muuttujat == | == Muuttujat == | ||
Shell-muuttujia voi välittää | Shell-muuttujia voi välittää awk:lle luettelemalla ne parametreissa. Luvun 12 tulostus: | ||
a=12 | a=12 | ||
echo '\n' | awk -v a=$a 'END {print a}' | echo '\n' | awk -v a=$a 'END {print a}' | ||
Rivi 191: | Rivi 192: | ||
|- | |- | ||
|system(exp) | |system(exp) | ||
|Komento | |Komento awk:n ulkopuolelle. | ||
|} | |} | ||
Rivi 242: | Rivi 243: | ||
== Muuta == | == Muuta == | ||
awk:n on sanottu joskus olevan "write only language", ja sitä se onkin jos yrittää saada todella monimutkaisesta awk-ohjelmasta selkoa. Omat ohjelmat kannattaa tehdä siten, että kirjoittaa ja testaa ohjelman rivi kerrallaan. awk on parhaimmillaan lyhyissä muutaman rivin ohjelmissa. | |||
awk-ohjelmissa ei ole yleensä mitään rajoitusta käsiteltävien tiedostojen koolle, koska niitä käsitellään vain riveinä ja syöttö/tulostus putkina/virtoina. Awk-ohjelmat pystyvät käsittelemään varsin helposti hyvinkin suuria syöttö/tulostustiedostoja (satoja megatavuja). | |||
==Aiheesta muualla== | ==Aiheesta muualla== | ||
*[http://www.unix.se/Awk Awk-artikkeli] unix.se-wikissä (ruotsiksi), josta tämä artikkeli on osittain käännetty. [[Keskustelu:Awk|Lisätietoja]]. | *[http://www.unix.se/Awk Awk-artikkeli] unix.se-wikissä (ruotsiksi), josta tämä artikkeli on osittain käännetty. [[Keskustelu:Awk|Lisätietoja]]. | ||
*[http://www.cs.uu.nl/~piet/docs/nawk/nawk_toc.html | *[http://www.cs.uu.nl/~piet/docs/nawk/nawk_toc.html awk-opas] | ||
*[http://www.cs.utah.edu/dept/old/texinfo/gawk/gawk_toc.html Gawk-opas] | *[http://www.cs.utah.edu/dept/old/texinfo/gawk/gawk_toc.html Gawk-opas] | ||
*[http://www.pement.org/awk/awk1line.txt Havainnollistavia yksirivisiä] | *[http://www.pement.org/awk/awk1line.txt Havainnollistavia yksirivisiä] | ||
[[Luokka:Komentorivin perustyökalut]] | [[Luokka:Komentorivin perustyökalut]] |