Järjestelmäkutsu
Järjestelmäkutsut muodostavat rajapinnan prosessissa suoritettavan User Mode -ohjelman ja ytimen välillä. Rajapinnan avulla ohjelma voi käyttää ytimen tarjoamia palveluita, kuten esimerkiksi lukea tiedostosta tai käynnistää uuden ohjelman.
Yleistä
Linuxissa on yli kolmesataa erilaista järjestelmäkutsua, toiset keskeisempiä, toiset vähän harvemmin käytettyjä. On tärkeää huomata, että POSIX-standardi, jota Linux noudattaa, ei erottele järjestelmäkutsuja tavallisista funktiokutsuista. POSIX määrittelee vain rajapinnan, ei sitä, mikä rajapinnan funktio on tavallinen kirjastofunktio ja mikä oikeasti järjestelmäkutsu. Järjestelmäkutsut ovat olemassa vain siksi, että ydin pystyisi takaamaan lupaamansa säännöt, kuten muistialueiden ja tiedostojen suojaukset.
Joskus onkin käynyt niin, että järjestelmäkutsu on "alennettu" kirjastofunktioksi. Esimerkiksi fork-funktio oli alun perin Linuxin järjestelmäkutsu, mutta se korvattiin yleiskäyttöisemmällä clone-kutsulla, ja fork:sta tehtiin tavallinen funktio, joka kutsuu clone:a.
Esimerkkejä järjestelmäkutsuista
Seuraavassa luettelo muutamasta usein käytetyistä kutsuista.
- tiedostojen käsittely: creat, open, read, write, lseek, close, chmod, link, unlink
- prosessien käsittely: clone, exec, wait, execve, nice, exit
- verkkorajapintaan liittyvät kutsut: socketcall (sisältäen socket, connect, bind, listen, accept)
- käyttäjien hallinta: getuid, setuid, chown, chgrp
Järjestelmäkutsut on dokumentoitu Linuxin manuaalin kappaleessa 2. Lisätietoja:
man 2 intro
Järjestelmäkutsumekanismi
Sovellusohjelman ei voida sallia kutsua ytimen koodia ihan vapaasti, vaan sen on tapahduttava määritellyn kutsurajapinnan kautta. Rajoittamalla kutsut tapahtuviksi tiettyjen osoitteiden kautta varmistutaan siitä, että ytimen koodia kutsutaan oikein. Järjestelmäkutsun käsittelijärutiinissa tehdään tyypillisesti tarkistuksia, kuten syötettyjen parametrien järkevyyden testausta. Useimmissa tapauksissa tarkistetaan myös onko kutsujalla oikeus suorittaa kutsu; esimerkiksi onko käyttäjällä oikeutta lukea tiedostoa tai tappaa prosessia.
Järjestelmäkutsussa tapahtuu siirtymä suorittimen (CPU) tilassa User Modesta Kernel Mode -tilaan. Miten tämä tapahtuu riippuu käytetyn suorittimen arkkitehtuurista, mutta tyypillinen tapa on niin sanottu "ohjelmallinen keskeytys" (software interrupt). Tämä mekanismi toimii siten, että suoritin suorittaa 'int'- tai 'trap'-käskyn, jonka seurauksena suoritin vaihtaa tilansa Supervisor Mode -tilaan ja jatkaa suoritusta määritellystä keskeytyksen käsittelijärutiinista.
Intel x86-perheen suorittimilla Linuxissa on järjestelmäkutsut perinteisesti toteutettu int $0x80 -käskyllä. Järjestelmäkutsun numero välitetään eax-rekisterissä, muut parametrit rekistereissä ebx, ecx, jne., riippuen kutsun parametrien lukumäärästä.
Sovellusohjelmat eivät kutsu järjestelmäkutsuja suoraan, vaan samannimisia funktioita standardikirjasto Libc:ssä, jotka muodostavat ohuen "kuoren" järjestelmäkutsun ympärille. Nämä funktiot suorittavat sitten kukin vastaavan järjestelmäkutsun. Syynä tähän järjestelyyn on se, että järjestelmäkutsuilla on oma kutsutapansa; parametrit siirretään rekistereissä ja itse kutsua ei suoriteta call-käskyllä, vaan muulla mekanismlla, esim. yllä mainitulla int $0x80 -käskyllä.
Tällä tavalla saadaan eristettyä varsinaisen järjestelmäkutsun monimutkaisuus Libc-kirjaston hoidettavaksi Sovellusohjelmat voivat kutsua Libc:n vastaavaa funktiota normaalilla korkean tason kielen (C) kutsulla, assembly-koodin sijasta. Lisäksi ytimen kutsutapa on riippumaton kääntäjän käyttämästä C-kielen kutsutavasta. Sovellusohjelmissa voidaan jopa vaihtaa kutsutapaa (esimerkiksi käyttämään parametrinvälitystä rekistereissä pinon sijasta) muuttamatta ytimen järjestelmäkutsurajapintaa. (Tämä tosin vaatii sekä sovellusten että kirjastojen, mukaan lukien libc, uudelleen kääntämistä uudella kääntäjällä tai kääntäjän optioita muuttaen.)
Suorittimen rekistereitä käytetään parametrien välittämiseen siksi, että suorittimen tilan vaihtuessa User Mode:sta Supervisor Mode -tilaan, vaihtuu myös käytettävä pino.
Sysenter ja Sysreturn
Intelin x86-suorittimissa on Pentium II:sta alkaen ollut vaihtoehtoinen käsky, jolla siirtymän User Modesta Kernel Mode -tilaan voi toteuttaa: sysenter. Tämä käsky keksittiin tuomaan ratkaisu int-käskyyn liittyvään ongelmaan.
int $0x80 -mekanismi on hidas, eli suoritus vaatii monta kellojaksoa, ja se on muuttunut nykyaikaisissa suorittimissa suhteellisesti mitattuna yhä hitaammaksi. Uusi sysenter-käsky on nopea, mutta vanhemmat suorittimet eivät tue sitä, jolloin on käytettävä perinteistä int $0x80-käskyä. (sysenter-käskyn kanssa samanaikaisesti esitellyllä sysreturn-käskyllä palataan järjestelmäkutsusta.)
Tavoitteena on toisaalta pitää Libc riippumattomana suorittimen versiosta ja myös puhtaana koodista, joka ajon aikana tutkii mitä käskyjä suoritin tukee ja mitä se ei tue.
Ratkaisuna tähän ongelmaan ydin tarjoaa koodin, jolla järjestelmäkutsu suoritetaan suoritinkohtaisesti optimaalisella tavalla: joko sysenter-käskyä käyttäen, int $0x80-käskyllä, tai tulevaisuudessa mahdollisesti jollain muulla mekanismilla. Tämä koodi sijaitsee prosessin osoiteavaruudessa pienellä, ennalta määritetyllä muistialueella. Libc suorittaa järjestelmäkutsun kutsumalla funktiota tällä alueella, ja funktio tekee varsinaisen järjestelmäkutsun. Libc joutuu toki edelleen tutkimaan, onko tämä muistialue olemassa jotta kirjasto toimisi myös ytimellä, joka ei tue tätä uutta mekanismia.
User Mode -järjestelmäkutsut
Nopeammallakin sysenter-käskyllä suoritettuna järjestelmäkutsu on suhteellisen paljon aikaa vievä operaatio. Kaikkia kutsuja varten ei kuitenkaan tarvitse tehdä siirtymää Kernel Mode -tilaan. Esimerkiksi gettimeofday-kutsu, joka palauttaa ytimen käsityksen kellonajasta, voidaan toteuttaa siten, että ydin sijoittaa toistuvasti tuoreen arvon tunnettuun muistipaikkaan prosessin muistiavaruudessa. gettimeofday-funktio voi käydä lukemassa arvon tästä muistipaikasta, tarvitsematta suorittaa sysenter-käskyä.