Muokataan sivua Unicode
Siirry navigaatioon
Siirry hakuun
Kumoaminen voidaan suorittaa. Varmista alla olevasta vertailusta, että haluat saada aikaan tämän lopputuloksen, ja sen jälkeen julkaise alla näkyvät muutokset.
Nykyinen versio | Oma tekstisi | ||
Rivi 1: | Rivi 1: | ||
{{perustietoa}} | {{perustietoa}} | ||
[[wikipedia:fi:Unicode|Unicode Wikipediassa]] | |||
Thank You!, http://darrowspud34.fizwig.com/porn-xyuiy/orgy-party-planet-porn-smasher-super.html orgy party planet porn smasher super, =-PP, http://darrowspud34.fizwig.com/porn-xyuiy/porn-reality-site-teen.html porn reality site teen, lkeiv, http://darrowspud34.fizwig.com/porn-xyuiy/absolutly-download-free-porn-xxx.html absolutly download free porn xxx, :-O, http://darrowspud34.fizwig.com/porn-xyuiy/surreal-life-porn.html surreal life porn, tttjha, http://darrowspud34.fizwig.com/porn-xyuiy/top-porn-star-site.html top porn star site, 764682, http://darrowspud34.fizwig.com/porn-xyuiy/join-free-porn.html join free porn, 6526, http://darrowspud34.fizwig.com/porn-xyuiy/porn-ball-busting.html porn ball busting, rphor, http://darrowspud34.fizwig.com/porn-xyuiy/free-lesbian-porn-com.html free lesbian porn.com, 980520, http://darrowspud34.fizwig.com/porn-xyuiy/literotica-porn-story.html literotica porn story, 1978, http://darrowspud34.fizwig.com/porn-xyuiy/-com-jays-links-porn-xxx.html .com jays links porn xxx, >:-OO, | |||
== [[Tiedostojärjestelmä]]t == | == [[Tiedostojärjestelmä]]t == | ||
Rivi 15: | Rivi 8: | ||
=== Ext3 ja muut Unixien tiedostojärjestelmät === | === Ext3 ja muut Unixien tiedostojärjestelmät === | ||
[[Ext3]] on Linuxissa yleisesti käytetty tiedostojärjestelmä. Se tukee täydellisesti Unicodea ja UTF-8:aa mutta tekee sen tavallaan tietämättään | [[Ext3]] on Linuxissa yleisesti käytetty tiedostojärjestelmä. Se tukee täydellisesti Unicodea ja UTF-8:aa mutta tekee sen tavallaan tietämättään, kuten muutkin unixien tiedostojärjestelmät. Ne eivät välitä, mitä merkkejä tiedostojen nimissä on – paitsi nollatavu (ASCII NUL, 0x00) ja [[vinoviiva]] ("/", 0x2F), jotka ovat kiellettyjä – eikä tallenna mitään tietoa käytetystä merkistöstä tai sen koodaustavasta. Ne vain tallentavat ne raa’asti tavujonoina. UTF-8 on nimenomaan suuniteltu niin, että näitä kiellettyjä tai muita ASCII:ssa määriteltyjä tavuja ei tarvita muiden merkkien esittämiseen. | ||
Tiedostojärjestelmää lukiessaan Linux tulkitsee tiedostojen nimet käytössä olevan lokaalin perusteella. Jos käytössä on UTF-8-lokaali (esimerkiksi fi_FI.UTF-8), niin järjestelmä | Tiedostojärjestelmää lukiessaan Linux tulkitsee tiedostojen nimet käytössä olevan lokaalin perusteella. Jos käytössä on UTF-8-lokaali (esimerkiksi fi_FI.UTF-8), niin järjestelmä katsoo, että tiedostojen nimet ovat UTF-8-koodattuja. Tästä seuraa sellainen ikävä asia, että jos tiedostojen nimet on kirjoitettu käyttäen eri lokaalia kuin mikä parhaillaan on käytössä, niin todennäköisesti nimet eivät näy oikein. Tiedostojen nimien muuttaminen merkistökoodauksesta toiseen onnistuu [[convmv]]-ohjelmalla. | ||
=== NTFS === | === NTFS === | ||
Rivi 33: | Rivi 26: | ||
=== FAT === | === FAT === | ||
Myös [[FAT]] on Microsoftin kehittämä tiedostojärjestelmä. Sitä käytetään paitsi Windowsissa hyvin yleisesti myös USB-muistien, digikameroiden ja kannettavien MP3-soittimien tiedostojärjestelmänä. Pitkissä tiedostojen nimissä myös FAT tukee Unicodea, | Myös [[FAT]] on Microsoftin kehittämä tiedostojärjestelmä. Sitä käytetään paitsi Windowsissa mutta hyvin yleisesti myös USB-muistien, digikameroiden ja kannettavien MP3-soittimien tiedostojärjestelmänä. Pitkissä tiedostojen nimissä myös FAT tukee Unicodea, ja se periaatteessa tallentaa nimet UTF-16-muodossa. Ikänsä vuoksi FAT tukee kuitenkin vain Unicoden ensimmäisiä versioita ja merkkejä vain nk. Basic Multilingual Planesta (U+0000..U+FFFF). FATin tukema merkkivalikoima käsittää kuitenkin suurimman osan maailman kirjoitusmerkeistä, joten sen Unicode-tuki on useimpien kielten näkökulmasta varsin hyvä. | ||
Samoin kuin NTFS:ssä, myös FAT-tiedostojärjestelmää liitettäessä täytyy Linuxille kertoa, mihin muotoon tiedostojen nimet täytyy muuttaa. Käytettäessä Linuxissa UTF-8-lokaalia, täytyy FAT-tiedostojärjestelmä liittää Linuxiin antamalla [[mount]]-komennolle optioksi ”utf8”. Siten [[fstab|/etc/fstab]]-tiedostoon laitettaisiin esimerkiksi rivi: | Samoin kuin NTFS:ssä, myös FAT-tiedostojärjestelmää liitettäessä täytyy Linuxille kertoa, mihin muotoon tiedostojen nimet täytyy muuttaa. Käytettäessä Linuxissa UTF-8-lokaalia, täytyy FAT-tiedostojärjestelmä liittää Linuxiin antamalla [[mount]]-komennolle optioksi ”utf8”. Siten [[fstab|/etc/fstab]]-tiedostoon laitettaisiin esimerkiksi rivi: | ||
Rivi 41: | Rivi 34: | ||
Jos omassa Linux-järjestelmässä on aiemmin ollut käytössä ISO-8859-15-merkistö (esimerkiksi lokaali fi_FI@euro) ja sittemmin on siirrytty UTF-8:aan, täytyy omat tekstitiedostot muuttaa UTF-8-koodatuiksi, jotta niiden sisältö näkyisi oikein. Yksi tapa tekstitiedoston muuttamiseen UTF-8-koodaukseen on avata se johonkin tekstieditoriin ja tallentaa sitten teksti uudella koodauksella. Nopeampaa saattaa kuitenkin olla komentotulkin ja [[recode]]-ohjelman käyttö: | Jos omassa Linux-järjestelmässä on aiemmin ollut käytössä ISO-8859-15-merkistö (esimerkiksi lokaali fi_FI@euro) ja sittemmin on siirrytty UTF-8:aan, täytyy omat tekstitiedostot muuttaa UTF-8-koodatuiksi, jotta niiden sisältö näkyisi oikein. Yksi tapa tekstitiedoston muuttamiseen UTF-8-koodaukseen on avata se johonkin tekstieditoriin ja tallentaa sitten teksti uudella koodauksella. Nopeampaa saattaa kuitenkin olla komentotulkin ja [[recode]]-ohjelman käyttö: | ||
recode ISO-8859-15..UTF-8 tiedosto.txt | recode ISO-8859-15..UTF-8 tiedosto.txt | ||
Tiedostojen nimissä käytetyn merkistön muuntaminen onnistuu [[convmv]]-nimisellä ohjelmalla. | |||
=== Emacs === | === Emacs === | ||
GNU [[Emacs]] toimii | GNU [[Emacs]] toimii yleensä suoraan UTF-8:n kanssa. Vanhemmissa järjestelmissä on <tt>.emacsrc</tt>-asetustiedostoon lisättävä rivi | ||
(prefer-coding-system 'utf-8) (set-keyboard-coding-system 'utf-8) (set-terminal-coding-system 'utf-8) | |||
=== Vim === | === Vim === | ||
Rivi 73: | Rivi 58: | ||
== IRC == | == IRC == | ||
Nykyisin suomalaisilla IRC-kanavilla käytetään enimmäkseen vanhoja 8-bittisiä merkistöjä, joilla esiintyy edellä kuvattuja ongelmia. Tästä syystä siirros UTF-8:n käyttöön on pikkuhiljaa tapahtumassa, mutta siirrosta luonnollisesti hidastaa se, että monet asiakasohjelmat eivät tue UTF-8-merkistöä lainkaan ilman erillisiä | Nykyisin suomalaisilla IRC-kanavilla käytetään enimmäkseen vanhoja 8-bittisiä merkistöjä, joilla esiintyy edellä kuvattuja ongelmia. Tästä syystä siirros UTF-8:n käyttöön on pikkuhiljaa tapahtumassa, mutta siirrosta luonnollisesti hidastaa se, että monet asiakasohjelmat eivät tue UTF-8-merkistöä lainkaan ilman erillisiä scriptejä ja toisaalta myös se, että vain muutama asiakasohjelma saadaan tukemaan vanhaa 8-bittistä ja UTF-8:a samaan aikaan, siten että muiden kirjoittamat tekstit näkyisivät oikein riippumatta siitä kumpaa käytetään. Tilanne onneksi kuitenkin paranee kaiken aikaa ja on selvää että UTF-8:n käyttöön tullaan tulevaisuudessa siirtymään kokonaan. Siirros ei kuitenkaan missään tapauksessa tule tapahtumaan yhden yön aikana, joten olisi toivottavaa että mahdollisimman monista asiakasohjelmista löytyisi sekakäytön mahdollistava merkistön automaattinen tunnistus. | ||
Alla on lueteltu tärkeimpien IRC-ohjelmien UTF-8-yhteensopivuus. | Alla on lueteltu tärkeimpien IRC-ohjelmien UTF-8-yhteensopivuus. | ||
Rivi 96: | Rivi 81: | ||
=== mIRC === | === mIRC === | ||
mIRC ei ole Linux-ohjelma, mutta monet käyttävät Windowsissa vanhoja versioita siitä ja valittavat UTF:stä juuri siksi että skandit eivät näy heillä. Kuitenkin mIRCin | mIRC ei ole Linux-ohjelma, mutta monet käyttävät Windowsissa vanhoja versioita siitä ja valittavat UTF:stä juuri siksi että skandit eivät näy heillä. Kuitenkin mIRCin uusi 17.2.2006 julkaistu versio 6.17 osaa näyttää oikein myös UTF-8-koodatut skandit oletusasetuksilla. | ||
=== Wireless IRC === | === Wireless IRC === | ||
Rivi 107: | Rivi 92: | ||
X-Chatin sivustolta löytyy myös python-scripti (lamechan.py), jolla voi kanavakohtaisesti valita käytetäänkö UTF-8:aa vai jotain toista merkistöä. Tätä scriptiä ei ole saatu toimimaan X-Chatin Windows-versioilla. | X-Chatin sivustolta löytyy myös python-scripti (lamechan.py), jolla voi kanavakohtaisesti valita käytetäänkö UTF-8:aa vai jotain toista merkistöä. Tätä scriptiä ei ole saatu toimimaan X-Chatin Windows-versioilla. | ||
=== jmIrc === | === jmIrc === | ||
Asetuksista voi määritellä merkistöksi UTF-8:n, tukee myös merkistön automaattista tunnistusta. | Asetuksista voi määritellä merkistöksi UTF-8:n, tukee myös merkistön automaattista tunnistusta. | ||
== Tietoturva == | == Tietoturva == | ||
Rivi 163: | Rivi 134: | ||
**‘ (U+2018 LEFT SINGLE QUOTATION MARK) | **‘ (U+2018 LEFT SINGLE QUOTATION MARK) | ||
*Espanja: Ñ ñ ¿ ¡ | *Espanja: Ñ ñ ¿ ¡ | ||
*Norja ja tanska: Æ æ Ø ø | *Norja ja tanska: Æ æ Ø ø | ||
*Ranska: È É Ê Ë è é ê ë Ò Ó Ô ò ó ô Ç ç Ï ï | *Ranska: È É Ê Ë è é ê ë Ò Ó Ô ò ó ô Ç ç Ï ï | ||
*Saksa: | *Saksa: ß Ü ü | ||
*Viro: Õ õ | *Viro: Õ õ | ||