Ero sivun ”Festvox-Suopuhe” versioiden välillä

Linux.fista
Siirry navigaatioon Siirry hakuun
Ei muokkausyhteenvetoa
 
(19 välissä olevaa versiota samalta käyttäjältä ei näytetä)
Rivi 1: Rivi 1:
Suopuhe on [[Festival]]-ohjelman moduuli ja se tuottaa suomenkielistä puhetta tekstistä.
{{Ohjelma
Ohjelmaa käytetään tässä ohjeessa komentoriviltä.  
| nimi          = SuoPuhe
| logo          =
| kuva          =
| kuvateksti    =
| tekijä        = Finnish Speech Technology: A Multidisciplinary Project
| kehittäjä      =
| moottori      = [[Festival]]
| ensijulkaisu  = huhtikuuta 2003
| vakaaversio    =
| vakaapvm      =
| kehitysversio  =
| kehityspvm    =
| ohjelmoitu    =
| käyttöliittymä = [[Komentorivi]]
| tyyppi        = [[Festival]]-ohjelman äänitietokanta moduuli
| lisenssi      = [[LGPL]]
| kotisivu      = [https://www.ling.helsinki.fi/suopuhe/index.shtml www.ling.helsinki.fi/suopuhe/index.shtml]
| lähdekoodi    = [http://www.ling.helsinki.fi/suopuhe/ www.ling.helsinki.fi/suopuhe/]
}}
'''SuoPuhe''' on [[Festival]]-ohjelman suomenkielinen äänitietokanta moduuli, joka tuottaa suomenkielistä puhetta tekstistä.
Suopuheen ääni perustuu difoni [[wikipedia:fi:Kontaminaatio_(kielitiede)|konkatenaatio]]on, jossa aikaisemmin nauhoitettuja äännepareja mallinnetaan matkapuhelimissa käytetyn lineaarisen ennustamisen (LPC) avulla.
Suopuhe on toteutettu [https://www.businessfinland.fi/ TEKES]in rahoittamassa Finnish Speech Technology: A Multidisciplinary Project -hankkeen sisällä ((SuoPuhe TEKES 40285/00, 40406/01, 40238/02, HY 460325)). Projekti päättyi huhtikuussa 2003.


==Ubuntu, Kubuntu, Xubuntu ja Edubuntu==
Puhesynteesiosiossa kehitettiin Edinburghin yliopistossa kehitetyn Festival-puhesyntesialustan päälle kaksi suomenkielistä ääntä. Äänen perustuvat difonikonkatenaatioon, jossa aikaisemmin nauhoitettuja äännepareja mallinnitaan matkapuhelimissa käytetyn lineaarisen ennustamisen avulla (LPC).


1. Asennetaan tarvittavat paketit:
Miesäänen sisältävä ''hy_fi_mv_diphone''-äänimoduli Festivaliin ja tekstinlavennin on julkaistu LGPL-lisenssin alla.


sudo apt-get install festvox-suopuhe-common festvox-suopuhe-lj festvox-suopuhe-mv libestools1.2 festival festlex-poslex
Lisäksi kehitettiin erillinen [[Perl]]illä toimiva tekstinlavennusmoduli, joka korvaa tekstissä esiintyvät numerot, lyhenteet ja muut ongelmatapaukset niiden lukukelpoisina vastikkeina, jotta syntetisaattori osaisi lukea ne oikein.


2. Festival tarvitsee määritykset suomenkielistä puhetta tuottaakseen. Ladataan ne seuraavaksi päätettä käyttäen:
Emacspeakiin lisättiin tuki suomenkieliselle Festival-synteesille, joka perustuu hyvin alkeellisen [https://espeakf.sourceforge.net/ espeakf]-nimisen koodinpätkään. (espeakf:n koodista tuli myöhemmin kehittyneempi versio, jota ei siis hyödynnetty.) Tämä on GPL-lisenssin alaisuudessa. Yhteensopivuus Emacspeakin nykyisen version kanssa on kysymysmerkki. [http://www.ling.helsinki.fi/suopuhe/index.shtml]


  wget http://jiku.arkku.net/ubuntu/script/festival.scm
==Asennus==
{{Asenna|SuoPuhe|festvox-suopuhe-common, festvox-suopuhe-lj, festvox-suopuhe-mv, libestools2.5, festival ja festlex-poslex}}
 
==Suomenkieliset määritykset==
{{oikeudet}}
Festival tarvitsee määritykset suomenkielistä puhetta tuottaakseen. Ladataan ne seuraavaksi päätettä käyttäen:
 
  $ wget https://raw.githubusercontent.com/lahtis/SuoPuhe/main/festival.scm


festival.scm tiedoston sisältö näyttää tältä.
festival.scm tiedoston sisältö näyttää tältä.
<syntaxhighlight lang="scm">


  ;; Any site-wide Festival initialization can be added to this file.
  ;; Any site-wide Festival initialization can be added to this file.
Rivi 30: Rivi 59:
       (set! voice_default 'hy_fi_mv_diphone)))
       (set! voice_default 'hy_fi_mv_diphone)))
  ;;; ... siteinit.scm päättyy
  ;;; ... siteinit.scm päättyy
</syntaxhighlight>


Kopioidaan se /etc hakemistoon.
Kopioidaan se ''/etc'' hakemistoon.


  sudo cp festival.scm /etc/festival.scm
  # cp festival.scm /etc/festival.scm


Ladataan skripti, jolla Festivalia voi helposti käyttää kotihakemistosta:
Ladataan skripti, jolla Festivalia voi helposti käyttää kotihakemistosta:


  wget http://jiku.arkku.net/ubuntu/script/sano
  $ wget https://raw.githubusercontent.com/lahtis/SuoPuhe/main/sano.bash


Scriptin sisältö näyttää tältä:
Skriptin sisältö näyttää tältä:
<syntaxhighlight lang="bash">
  echo $* > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2 >/dev/null 2> /dev/null
  echo $* > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2 >/dev/null 2> /dev/null
</syntaxhighlight>


annetaan sano scriptille suoritusoikeudet komentorivillä:
annetaan sano scriptille suoritusoikeudet komentorivillä:
  chmod a+x sano
  $ chmod a+x sano.bash
 
Testataan toimivuus kotihakemistossa.
$ ./sano.bash olen puhuva pää


testataan toimivuus kotihakemistossa.
Kopioidaan se /usr/local/bin/ hakemistoon
  ./sano olen puhuva pää
  # cp sano.bash /usr/local/bin/


kopioidaan se /usr/local/bin/ hakemistoon
Kokeillaan komentorivillä, saatiinko Ubuntu puhumaan suomea:
sudo cp sano /usr/local/bin/


4. Kokeillaan komentorivillä, saatiinko Ubuntu puhumaan suomea:
$ sano.bash Hyvää päivää. Minä olen puhuva pää.


sano Hyvää päivää. Minä olen puhuva pää.
==Katso myös==
* [[Text2wave]] on [[Festival]]-projektiin sisältyvä apuohjelma, jonka avulla voit muuntaa tekstidokumentin syntetisoiduksi puheäänitiedostoksi.
* [[Esteettömyys]]


==Aiheesta muualla==
==Aiheesta muualla==
* [http://wiki.ubuntu-fi.org/festvox-suopuhe Ubuntu Suomi - suopuhe wiki]
* [https://wiki.ubuntu-fi.org/festvox-suopuhe Ubuntu Suomi - suopuhe wiki]
* [http://forum.ubuntu-fi.org/index.php?topic=9105.0 Ubuntu Suomi- keskustelua suopuheesta Foorumissa]
* [https://forum.ubuntu-fi.org/index.php?topic=9105.0 Ubuntu Suomi- keskustelua suopuheesta Foorumissa]
* [http://www.ling.helsinki.fi/~nvolk/festival.shtml Festival-puhesyntetisaattorin asennus]
* [http://www.ling.helsinki.fi/suopuhe/ Piilossa olevat aineistot]
* [https://web.archive.org/web/20070318020232/https://phon.joensuu.fi/suopuhe/ps.shtml SuoPuhe, puhesynteesi] aineistot  {{InternetArchive}}


[[Luokka: Multimedia]]
[[Luokka:Puhesyntetisaattorit]]
[[Luokka: Ohjeet]]
[[Luokka: Ohjeet]]
[[Luokka:Suomi]]
[[Luokka:Suomi]]

Nykyinen versio 20. huhtikuuta 2022 kello 21.35

SuoPuhe
Tekijä(t) Finnish Speech Technology: A Multidisciplinary Project
Moottori Festival
Ensijulkaisu huhtikuuta 2003
Käyttöliittymä Komentorivi
Tyyppi Festival-ohjelman äänitietokanta moduuli
Lisenssi LGPL
Kotisivu www.ling.helsinki.fi/suopuhe/index.shtml
Lähdekoodi www.ling.helsinki.fi/suopuhe/

SuoPuhe on Festival-ohjelman suomenkielinen äänitietokanta moduuli, joka tuottaa suomenkielistä puhetta tekstistä. Suopuheen ääni perustuu difoni konkatenaatioon, jossa aikaisemmin nauhoitettuja äännepareja mallinnetaan matkapuhelimissa käytetyn lineaarisen ennustamisen (LPC) avulla. Suopuhe on toteutettu TEKESin rahoittamassa Finnish Speech Technology: A Multidisciplinary Project -hankkeen sisällä ((SuoPuhe TEKES 40285/00, 40406/01, 40238/02, HY 460325)). Projekti päättyi huhtikuussa 2003.

Puhesynteesiosiossa kehitettiin Edinburghin yliopistossa kehitetyn Festival-puhesyntesialustan päälle kaksi suomenkielistä ääntä. Äänen perustuvat difonikonkatenaatioon, jossa aikaisemmin nauhoitettuja äännepareja mallinnitaan matkapuhelimissa käytetyn lineaarisen ennustamisen avulla (LPC).

Miesäänen sisältävä hy_fi_mv_diphone-äänimoduli Festivaliin ja tekstinlavennin on julkaistu LGPL-lisenssin alla.

Lisäksi kehitettiin erillinen Perlillä toimiva tekstinlavennusmoduli, joka korvaa tekstissä esiintyvät numerot, lyhenteet ja muut ongelmatapaukset niiden lukukelpoisina vastikkeina, jotta syntetisaattori osaisi lukea ne oikein.

Emacspeakiin lisättiin tuki suomenkieliselle Festival-synteesille, joka perustuu hyvin alkeellisen espeakf-nimisen koodinpätkään. (espeakf:n koodista tuli myöhemmin kehittyneempi versio, jota ei siis hyödynnetty.) Tämä on GPL-lisenssin alaisuudessa. Yhteensopivuus Emacspeakin nykyisen version kanssa on kysymysmerkki. [1]

Asennus[muokkaa]

SuoPuhe löytyy useimpien jakeluiden paketinhallinnasta nimellä festvox-suopuhe-common, festvox-suopuhe-lj, festvox-suopuhe-mv, libestools2.5, festival ja festlex-poslex. Lisätietoja ohjelmien asentamisesta löytyy artikkelista Ohjelmien asentaminen.

Suomenkieliset määritykset[muokkaa]

Komennot, jotka alkavat $-merkillä suoritetaan tavallisena käyttäjänä ja komennot, jotka alkavat #-merkillä suoritetaan pääkäyttäjänä. Katso myös su, sudo ja doas.

Festival tarvitsee määritykset suomenkielistä puhetta tuottaakseen. Ladataan ne seuraavaksi päätettä käyttäen:

$ wget https://raw.githubusercontent.com/lahtis/SuoPuhe/main/festival.scm

festival.scm tiedoston sisältö näyttää tältä.

 ;; Any site-wide Festival initialization can be added to this file.
 ;; It is marked as a configuration file, so your changes will be saved
 ;; across upgrades of the Festival package.
 ;; siteinit.scm alkaa...
 ;; VOLUME KAAKKOON, FESTIVAL PUHUU SANGEN HILJAA LINUXISSA
 (set! default_after_synth_hooks
            (list
              (lambda (utt)
                (utt.wave.rescale utt 1.0 t))))
 
 ;; 
  (if (probe_file "/usr/share/festival/voices/finnish/suopuhe.common/hy_fi_mv_diphone.scm")
      (begin 
       (load "/usr/share/festival/voices/finnish/suopuhe.common/hy_fi_mv_diphone.scm")
       (set! voice_default 'hy_fi_mv_diphone)))
 ;;; ... siteinit.scm päättyy

Kopioidaan se /etc hakemistoon.

# cp festival.scm /etc/festival.scm

Ladataan skripti, jolla Festivalia voi helposti käyttää kotihakemistosta:

$ wget https://raw.githubusercontent.com/lahtis/SuoPuhe/main/sano.bash

Skriptin sisältö näyttää tältä:

 echo $* > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2 >/dev/null 2> /dev/null

annetaan sano scriptille suoritusoikeudet komentorivillä:

$ chmod a+x sano.bash

Testataan toimivuus kotihakemistossa.

$ ./sano.bash olen puhuva pää

Kopioidaan se /usr/local/bin/ hakemistoon

# cp sano.bash /usr/local/bin/

Kokeillaan komentorivillä, saatiinko Ubuntu puhumaan suomea:

$ sano.bash Hyvää päivää. Minä olen puhuva pää.

Katso myös[muokkaa]

  • Text2wave on Festival-projektiin sisältyvä apuohjelma, jonka avulla voit muuntaa tekstidokumentin syntetisoiduksi puheäänitiedostoksi.
  • Esteettömyys

Aiheesta muualla[muokkaa]