LLM

Linux.fista
Versio hetkellä 10. marraskuuta 2025 kello 15.04 – tehnyt Lahtis (keskustelu | muokkaukset) (LLM)
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)
Siirry navigaatioon Siirry hakuun

LLM tulee sanoista Large Language Model, eli Suuri kielimalli. Se on erittäin tärkeä käsite nykyaikaisessa tekoälyssä (AI).

Mikä LLM on?

[muokkaa]

LLM on kehittynyt koneoppimisen malli, joka on suunniteltu ymmärtämään, käsittelemään ja luomaan (generoimaan) ihmiskieltä.

  • Mallit ovat valtavan suuria. Niiden kouluttamiseen on käytetty valtavia määriä dataa (miljardeja sanoja kirjoista, verkkosivuilta, artikkeleista) ja niillä on miljardeja tai jopa biljoonia parametreja. Juuri tämä suuruus tekee niistä niin tehokkaita.
  • Ne ovat erikoistuneet ihmisten käyttämään luonnolliseen kieleen (kuten suomi, englanti, jne.).
  • Se on monimutkainen matemaattinen ja neuroverkkopohjainen rakenne, joka pyrkii ennustamaan todennäköisintä seuraavaa sanaa annetun kontekstin perusteella.

Miten se toimii?

[muokkaa]

LLM perustuu yleensä Transformer-arkkitehtuuriin. Ne koulutetaan ensin käsittelemään suurta tekstidataa, jolloin ne oppivat:

  • Syntaksin: Kielen kieliopin ja rakenteet.
  • Semantiikan: Sanojen ja lauseiden merkitykset.
  • Kontekstin: Kuinka eri sanat ja lauseet liittyvät toisiinsa pitkässä tekstissä.
  • Se pystyy vastaamaan kysymyksiin kattavasti ja johdonmukaisesti.
  • Se pystyy luomaan uutta tekstiä (esim. artikkeleita, runoja, koodia).
  • Se pystyy tiivistämään pitkiä dokumentteja, sekä kääntämään kieliä.

Esimerkkejä LLM-malleista:

[muokkaa]