LAB Pro

Suurten kielimallien hyperparametrit

Suuret kielimallit (Large Language models, LLM) tulivat suuren yleisön tietoisuuteen viimeistään sen jälkeen, kun ChatGPT-palvelu julkaistiin marraskuussa 2022. Se saavutti ennätykselliset miljoona käyttäjää viidessä päivässä. Tämä teki siitä nopeimmin kasvaneen sosiaalisen median palvelun siihen mennessä. Aikaisempi ennätys 2,5 kuukautta oli Instagram-palvelulla eli miljoonan käyttäjän raja rikkoutui nyt 15 kertaa nopeammin. Tässä artikkelissa käsitellään suurten kielimallien hyperparametreja sekä tapoja, joilla käyttäjä voi vaikuttaa mallin generoimaan lopputulokseen.