Ovatko synteettiset asiakkaat rationaalisia? Kielimallien tuottamien kuluttajaprofiilien psykometrinen validointi

Kuluttajadatan kerääminen on kallista, ja yksityisyyden suoja rajoittaa sen käyttöä. Tiedonhaun ja suosittelujärjestelmien tutkimuksessa suurten kielimallien avulla luoduista synteettisistä asiakasprofiileista on tullut houkutteleva ratkaisu. ECIR 2026 -konferenssissa esitelty tutkimus osoittaa, että kielimallit kykenevät tuottamaan rakenteellisesti päteviä kuluttajaprofiileja – mutta niissä piilee yllättävä ongelma.

Kirjoittaja: Sami Heikkinen

Kun tiedonhakujärjestelmä tai verkkokaupan suosittelualgoritmi otetaan käyttöön ilman historiadataa, se ei tiedä, mistä uudet asiakkaat pitävät. Tätä kutsutaan kylmäkäynnistysongelmaksi (cold start problem). Ongelma on tuttu kaikille suosittelujärjestelmiä kehittäneille: alussa ei ole dataa, ilman dataa ei synny suosituksia, ja ilman suosituksia ei kerry dataa. Noidankehä on vaikea katkaista.

Ratkaisu on houkutteleva: suurten kielimallien (LLM) avulla voidaan luoda tuhansia kuvitteellisia asiakasprofiileja, jotka täyttävät puuttuvan datan. Näitä synteettisiä käyttäjiä on alettu hyödyntää laajasti sekä suosittelujärjestelmien kylmäkäynnistyksen helpottamisessa että uusien algoritmien testaamisessa. Samalla on noussut kriittinen kysymys: kuinka hyvin nämä virtuaaliset asiakkaat todella kuvaavat todellista kuluttajakäyttäytymistä? Pelkkä tekstuaalinen sujuvuus ei riitä – profiilin on käyttäydyttävä myös psykologisesti loogisesti.

Psykometriikkaa kuluttajaprofiilien testaamisen apuvälineenä

Tutkimuksessa (Heikkinen 2026) lähestyttiin validointikysymystä psykometrian keinoin. Tutkimuksessa käytettiin Consumer Styles Inventory (CSI) -kyselytyökalua, joka mittaa kahdeksaa eri kuluttajan päätöksentekotyylin ulottuvuutta: täydellisyyden tavoittelua, merkkiuskollisuutta, uutuudenviehätystä, hedonistista ostamista, hintatietoisuutta, impulsiivisuutta, valinnan vaikeutta ja tottumuksellisuutta (Sproles & Kendall 1986). Kyselytyökalun vahvuus validoinnin kannalta on se, että se mittaa keskenään loogisessa suhteessa olevia piirteitä: äärimmäisen hintatietoisen kuluttajan ei pitäisi olla vahvasti merkkiuskollinen, eikä täydellisyyttä tavoittelevan pitäisi ostaa impulsiivisesti. Psykometrinen lähestymistapa antaa siis objektiivisen vertailukohdan, johon synteettistä dataa voidaan peilata.

Tutkimuksessa pyydettiin Gemini 2.5 Flash -kielimallia tuottamaan 1 000 synteettisen kuluttajaprofiilin vastaukset 40-kohtaiseen CSI-kyselyyn (7-portainen Likert-asteikko). Tässä käytettiin profiilipohjaista kehotetta (profile-based prompting): jokaiselle profiilille annettiin satunnaisesti generoitu demografinen tausta (ikä, ammatti, asuinmaa, koulutustaso) sekä lyhyt kuvaileva luonnehdinta kuten ”Budget-Conscious Student” tai ”Senior Software Engineer”. Tämä lähestymistapa pyrkii minimoimaan niin sanotun modaalisen romahduksen (modal collapse), jossa malli tuottaa yhä uudestaan samoja vastauksia. Tulokset osoittivat onnistumisen: 1 000 profiilista löytyi 98 erilaista ammattia ja 34 eri asuinmaata.

Kielimalli ymmärtää kuluttajalogiikat – mutta tekee sen liian täydellisesti

Tutkimuksen tulokset jakautuvat kahteen keskeiseen löydökseen. Ensimmäinen on rohkaiseva. Gemini 2.5 Flash kykeni erottamaan kahdeksan eri kuluttajatyyppiä toisistaan selkeästi. Eksploratiivisessa faktorianalyyssä (EFA) kahdeksan faktoria selittivät 82 % aineiston vaihtelusta. Kielimalli ymmärsi kuluttajakäyttäytymiseen liittyvät loogiset jännitteet: hintatietoisuuden ja merkkiuskollisuuden välinen osittaiskorrelaatio oli negatiivinen (r = −0,32), ja impulsiivisuus ja täydellisyyden tavoittelu olivat nekin käänteisessä yhteydessä toisiinsa (r = −0,28). Faktorirakenteen vastaavuutta arvioitiin Tuckerin kongruenssikertoimilla; seitsemän kahdeksasta faktorista ylitti 0,90 raja-arvon, jota pidetään erinomaisena vastaavuutena alkuperäiseen inhimilliseen aineistoon verrattuna. Malli osasi myös käsitellä oikein käänteiskoodatut kysymykset: väittämä ”Shoppailu tuntuu ajan hukkaan heittämiseltä” sai oikeansuuntaisen negatiivisen korrelaation suhteessa väittämään ”Pidän shoppailusta”.

Toinen löydös on haastavampi. Synteettiset kuluttajat ovat liian johdonmukaisia. Ihmisaineistoissa CSI:n kahdeksan faktoria selittävät tyypillisesti 50–60 % vaihtelusta. Synteettiset profiilit ylsivät 82 prosenttiin. Vastausten hajonta jäi pienemmaksi kuin ihmisillä (SD = 1,24 vs. tyypillisesti 1,40–1,80), ja poikkeavia havaintoja löytyi vain 2,3 %, kun ihmisaineistoissa luku on tyypillisesti 5–10 %. Kielimalli noudattaa annettua kuluttajapersoonaansa lähes matemaattisella tarkkuudella. Todellisille ihmisille ominainen epäjohdonmukaisuus, yllätyksellisyys ja satunnaisuus puuttuvat. Synteettinen asiakasprofiili on tavallaan liian rationaalinen ollakseen uskottava.

Aineiston laadullinen tarkastelu vahvistaa menetelmän loogisuuden. Profiili, jonka taustaluonnehdinta oli ”Quality Seeker” ja ammatti ”Product Designer”, arvioi täydellisyyttä mittaavat väittämät johdonmukaisesti korkealle (pistemäärä 5) ja impulsiivisuutta mittaavat matalalle (pistemäärä 1). Vastaavasti ”Budget-Conscious Student” -profiili arvioi hintatietoisuusväittämät korkealle (keskiarvo 4,67) ja merkkiuskollisuusväittämät matalalle (keskiarvo 1,83). Malli osoitti kuitenkin myös kirjaimellisen tulkinnan ongelmia: ”Environmental Activist” -profiili sai korkeat pisteet uutuudenviehätyksessä, koska kehote mainitsi uusien kestävien tuotteiden etsimisen, vaikka se kuvaa tuotekategoriapreferenssiä, ei ostamistyylinä impulsiivisuutta. Kielimalli ei aina erottele semanttista samankaltaisuutta psykologisista rakenteista.

Mitä tämä tarkoittaa käytännössä?

Synteettiset kuluttajaprofiilit soveltuvat erinomaisesti kahteen tarkoitukseen. Ensinnäkin ne ovat hyviä työkaluja kylmäkäynnistystilanteessa: kun uusi suosittelujärjestelmä tarvitsee alkuvaiheen dataa, synteettiset profiilit tarjoavat sisäisesti johdonmukaisia ja teoreettisesti perusteltuja lähtöpisteitä. Toiseksi ne sopivat algoritmien ja liiketoimintakonseptien testaamiseen, kun halutaan verrata eri asiakassegmenttien käyttäytymistä kontrolloidusti ja toistettavasti. Yritys voi esimerkiksi testata uutta suosittelulogiikkaa virtuaalisella kuluttajajoukolla ennen kuin oikea asiakas on kertonut oman mielipiteensä.

Sen sijaan synteettiset profiilit eivät sovellu sellaisenaan korvaamaan oikeita asiakkaita lopullisessa validoinnissa. Hyperrationaalisuus tarkoittaa, että järjestelmä, joka toimii täydellisesti synteettisillä käyttäjillä, voi epäonnistua kohdatessaan oikeiden ihmisten epäjohdonmukaisen päätöksenteon. Käytännön suositus on hybridimalli: synteettistä dataa kannattaa käyttää nopeaan alustavaan testaukseen ja iterointiin, mutta lopullinen validointi on aina tehtävä oikeilla käyttäjillä. Näin voidaan yhdistää synteettisen datan nopeus ja kustannustehokkuus sekä todellisen maailman monimutkaisuus.

Kohti uskottavampaa simulointia

Tutkimus osoittaa, että suuret kielimallit ovat kypsiä apuvälineitä kuluttajakäyttäytymisen simuloinnissa. Rakenteellinen pätevyys on jo hyvällä tasolla. Malli osaa erottaa eri kuluttajatyypit toisistaan ja ymmärtää niiden väliset loogiset suhteet. Seuraava haaste on saada synteettiset kuluttajat käyttäytymään inhimillisemmin: epäjohdonmukaisemmin, yllätyksellisemmin ja realistisemmin. Yksi lupaava tutkimussuunta on selvittää, muuttuuko hyperrationaalisuuden aste, jos kehottamisessa ei erikseen vaadita johdonmukaisuutta tai jos lämpötilaparametria (temperature) nostetaan.

Tutkimus nostaa esiin myös laajemman periaatteen: psykometriset työkalut tarjoavat luotettavan vertailukehyksen synteettisen datan validointiin. Tilastollinen samankaltaisuus ei riitä; synteettisten profiilien on käyttäydyttävä loogisesti myös liiketoiminnallisesti merkittävien piirteiden suhteen. CSI tarjoaa tähän valmiin, validoidun kehyksen, mutta vastaavia psykometrisia instrumentteja on olemassa monille eri aloille. Synteettisten asiakkaiden laadun arvioinnista on tulossa kriittinen taito kaikille, jotka hyödyntävät tekoälysimulaatioita tuotekehityksessä, markkinatutkimuksessa tai järjestelmien suunnittelussa.

Lähteet

Heikkinen, S. 2026. Are Synthetic Users Rational? A Psychometric Analysis of LLM-Generated Customer Preferences. Teoksessa Proceedings of the 48th European Conference on Information Retrieval (ECIR 2026). Springer LNCS. Delft, Alankomaat.

Sproles, G.B. & Kendall, E.L. 1986. A Methodology for Profiling Consumers’ Decision-Making Styles. Journal of Consumer Affairs, 20(2), 267–279.