Miten tekoälyä voidaan hyödyntää oikeushallinnon alalla?

20.12.2024 8.49
Tekoälyä hyödyntävien sovellusten nopea kehitys muokkaa useita toimialoja. ”Tekoäly ei vie työtäsi, vaan ihminen, joka käyttää sitä" -hokema ei päde ainakaan freelancereiden kohdalla, joilla töiden kysyntä on vähentynyt merkittävästi ChatGPT-3:n julkaisun myötä. Entä oikeushallinnon työt sitten? Tekoäly ei valitettavasti tai onneksi voi vielä kaikkia tehtäviä oikeushallinnossa hoitaa, mutta artikkelissa muutamia ajatuksia sen lyhyen aikavälin hyödyntämismahdollisuuksista.

Tekoälyä hyödyntävien sovellusten nopea kehitys muokkaa useita toimialoja. Lokakuussa teknologiajätti Google ilmoitti, että 25 prosenttia heidän uudesta koodistaan luodaan nykyään tekoälyavusteisesti. Microsoft on puolestaan ilmoittanut, että ohjelmistojen kehittäjille suunnatun GitHub Copilotin ansiosta palvelua käyttävien koodarien tuottavuus on kasvanut 55 prosentilla, ja peräti 46 prosenttia uudesta koodista kirjoitetaan tekoälyn avulla. Yhdysvaltalaistutkimuksen mukaan erityisesti freelancer-työt, kuten mainostekstien laadinta ja graafinen suunnittelu, ovat vähentyneet merkittävästi ChatGPT-3:n julkaisun myötä. Tekoälyllä tehtyjä kuvia ja muuta sisältöä näkee päivittäin kotimaisten sanomalehtien ja yritysten sivuilla ja mainonnassa.

Julkiset organisaatiotkaan eivät ole säästyneet tekoälyhuumalta. Australian valtionhallinnossa toteutettiin alkuvuodesta laajempi Microsoft Copilot -kokeilu, jossa suurehko joukko virkamiehiä sai työkalun käyttöönsä puoleksi vuodeksi. Ylivoimainen enemmistö kokeilijoista suhtautui työkaluun positiivisesti ja ilmoitti halustaan jatkaa sen käyttöä. Läheskään kaikki eivät kuitenkaan kokeneet työkalun tosiasiallisesti lisänneen työn tuottavuutta tai laatua.

Samainen työkalu otettiin käyttöön oikeusministeriössäkin. Käytäväkeskustelujen perusteella vaikuttaa kuitenkin siltä, että läheskään kaikki eivät ole vielä työkalua kokeilleet, puhumattakaan sen hyödyntämisestä arkipäivän työssä. Kokeilijoiden keskuudessa tuntemukset vaihtelevat: löytyy pessimistejä, jotka kokevat työkalun käytön hankalaksi ja aikaa vieväksi – pitäähän tekoälyn tuottama sisältö aina tarkistaa eikä se hehkutuksesta huolimatta teekään kaikkia töitä puolestasi. Lisäksi työkalun käyttöön liittyvä ohjeistus on koettu riittämättömäksi. Sitten löytyy innokkaita optimisteja, jotka näkevät työkalun hyödyllisenä apurina. Itse kuulun tähän jälkimmäiseen ryhmään.

Tässä hieman ajatuksia siitä, miten tekoälysovelluksia voitaisiin hyödyntää paremmin koko hallinnonalalla.

Kielimallit käyttöön asiantuntijatyön tueksi


Ministeriöiden välisen tekoälyverkoston ensimmäisessä kokouksessa vierailevana tähtenä toiminut Professori Pekka Abrahamsson totesi esityksessään, että RAG-menetelmiä (Retrieval-Augmented Generation) hyödyntävät kielimallit ja niiden sovellutukset ovat tällä hetkellä oikeita ”matalalla roikkuvia hedelmiä”. Niiden hyödyntäminen ei välttämättä vaadi monimutkaisia infrastruktuurien muutoksia ja niillä voidaan ratkaista käytännön ongelmia tehokkaasti.

Kielimalli on koulutettu algoritmi, joka on suunniteltu käsittelemään ja tuottamaan luonnollista kieltä. RAG puolestaan pyrkii yhdistämään suurten kielimallien kyvyn käsitellä ja tuottaa kieltä hakukoneiden ja tietokantojen tuottamaan ajantasaiseen tietoon.

Asiantuntijatyön apuna kielimallit auttavat ideoinnissa, kirjoittamisessa, suunnittelussa, koodaamisessa ja vaikkapa vaikutusten arvioinnissa. RAG-menetelmällä höystetty kielimallisovellus puolestaan lisää palveluun tiedonhaun, mikä mahdollistaa tiivistelmien, analyysien ja vaikkapa käännösten teon käyttäjän sille itse syötetyistä aineistoista. Monissa sovellutuksissa kielimalli voi hakea tietoja myös suoraan verkosta tai vaikkapa suuresta erikseen määritellystä hakemistosta tieteellisiä julkaisuja.

Tällaisten sovellutusten hyötymahdollisuudet ovat ilmeisiä kaikissa koko hallinnonalalla. Mitä jos koko Finlex syötetään RAG-metodia hyödyntävälle kielimallille? Entä millaista olisi ”chattailla” kaikkien tuomioistuinten ratkaisuasiakirjojen kanssa? Millaisia johtopäätöksiä kielimallit pystyvät luomaan talous- ja velkaneuvonnan asiakaspalautteesta? Voiko lausuntopalautteita analysoida tai kääntää kielimallien avulla?

Oikeusministeriössä kokeiltiin muun muassa muutamien satojen perustuslakivaliokunnan lausuntojen analysointia ja tiivistämistä eri kielimalleilla ja niiden sovellutuksilla. Kokeilussa mukana olleen juristin mielestä mallien tuottamat vastaukset olivat ”yllättävän hyviä” ja muistuttavat sellaisen ”maisterivaiheen opiskelijan vastauksia.” Käytännössä vastaukset olivat noin 80–90 prosenttisesti oikein, mikä tarkoittaa sitä, että käyttäjän pitää olla suhteellisen tarkka työkalun tuotoksia hyödyntäessään. Virheelliset vastaukset olivat tässä tapauksessa suoraa hölynpölyä eli hallusinointia tai sitten epätäydellisiä tiedonhakuja. Virheistä huolimatta työkalu koettiin hyödylliseksi.

RAG-menetelmää hyödyntävien kielimallien täysimittaisen hyödyntämisen esteenä on se, ettei meillä ole vielä käytössä ratkaisuja, jotka tehokkaasti rajoittavat tekoälyn käyttöä niin, ettei se vuotaisi henkilötietoja ulospäin sellaiseen käyttöön, jota varten niitä ei ole kerätty. Lisäksi yhtälöön sisältyy vielä tietoturvaongelmat ja virkaeettiset asiat. Miten eri tekoälypalvelujen käyttäjien kehotedataa käytetään? Käyttäjät eivät myöskään pääsääntöisesti näe, miten tekoäly vastauksia tuottaa ja miten se tarkalleen on koulutettu. Hallusinoinnista johtuvia virheitä on joskus myös hankala tunnistaa. Uusien työkalujen käyttöön liittyy myös oppimiskäyrä ja osaamaton käyttö voi lisätä hallusinointia ja sitä myöden virheitä.

Hyvien kokemusten innoittamana ainakin oikeusministeriö kuitenkin edistänee vuodenvaihteessa kokeilumielessä sovellushankintaa, joka mahdollistaa suurempien julkisten tekstiaineistojen käsittelyn kielimallilla. Sovellus tulee ensisijaisesti ministeriön käyttöön, mutta sen skaalautuvuutta hallinnonalalle ja muille ministeriöille arvioidaan.

Tehoa tiedolla johtamiseen ja data-analytiikkaan

Hallinnonalan dataosaajien käyttöön on viime vuosina saatettu useita uusia Power BI -raportteja, joiden tarkoitus on tuoda asianhallintajärjestelmissä majaileva data hyötykäyttöön ja visualisoida sitä. Vaikka jaksan vielä suhtautua lämmöllä näihin raportteihin, uskallan silti unelmoida paremmasta huomisesta: Power BI -raportit kun eivät täsmällisesti vastaa siihen tarpeeseen, joka esimerkiksi lainvalmistelijoilla tai muilla dataa hyödyntävillä käyttäjällä yleensä on. Tyypillisessä käyttökokemuksessa raportti avataan, sitä kliksutellaan ja muutaman kirosanan jälkeen löydetään – ehkä – tarvittava tieto tai luku. Luku kopioidaan johonkin muistioon, sitten kaivetaan esiin vielä taskulaskin, jolla lasketaan prosentteja. Lopuksi kirjoitetaan vielä johtopäätöksiä.

Parempi huominen data-analytiikassa tarkoittaisi hallinnonalan käytössä olevaa kielipohjaista data-analyysiin ja tietokantakyselyihin erikoistunutta tekoälyä. Kyse olisi kielimallista, joka on hienosäädetty tukemaan hallinnonalan tietokantoja ja esimerkiksi Python-ohjelmointia. Tällaisella työkalulla olisi teoriassa mahdollista tuottaa data-analytiikkaa automaattisesti suoraan ajantasaisista tietokannoista. Kliksuttelun sijaan käyttäjä määrittelisi tarpeensa luonnollisella kielellä ja saisi vastauksia luonnollisella kielellä, höystettynä mahdollisilla taulukoilla ja visualisoinneilla. Työkalu pystyy todennäköisesti arvioimaan automaattisen data-analyysin tuloksia suhteessa olemassa olevaan tutkimuskirjallisuuteen ja tekemään hyödyllisiä tiivistelmiä.

Tällaisia sovellutuksia on jo olemassa ja ne mahdollistaisivat perinteisen raportoinnin sijaan tai sen täydennykseksi luonnolliseen kieleen perustuvan automaattisen data-analytiikan. Näidenkin hyödyntämisen haasteena on tässäkin tietosuoja- ja tietoturva-asiat sekä virkaetiikkaan liittyvät kysymykset. Lisäksi kvantitatiivisen datan huono laatu on todennäköisesti merkittävä kompastuskivi, jos tekoäly ei pysty auttavasti tunnistamaan esimerkiksi erilaisista kirjauskäytännöistä johtuvia epäjatkuvuuksia. Lisäksi kvantitatiivisessa analyysissa hallusinointi voi olla kohtalokasta. Kvantitatiivinen analyysin tekemiseen tekoälyavusteisesti tarvitaan myös riittävä ymmärrys empiirisistä menetelmistä – väärät valinnat esimerkiksi sovellettavien mallien suhteen voivat luoda tuloksia, jotka ovat päinvastaisia todellisuuteen nähden.

En pidättäisi henkeä siihen asti, että hallinnonalallamme tallaisia tietokantoja saadaan tekoälyn ulottuville. Sen sijaan lyhyellä aikavälillä dataosaajat hyötyisivät esimerkiksi tekoälyä hyödyntävästä aineistokatalogista, joka sisältäisi hallinnonalan kaikkien asianhallintajärjestelmien dokumentaation. Tällainen on jo Oikeusrekisterikeskuksessa onneksi suunnitteilla.

Ketterää automaatiota piensovelluksilla

Kielimallit ja niiden sovellukset voivat lisätä automaatiota yllättävin tavoin. Henkilö, joka omaa hieman kärsivällisyyttä ja perustietoja koodaamisesta, voi kielimallien avustuksella luoda yllättävän hienostunutta ja käyttökelpoista koodia.

Uskon, että arjen askareissa hyödynnettävien piensovellusten kehittäminen on virastoissa ja ministeriössä pian arkipäivää.

Uskon, että arjen askareissa hyödynnettävien piensovellusten kehittäminen on virastoissa ja ministeriössä pian arkipäivää. Yksikkömme korkeakouluharjoitteluja osoitti, miten mutkatonta on luoda Python-koodi, joka automatisoi työnkulun, jonka lopputuloksena on nimitysmuistio, joka hyödyntää dataa rekrytoinnin työpaikkailmoituksista ja hakemuksista. Toinen harjoittelija koodasi tekoälyavusteisesti sovelluksen, joka vie automaattisesti EU:n direktiivejä ”täytäntöönpanotaulukkoon”, jossa uusien ja vanhojen direktiivien artiklojen eri kohdat asettuvat kauniisti Excelin riveille vierekkäin.

Pienohjelmistojen tekoälyavusteista koodaamista on myös kokeiltu Oikeusrekisterikeskuksen johdolla Microsoftin Power Platformilla, joka on kokoelma kehitystyökaluja, joiden avulla käyttäjät voivat rakentaa sovelluksia ja automaattisia työnkulkuja ilman kovaa koodaamista. Power Platformin keskeisiin etuihin kuuluu sen vahva integraatio Microsoftin ekosysteemin, kuten SharePointin, Teamsin, Outlookin ja OneDriven, kanssa. Tämä tekee Power Platformista erittäin houkuttelevan vaihtoehdon organisaatioille, jotka jo käyttävät Microsoftin tuotteita, kuten hallinnonalallamme melkein kaikki ovat.

Helpottunut koodailu valitettavasti aiheuttaa myös merkittäviä haittoja muun muassa kyberturvallisuuden näkökulmasta. Suuryritys Amazon ilmoitti, että heidän palvelujaan koskevia hakkerointiyrityksiä on lähes kymmenkertainen määrä eli noin miljardi päivässä verrattuna ChatGPT:n julkaisua edeltävään aikaan.

Älykästä ja mukautettua koulutusta

Teknologiajätti Google yllätti yleisön syksyllä julkaisemalla NotebookLM-palveluunsa erityisen ”Audio Overview” -toiminnon, joka muuntaa sille ladatut dokumentit keskustelunomaisiksi äänitiedostoiksi, joissa tekoälyjuontajat keskustelevat materiaalin keskeisistä aiheista. Tämä ominaisuus mahdollistaa aineiston kuuntelemisen podcast-tyylisessä muodossa, mikä voi helpottaa oppimista ja tiedon omaksumista joillekin.

Itseäni tekoälyjuontajat lähinnä ärsyttivät, mutta olen optimistisempi kielimallien ja niiden sovellutusten mahdollisuuksista simuloida hyödyllisiä vuorovaikutuksia. Esimerkiksi talous- ja velkaneuvonnassa tekoäly voisi esittää asiakasta, joka kuvailee tilannettaan, ja näin koulutettava voi harjoitella neuvontaa vuorovaikuttamalla tekoälyn kanssa. Samaten tuomioistuinkäsittelyjä ja kriisinhallintaskenaarioita voidaan todennäköisesti simuloida riittävän realistisen tuntuisiksi.

Näin yleisesti tekoäly tarjoaa koulutettavalle mukautettuja, yksilöllisiä harjoituksia. Jos joku oppii parhaiten tietovisailun tai muun ”pelillistämisen” kautta, tekoäly voi tuottaa oppimisaineistoista monivalintakysymyksiä tai muita kysymys-vastaus-järjestelmiä. Väittelyn kautta oppiminen onnistuu esimerkiksi ChatGPT:n äänitilassa, jossa voit asettaa tekoälyväittelijälle puolustettavan argumentin, roolin tai teeman, ja ohjelma rakentaa vastauksensa tämän perusteella. Auditiiviselle oppijalle aineistot voidaan räätälöidä erilaisiksi äänitiedostoiksi tai podcasteiksi.

Voiteluaineita hallinnonalan prosessien kehittämiseen ja ennakointiin

Julkishallinnon prosessit ovat monesti pitkiä ja monipolvisia. Vaikka käsittelyaika tuntuu yksiselitteiseltä mittarilta, siihen vaikuttavat juurisyyt ovat hankalampia tunnistaa etenkin, jos prosessi ulottuu yli useamman sektorin. Virkamiehellä itsellään voi olla vahva tunne siitä, että he joutuvat aina kysymään samoja lisätietoja tai ohjaamaan asian edelleen oikeaan osoitteeseen, mutta tällainen hiljainen tieto ei itsestään päädy ohjaamaan prosessin johtamista kokonaisuutena.

Prosessilouhinta tähtää asianhallintajärjestelmien ja muiden sähköisten järjestelmien tuottamien lokitietojen parempaan hyödyntämiseen. Lokitietoja visualisoidaan, analysoidaan ja niiden avulla pyritään optimoimaan organisaation prosesseja, kuten erilaisia jonoja rikosketjussa. Prosessilouhinta voidaan nähdä myös apuvälineenä tunnistamaan missä prosessin vaiheissa automaatiosta saadaan eniten hyötyä – ja jopa osittain toteuttamaan tämän automaation. Minulla ei henkilökohtaisesti ole vielä kokemuksia prosessilouhinnasta saatavista käytännön hyödyistä, mutta ainakin Oikeusrekisterikeskus uskoo niiden olemassaoloon.

Lopuksi perinteisillä koneoppimismenetelmillä, kuten regressiomalleilla, voidaan edelleen parantaa ennakointia ja tuoda siten apuja työn suunnitteluun ja seurantaan eri sektoreilla. Varsinkin rikosprosessin osalta on tärkeää pyrkiä hyödyntämään paremmin ketjun alkupään dataa ketjun loppupään ennakoimiseksi. Myös klusteroinnilla voidaan saavuttaa hyötyjä esimerkiksi ulosottovelallisten luokittelussa – velallisia voitaisiin jo heti vireilletulon jälkeen ohjata nykyistä paremmin tietynlaiseen käsittelyyn.

Aleksi Kirjonen

Kirjoittaja on johtava asiantuntija oikeusministeriössä.

 

Kuva tuotettu tekoälyllä / Pixabay

Haaste 4/2024