Nollasta ykköseen / Fibeliuksen 0-1 missio (2021)

Tekemällä yhden koneen älykkäämmäksi voimme parantaa satojen tuhansien ihmisten elämää.” Tuohon ajatukseen tiivistyi Fibeliuksen AI -tiimin ensimmäisen asiakasprojektin heureka hetki. Julkishallinnon asiakas oli kertonut, että heidän asiankäsittelyjärjestelmässään käsitellään vuosittain noin 3 miljoonaa asiaa, nuo asiat koskevat noin puolta miljoonaa ihmistä ja niiden taloudellinen arvo on yli miljardi euroa. Lisäksi tiesimme, että jokin osa noista käsiteltävistä asioista olivat luonteeltaan sellaisia, että niillä oli taloudellisten vaikutusten lisäksi erittäin suuri etumerkiltään negatiivinen hyvinvointivaikutus suomalaiseen yhteiskuntaan.

Kasvattamalla tuon yhden asiankäsittelykoneen älykkyyttä, tekemällä siitä oppivan kykymme ymmärtää tämän viraston toiminnan vaikutusta ihmisten elämäntilanteisiin ja suomalaiseen yhteiskuntaan paranee. Lopulta, jonain päivänä, voimme sanoa, että olemme parantaa satojen tuhansien ihmisten elämää joka vuosi.”

Fibeliuksen asiakkaita ovat hyvinvointikoneet. Osa modernissa hyvinvointivaltiossa elävien ihmisten hyvän elämän elementeistä syntyy noiden koneiden ulkoisvaikutuksena ja leviää koko yhteiskuntaan onnellisuutena, luottamuksena ja tulevaisuudenuskona.

Toisaalta meillä on myös hyvinvointikoneiksi tarkoitettuja koneita, jotka viranomaistoimin tai jopa tarkoituksellisen taloudellista etua tavoittelevan väärinkäytön kautta tuottavat negatiivisia ulkoisvaikutuksia. Sen sijaan että nuo koneet tuottaisivat yhteiskuntaan työtä, vaurautta ja yritteliäisyyttä ne tuottavatkin esteitä työllistymiselle ja yritysten kasvulle, velkakierteitä, asunnottomuutta ja elämänhallinnan menetyksen tunteita, riistävät ihmisiltä tulevaisuudenuskon ja tuovat sijaan luovuttamisen ja itsetuhon ajatuksia.

Fibeliuksen tavoitteena on opetella lisäämään hyvinvointikoneiden älykkyyttä. Ja saada ne toimimaan …. Uskomme että Teemme sitä rakentamalla koneista elinikäisiä oppijoita mallien ja luonnollisten kielten tekoälyjen avulla. Tavoitteena on kasvattaa julkisen hallinnon hyvinvointijärjestelmien positiivisia ulkoisvaikutuksia. Mottonamme on ihmisten hyväksi älykkäämpien koneiden avulla.

Jouko Salonen 12/2020

Eka projekti

Käyttötapauskuvausten ja tietokantataulujen määrän perusteella tehty laskutoimitus kertoi, että asiakkaamme vuosittain käsittelemän 3 miljoonan asian eri käsittelyvaiheiden täytyi sisältää vähintään kymmenkertainen, ehkä kaksikymmenkertainen määrä toimenpiteitä. Meille se tarkoitti miljoonia päättelykyselyitä ja niihin sisältyvää mahdollisuutta tuottaa merkittävää arvonlisää. Päättelykyselyiden ekonomia ja arvonlisä ovat liiketoiminasuunnitelmamme ytimessä.

Aloituskokouksessa yksi asiakkaan edustajista kysyi mistä tuo arvonlisä muodostuu ja onko se jotenkin mitattavissa ja osoitettavissa? Kokouksessa oli mukana myös skeptikkoja joista toiset epäilivät, että tämä kuten kaikki hankkeet pyrkivät vain “tehostamaan” ihmistyötä (interface) lisäämällä käytännössä toistojen frekvenssiä ja toiset olivat sitä mieltä että kokeneen virkamiehen intuitio lopulta kuitenkin on se väline, jolla hallintopäätökset tehdään ja koneilla ei siihen voi olla mitään lisättävää.

Toronton yliopiston Avi Goldfarb, Joshua Gans ja Ajay Agrawal korostavat kirjassaan Prediction Machines että nykyisten älykkäiden koneiden luoman arvonlisän ytimessä on päättelykoneiden kyky laskea ennusteen hinta sadas tai tuhannesosiin nykyisestä. Koneen tekemällä ennusteella tässä tarkoitetaan jostain tietolähteestä saadun tiedon merkityksen arviointia suhteessa käsiteltävänä olevaan asiaan tai edessä olevan valintatilanteen rajaukseen. Kun puhumme instituutioiksi organisoidun työn kontekstissa tehdyistä älykkäistä päätöksistä nämä ovat niiden elementtejä: 1) Tieto, tosiasiat 2) ennusteet 3) lainsäädännön asettamat pelisäännöt ja niiden toimeenpano 4) itse pelissä noudatettavien strategioiden ja toimintasääntöjen hallinta ja 5) niihin liittyvä taito valita oikea toimintalinja 6) taito muuttaa valittua toimintalinjaa, 7) kyky arvioida ennusteita ja kyky panna nopeasti toimeen tukitoimia jotka tukevat uuden toimintalinjan valintaa 8) kyky käyttää valitun toimintalinjan edellyttämää logiikkaa ja sen vaatimia välineitä.

On syytä huomata, että yllä olevassa listassa on mukana hyvin erilaisia loogisia operaatioita ja kielipelejä ja että asiankäsittelyn edetessä kohti päätösvaihetta käytetyn kielen luonne muuttuu. kun puhumme organisaation älykkyydestä ja älykkäästä virastosta (Esim. sääntöpohjaista robotiikkaa implementoivat järjestelmät, tai virastojen työjärjestykset eivät ole tässä mielessä älykkäitä.) (kts. terminologia sheet: Data, prediction, IA, ABI, IPA narrow skill, new skill acquisition, implementation.)

Vastaavasti hallintovirkahenkilöt jonkin asian käsittelyyn liittyvän rekisteritiedon saadessaan joutuvat arvioimaan eri lähteistä saamansa tiedon informatiivisuutta ja merkitystä suhteessa käsittelemäänsä asiaan ja sen eri päätösskenaarioihin. Saatu uusi tieto voi muuttaa aiempien päätösskenaarioiden onnistumisen todennäköisyyttä niin, että valintalistalle on otettava uusi toimintatapa. Erona puhelimiimme automaattisesti, kysymättä ja maksutta saamamme “sateen todennäköisyys 30%” tietoon, julkista täytäntöönpanovaltaa käyttävän virkahenkilön käyttämä järjestelmä ei anna numeerista vihjettä siitä, kuinka paljon hänen tulisi kullekkin yksittäiselle tiedolle antaa totuusarvoa tai painoarvoa suhteessa käsillä oleviin valintoihin. Hän ei myöskään saa vihjettä ennusteen todennäköisestä vaikutuksesta organisaatiolle asetettuun tulostavoitteeseen tai esim. tuon hetkisen administraation asettamiin poliittisiin tavoitteisiin. Hänelle ei myöskään synny järjestelmän luomaa tilannekuvaa asianosaisista ja todennäköisyyksistä, joilla valintalistalla olevat vaihtoehdot vaikuttavat asianosaisten valintoihin.

Tässä asiakastapauksessa ennusteet kohdistuivat monista viranomaisrekistereistä, mutta myös monista yksityisistä tietolähteistä kerättyihin numeerisiin ja tekstimuodossa oleviin tietoihin. Ennusteet siis arvioivat noiden eri lähteistä tulevien tietojen merkitystä suhteessa valintalistalla oleviin toimenpiteisiin. Prosessissa ei synny (dokumentoidusti kommunikoitua) seuraavan käsittelytason ennustetta, joka täydentäisi esim. tilannekuvaa suhteessa viraston tai tulosohjaajan tulostavoitteisiin tai yhteiskunnallisiin vaikuttavuustavoitteisiin. Kanadalaisista tutkimuksista tiedämme, että esimerkiksi maahanmuuttohallinnon virkahenkilöt luottavat erityisesti kielteisiä päätöksiä tehdessään keskimäärin aivan liikaa omaan kykyynsä tehdä saamiensa tietojen pohjalta oikeaan osuvia ennusteita ja altistuvat siksi tekemään “vääriä virheitä”, ts. ottavat väärän ennusteen riskin kohdassa, jossa sitä ei esimerkiksi asiakkaan hengenvaaran vuoksi tai asiaan sisältyvien poliittisten riskien vuoksi kannattaisi ottaa. (kts. tästä tarkemmin alla oleva esittely-karuselli)

Hallinnollisen päätöksen asianomaisten tilaa voidaan myös käsitellä ajan myötä dynaamisesti kehittyvänä moniarvoisena muuttujana (esim. terve/sairas, työllinen/työtön, opiskelija/valmistunut,
maksukykyinen/maksukyvytön). Tällöin ihmisen tai kohteen luokitus vastaa yksilön todellista
tilaa ja tukee yksilön mahdollisuuksia toimia erilaisissa tilanteissa hänelle/sille sopivalla
tavalla. Luokittelun ei tarvitse standardoiva ja joitakin erityisiä tarpeita poissulkeva.
Esimerkiksi perinteiset sosioekonomiset luokittelut ovat usein pakottaneet ihmisen
yhteen luokkaan rajallisista vaihtoehdoista. Moniarvoisilla ja tilanteen mukaan muuttuvilla
tilatiedoilla yksilölle voidaan tarjota hänen tilaansa paremmin sopivia ratkaisuja. (kts. Takala, KOhti jatkuvaa tilannekuvaa, Sitra 2018)

Ennusteet vs. julkisen arvon luonti ja arvon sieppaus

”Minkä osan toiminnastamme voimme muuttaa ennuste ongelmiksi?

Talouden näkökulmasta tekoälyn keskeinen vaikutus on hyvin yksinkertainen. Erittäin laadukkaiden ennusteiden hinta romahtaa ja ne tulevat kaikkien saataville. Ennusteet ovat päätöksenteon yksi keskeinen elementti. Kun niiden hinta laskee, prosessit, strategiat, lait ja ansaintamallit muotoillaan ennusteita hyödyntäviksi.

Yksi koneoppivien mallien tuottamien ennusteiden erityisominaisuus on niiden kyky arvioida epävarmuuden astetta. Toinen noiden koneiden tekemien ennusteiden ominaisuus on mallin

Toimeksiantoon sisältyi vaatimus osoittaa, kuinka koneoppivalla tekoälyllä voitaisiin lisätä tuon julkisen organisaation kykyä tuottaa sille asetettujen tavoitteiden mukaista taloudellista arvoa. Käytännössä oli siis luotava malli, joka yhdisti noiden 3 miljoonan valitun toimenpiteen tuottaman taloudellisen vaikutuksen ja noiden toimenpiteiden takana kerättyjen tietojen ja niistä tehtyjen ennusteiden tilastollisen yhteyden.

Ensinnäkin, Toronton yliopiston Avi Goldfarb, Joshua Gans ja Ajay Agrawal osoittivat kirjassaan Prediction Machines ja sen akateemisissa NBER taustapapereissa Economics of Artificial Intelligence (2017) ja Exploring the Impact of Artificial Intelligence: Prediction vs. Judgement (2018), että jo nykyiset ihmisen käytännöllisiin kykyihin sidotut älykkyyden määritelmät antavat meille riittävät eväät arvioida tekoälyjen käytön vaikutuksia taloustieteellisestä näkökulmasta.

Esimerkiksi akateemisen AI -kirjallisuuden metatutkimuksella yli 70 määritelmästä siivilöity Legg & Hutter 2007 määritelmä (1) tai Max Tegmarkin Life 3.0 kirjassa (2) esitetty määritelmä tai Francois Cholletin tuore (2019) tehtävä (task) keskeinen uusien taitojen omaksumis-kyvykkyyttä korostava määritelmä (3) riittävät lähtökohdaksi kun arvioimme tekoälyn aiheuttamaa liiketoimintaympäristön ja yritysten ja niitä tukevien julkisten organisaatioiden arvovirtojen ja ansaintalogiikoiden muutosta 2020 luvulla ekonomistin silmin.

(1) “Intelligence measures an agent’s ability to achieve goals in a wide range of environments.”

(2) “Intelligence = Ability to accomplish complex goals.”

(3) “The intelligence of a system is a measure of its skill-acquisition efficiency over a scope
of tasks, with respect to priors, experience, and generalization difficulty. (…) Or, in plain English: intelligence is the rate at which a learner turns its experience and priors into new skills at valuable tasks that involve uncertainty and adaptation.”

Agrawal, Gans ja Goldfarb osoittavat kuinka tyhmien ja älykkäiden päätösten tueksi kerättyjen, joko päätöstä tukevien tai sen kanssa ristiriidassa olevien tietojen pohjalta muodostetut eri tyyppiset ennusteet seuraavien toimien onnistumisesta ovat keskeisessä roolissa arvioitaessa AI:n vaikutuksia ekonomistin silmin. Heidän teesinsä on, että ennusteet (siis erilaisten koneäly algoritmien tuottamat luokittelu-, päätöspuu tms. ennusteet) ovat yleiskäyttöistä teknologiaa, joka itsessään tuottaa innovaatioita (ja siis uusia kykyjä ja taitoja) ja siis kykyä ennustaa jonkin valitun toimen voimaa ratkaista uusia eteen tulevia tehtäviä. Agrawal, Gans ja Goldfarbin Ekonomistin AI -teesi kuuluu: Nyt käynnissä olevan koneoppivien ennusteiden ensimmäisen käyttöönotto-aallon myötä erittäin korkealaatuisten ennusteiden tuotantokustannukset ja hinnat romahtavat.

Ennusteiden hinnan romahdusta seuraa mm- sähkövalon käyttöönotosta tutun nk. Jevonsin paradoxin kuvaama ilmiö: vaikka ennusteiden hinta romahtaa, niihin käytetty rahamäärä kasvaa ja samalla noiden ennusteiden käyttö kasvaa eksponentiaalisesti. Sitä seuraa noille ennusteille komplementaaristen tuotteiden, sensoreiden, mobiilisovellusten ja oraakkeli-palveluiden kysynnän ja tarjonnan kasvu. Hyvälaatuisia ennusteita tuottavien mallien tuottamisen pullonkaulana on vielä mallien kouluttamiseen tarvittavien

Seuraavassa aallossa organisaatiot alkavat muuttaa toimintaansa ja strategioitaan: johdon #1 kysymys kuuluu: Voimmeko muuttaa liiketoiminta-kysymyksemme ennustekysymyksiksi? Virastojen oikeuspalvelu-yksiköiden johtajat kysyvät: Voimmeko muuttaa lain operatiivisen toimeenpanon ennusteisiin perustuvaksi? Mutta heidän esihenkilönsä, viraston ylijohtaja ja hänen tulosohjaajansa kysyvät: kuinka voimme muuttaa lain operatiivisen toimeenpanon ennusteisiin perustuvaksi? Asiakaspalvelujohtajat kysyvät: Voimmeko muuttaa palvelujemme kuluttajille tekemämme kysymykset ennustekysymysten muotoon? CTO:t ja CDO:t kysyvät kuinka muutan CRM, ERP ja asiankäsittelykoneeni ja prosessini ja työjononi ennustekoneiksi?

Valtion hallinnon organisaatiot joutuvat arvioimaan tuottamiensa palveluiden omakustannushinnan. Esimerkiksi jos jonkin luvan omakustannushinta on 400€ sisältyy tuohon hintaan todennäköisesti 10-15% yleiskustannuksia ja 10-35 noin 10-35 euron hintaista työvaihetta tai toimenpidettä. Kuhunkin niistä virkamiehen aikaa kuluu 10 minuutista kolmeen varttiin: tehtävänä on noiden asiaan liittyvien tietojen kerääminen, tarkistus, arviointi ja ennuste siitä minkä luonteinen on tuon tiedon vaikutus päätettävänä olevaan asiaan.

Jos saisimme luvan muuttaa nuo kymmenet miljoonat ennusteet matemaattiseen muotoon niistä tulisi halpoja n. 10 eurosenttia / kpl hintaisia, ne olisivat nopeita tehdä, ne olisivat helposti järjestelmästä toiseen siirrettäviä, rajapintojen läpi kyseltäviä, ne olisi helppo jaella kaikille asianosaisille mobiilisovellusten kautta ja niiden tuottamaa tietoa olisi erilaisiin sovelluksiin jaeltavissa olevia. Ennusteet demokratisoituisivat ja aiheuttaisivat ketjureaktion, jota Peter Diamandis kuvaa termillä digitaalisen talouden 6 D -kirjainta.

Olemme poimineet (yhä monin tavoin keskeneräisille) tuotesivuillemme julkisen hallinnon tehtävien kannalta keskeisten tekoälyteknologioiden (mm. NER-NLP, XAI, transformers) lyhyitä esittelyjä. Innovaatiot ja uudet läpimurrot noissa teknologioissa seuraavat toisiaan kiihtyvällä tahdilla. Blogeissamme ja instagram-sivuillamme jaamme syksyn mittaan syvällisempiä analyysejä luonnollisten kielten tekoälyistä, koneoppivien järjestelmien filosofisista ja eettisistä kysymyksistä. Syksy 2020 on noiden sisältöjen luomisen aikaa: liity postilistallemme, lähetämme sinulle tiedon kun julkaisemme uusia tuotesivuja, blogikirjoituksia tai blueprint AI infograafeja.