Esittelyssä salainen tekoäly ”Rautatie Asiantuntija”

Purple Haze – loving it

24.11.2023. Mikäli et lukenut vielä blogin (pitkähköä) esittelyosaa, luethan sen ja disclaimerit ensin täältä.

Lue myös hieman jälkikäteistä reflektiota (11.6.2023.) Rautatie Asiantuntijan” vaikutuksesta omaan ajatteluun ja koko liikennealan mahdollisuuksiin avoimen / julkisen datan ja tekoälykehityksen ansiosta – kunhan kehitys on täysin käyttäjälähtöistä.

GPT Builder on väkevä lisäys ChatGPT Plus -palveluun

Tein alkuun kokeilumielessä yksinkertaisen GPT-tekoälyinstanssin ChatGPT:n GPT Builderilla, joka lisättiin ChatGPT Plus -versioon pari viikkoa sitten. Työkalu soveltuu lähinnä nopeaan erilaisten ideoiden testailuun. Tuotantokäyttöön tarkoitettuja, kustomoituja tekoälyjä kannattaakin tehdä esimerkiksi hyödyntämällä OpenAI:n siihen tarkoitettuja rajapintoja, joista myös maksetaan erikseen käytön mukaan. Kyseiset rajapinnat vertautuvat esimerkiksi Digitrafficin rajapintoihin, joiden käytön ennustan myös tulevaisuudessa maksavan ainakin joillekin ulkoisille käyttäjille – koska palvelulla on arvoa. Ilmainen palvelu on ollut todennäköisesti Digitrafficin alkutaipaleella oikea ratkaisu ja se on aina syytä säilyttää jatkossakin osalle käyttäjistä, mutta osan kohdalla palvelu alkaa olla sen verran hyvää sekä oletettavasti myös kapasiteetiltaan raskasta, että siitä ollaan valmiita myös maksamaan. Valtion toimijan rooliin myös kuulunee ehkä tarjota jotain peruspalvelua ilmaiseksi, mutta varmaan jossain menee maksullisuuden raja, sillä suurempi käyttö aiheuttaa suurempia kustannuksia, niin Digitrafficille kuin OpenAI:lle. Lisäksi tähän sisältyy ympäristöystävällisyys -aspekti, sillä maksullisuuden avulla voi ohjata käyttäjät käyttämään palvelua (= kuormittamaan ympäristöä) vain sen verran, kun on optimaalista.Laitan omat pelimerkit anyway sen puolesta, että jokin euro kilahtaa myös Digitrafficin kassaan tulevaisuudessa 😊

Asiaan – eli esitellään kustomoitu tekoäly ”Rautatie Asiantuntija”

Ensin kuitenkin tuttu vastuuvapautuslauseke…

Tähän paikkaan varmaan on lisättävä extra disclaimereita aiempien lisäksi. Sanotaan nyt vaikka alkuun, että kyseessä ei ole oikeasti vielä kovin kummoinen asiantuntija – vai onko? Eikä myöskään salainen, vaikka kyseisen sanan avulla saattoi päästä myös IT:n filtereihin. Tämän postauksen tarkoitus on lähinnä antaa vähän pintaraapaisua siitä, mitä tekoälymallien avulla on mahdollista alkaa ideoimaan ja myös toteuttamaan jo hyvin matalalla kynnyksellä sekä lyhyessä ajassa. Kustannuksena tällaisen toteuttamiseksi on $20/kk maksava ChatGPT Plus -tili, jota kuvittelisin, että työnantajakin saattaa ainakin joissain rooleissa tukea (ja myöhemmin ehkä Enterprise-lisenssin välityksellä tarjota), mikäli saa vastineeksi ainakin kasan ideoita harkittavaksi ”oikeisiin” toteutuksiin. Tai antamatta ideoita eteenpäin, voi suoraan itse (ainakin yksinkertaisten toteutusten osalta) rakentaa oman, kustomoidun tekoälyn, liittyi se sitten työhön tai muuhun elämään. Työhön liittyvissä toteutuksissa kannattaa toistaiseksi muistaa säännöt sisäisen tiedon antamisesta tekoälyn käyttöön, johon varmasti tulee myös nykyistä parempia ratkaisuja tarjolle kehityksen myötä firman puolesta. ”Rautatie Asiantuntija” on koulutettu vain julkisella tiedolla (siitä tarkemmin kohta).

… mutta heti perään kannustus kokeilemaan samaa

Lisätään myös, että ”Rautatie Asiantuntijan” kaltaisen tekoälyn tekeminen ei vaadi ohjelmointitaitoja tai muutenkaan kovin ihmeellisiä ”ATK”-taitoja. Vastaavan voi ohjelmoida täysin luonnollisella kielellä. Samalla oppii kuitenkin todennäköisesti tekemään hieman parempia prompteja (mikä on helppoa) ja myös vastaavien, about ilmaisten, helppojen ja nopeiden tekoälyjen kykyjen rajoista tällä hetkellä.

Riskit toiseen kertaan, enjoy

Analysoin joskus toisessa postauksessa ehkä enemmän mitä riskejä näihin liittyen kehityksen myötä voi syntyä. Mainitaan nyt yhtenä, että pitkällä tulevaisuudessa voi olla vaarana, että katoaa riittävä kriittisyys tekoälyn antamia vastauksia kohtaan. Lähdekritiikkiin pitäisi kuulua, ihan vastaavasti kuin googlaamiseen, tarkistaa vastaukset alkuperäisistä, luotettavista lähteistä. Tämä riski lähdekritiikin heikkenemisestä on analoginen GitHub Copilotin käytön ”laiska koodaus” -riskin kanssa, jonka toin esiin edellisessä postauksessa. Ja toisena haasteena on helppo mainita, että aika todennäköisesti ”Rautatie Asiantuntija” antaa jo seuraavissa esimerkeissä epätäydellisiä tai ehkä jopa vääriä vastauksia. Mutta tosiaan tämän postauksen tarkoitus onkin enemmänkin herättää hieman inspiraatiota tekoälyn mahdollisuuksista ja saada toivottavasti edes yhden tai pari henkilöä kokeilemaan hommaa itse.

Snadia alkusäätöä ja “JT” haltuun

Siirrytään kokeilemaan. Nimen ja profiilikuvan hyväksyttyäni (toistaiseksi…), valitsin alkuun uuden tekoälymme tyyliksi olla tarkka ja yksityiskohtainen vastauksissa. Tämä koska ajattelin alkuun opettaa ”Rautatie Asiantuntijalle” jonkun rautatieohjeen ja ohjeiden osalta olisi syytä yrittää olla tarkkana eikä hallusinoida liikaa. Lisäksi pyysin lisäämään vastauksiin linkin lähteeseen sekä keskeisimmät kappalenumerot, mihin vastaus perustui. Jälkimmäinen sen vuoksi, että käyttäjä pääsisi helpommin tarkastamaan itse vastauksen oikeellisuuden. Latasin alkuun ”Rautatie Asiantuntijalle” JT:n, eli ”Junaliikenteen ja vaihtotyön turvallisuussäännöt” liitteineen, jotka löytyvät Väylän rautatieohjeista.

Tämän jälkeen olikin aika testata ”Rautatie Asiantuntijan” osaamista:

Pelottavan lupaava alku

Jätän lukijoiden arvioitavaksi itse vastauksen laadun, mutta itselleni ehkä tässä vaiheessa oli oleellista, että 30–60 minuutin säädöllä sai ”Rautatie Asiantuntijan” omaksumaan ihan ok näköisesti yksityiskohtaista tietoa ja sai säädettyä myös sen antamaan relevantit lähteet, joista käyttäjä voi itse tarkistaa vastauksen oikeellisuuden. Suurin osa ajasta meni nimenomaan lähteiden saamiseen mukaan vastaukseen linkkeineen. Luonnollisella kielellä ohjelmoiduilla tekoälyillä on hieman taipumusta unohtaa antaa lähteet heti vastauksen yhteydessä, mutta ne saa tietty myös aina saatavilleen vain pyytämällä linkkiä tai linkkejä edelliseen vastaukseen liittyen. Lisäksi oleellista itselleni oli, että ainakin mielestäni vastaus ja käyttökokemus kokonaisuutena voittaa saman asian googlaamisen. Tämä lienee samalla ensimmäinen mittari sille, että hommassa on mitään järkeä ja antoi rohkaisua jatkaa eteenpäin.

“Rautatie Asiantuntija” ja sen loistava koulutus tekee selvän pesäeron markkinoiden parhaaseen yleiseen malliin

Seuraavaksi kokeilin kysyä huvikseen samaa kysymystä normaalilta ChatGPT:ltä (GPT-4), joka siis ei ole ”Rautatie Asiantuntija”, kuten esimerkkimme tekoälytoteutus: (huom, viimeisen sanan osalta promptin ero tuli vahingossa, kun taisin haluta ohjaamaan tekoälyä junaliikenteen pariin – en usko että vastauksen laatu olisi parantunut ilman sitä)

Tavallaan ihan hyvä vastaus epäselvään kysymykseen, mutta ei sitä mitä haettiin. GPT-4:lle on luonnollisesti opetettu hyvinkin laajasti Internetin sisältöä, mutta opetus ei ole mennyt kustannussyistä sisälle esimerkiksi pitkiin, pdf-muotoisiin dokumentteihin ja ei välttämättä menekään, vaan se jää eri firmojen ja toimialojen itsensä koulutettavaksi, mikäli näkevät sillä arvoa.

JT [x]

Seuraavaksi takaisin ”Rautatie Asiantuntijan” pariin ja kysytään jotain simppeliä. Vastaus taisi olla suunnilleen oikein, kun katsoin ohjeesta nopeasti, mutta ehkä oleellisempaa, että tekoälyn kanssa pystyy käymään myös tekstiviestikielen kaltaista, nopeaa viestintää ja se saattaa usein riittää järkevään vastaukseen.

Kyllästyttyäni JT-ohjeisiin, kokeilin seuraavaksi ladata ”Raide Asiantuntijalle” OVRO:n eli ”Ohje varautumisesta rautatieonnettomuuksiin”, jälleen Väylän rautatieohjeista. Tähän liittyen tuli mieleen kouluttaa tekoälyllemme lisäksi Traficomin määräys ” Valmiussuunnittelun järjestäminen liikennejärjestelmässä”.

Ovron ja Traficomin valmiussuunnittelun todellisen testin paikka

Totesin, että meiltä löytyy varmaan itseäni parempia henkilöitä jälleen arvioimaan, ovatko nämä keskeisimmät nostot kyseisestä ohjeesta sekä määräyksestä. Jatkoin kuitenkin ”Rautatie Asiantuntijan” hiillostamista:

Kuulostanee oikeansuuntaiselta, ehkä. Huomasin, että samalla tekoälymme alkoi unohtaa linkkien lisäämisen jokaisen vastauksen yhteyteen. Paremmissa toteutuksissa on oleellista varmistaa, ettei näin käy – ja se onnistuukin. Linkit ja mahdollisesti relevantit kappalenumerot sai kuitenkin perästä:

Tämän jälkeen jatkoin ”Rautatie Asiantuntijan” hiillostamista yhä tiukemmilla kysymyksillä:

Jopa liikuttavasti kaikki ”Rautatie Asiantuntijalle” tähän asti opetetut ohjeet ja määräykset ovat siis sopusoinnussa keskenään – hienoa! Toki muuta en olettanut.

Maksimaalinen annos luovuutta loppuun, minkä alalla kehtaa

Loppuun kokeilin vielä helpottaa rautatiekouluttajiemme työtä laatimalla tenttikysymyksen ohjeisiin liittyen:

En tiedä kelpaisiko kysymys ainakaan sellaisenaan oikeaan tenttiin, mutta toisaalta sitä olisi helppo parantaa antamalla parempia jatko-ohjeita tekoälylle.

Tämän jälkeen kokeilin vielä ladata ”Rautatie Asiantuntijalle” koko Raideliikennelain. Tässä vaiheessa huomasin, että tämän simppelin tekoälyjen rakennustyökalun rajat opetussisällössä alkoivat tulla vastaan. Esimerkiksi se alkoi unohtamaan alkupäästä ”JT”:n sisältöä. Tämä on ihan ymmärrettävää, sillä tekoälyn koulutus syö opetussisällön koon mukaan laskentakapasiteettia ja tämän enempää OpenAI ei halua, että käytän sitä maksamatta siitä erikseen (mikä olisi kyllä mahdollista). Tämä on aika oleellista myös siitä näkökulmasta, että esimerkiksi botit tai minäkään emme pääse käyttämään laskentatehoa tämän enempää, jollemme näe sillä myös arvoa. Ainakin markkinatalouden näkökulmasta tämän pitäisi ohjata hieman parempaan ympäristöystävällisyyteen tekoälyn käytön suhteen, kuten alussa viittasin myös Digitrafficin osalta. Yleensä on ihan hyvä mittari jonkin asian hyödyllisyydelle, että onko valmis maksamaan siitä.

Tuomio: no on tää kyllä aika kovis

En ole ihan varma paljonko olisin / firma olisi vielä tässä vaiheessa valmis maksamaan ”Raide Asiantuntijasta” – päättäkää te. Sanoisin kuitenkin, että yksi $20 kk-veloitus ei ole mun mielestä mennyt ainakaan hukkaan. Näen edessä aika selkeästi polun tätä esimerkkiä parempiin toteutuksiin, joilla on meille enemmänkin arvoa. Tämän blogitekstin kirjoittamiseen ja taittamiseen taisi mennä pidempi aika kuin itse toteutukseen, joka vaikutti ihan järkevältä 2–3 tunnin kokeiluksi.

Testasin lisäksi toisella tekoälyinstanssilla, että se saatiin yhdistettyä Digitrafficin avoimen rajapinnan kanssa, mihin vierähtikin pidempään, kun päästiin myös korjailemaan tai parantamaan samalla Digitrafficin rajapintakuvauksia. Rajapintayhteyden kanssa tuli hyvinkin nopeasti datarajat vastaan ”ilmaisversiossa”. Mahdollisissa myöhemmissä toteutuksissa tuleekin tarkkaan miettiä niiden kuormittavuus sekä taloudellisesti, että eettisesti, esimerkiksi asettamalla omia rajoittimia koulutussisällön määrälle sekä jatkuvasti optimoimaan, että tekoälyä koulutetaan vain sen verran kuin sen käyttötarkoituksen kannalta on arvoa. Samoin toimitaan jatkuvasti myös laskentakapasiteetin optimoinnin kanssa meidän AWS-pilviympäristön suhteen, jossa esimerkiksi Raiteen liikenteenhallinnan työkalut pyörivät tälläkin hetkellä (tavoitetilassaan vain siltä osin kuin tällä sekunnilla on tarve).

Lisäksi on selvää, että sekä näiden tekoälyjen koulutus, että koulutus ylipäänsä tulee hyvin pitkään vaatimaan rinnalleen ihmistyötä, eikä ole automatisoitumassa – paitsi toivottavasti esimerkiksi tylsiltä, manuaalisilta työvaiheilta. Oikein käytettynä näkisin, että jokainen saa vähän tehtäväkohtaisesti vaihdellen (sekä henkilökohtaiseen elämään) jo melko pian ainakin kohtuullisen assistentin itselleen, jolta saattaa automatisoinnin, tekstin generoinnin ja tiivistysten lisäksi saada myös täydentäviä idiksiä.

Avatar
Timo Nieminen
https://selko.ai

Leave a Reply