Kuvitus on luotu DALL-E -kuvageneraattorilla. Käytetty komento: Digital art in cubism style, a library being sucked into one 1990's style computer, which is wired into a blue glowing electrical brain, deconstructed into geometric shapes offering multiple angles simultaneously.

Tekoälyä tutkijoille: ihmisen ja koneen yhteispeli kirjallisuuskatsauksissa 

Yleistyvät tekoälytyökalut voivat parhaimmillaan helpottaa kirjallisuuskatsauksen aiheuttamaa työtaakkaa. Kone ei korvaa ihmistä, mutta tutkijan rooli on väistämättä murroksessa. 

Kirjallisuuskatsaus on välttämätön, mutta erittäin työläs ja aikaa vievä osa tutkimustyötä. Tieteellisiä tutkimuksia julkaistaan kiihtyvällä tahdilla, mikä lisää kirjallisuuskatsauksiin tarjolla olevan tiedon määrää. Tutkijoiden avuksi on saatavilla tekoälytyökaluja, joita on viime vuosina julkaistu lukuisia erilaisia. 

Tekoäly tarjoaa ratkaisuja ennen kaikkea kirjallisuuskatsauksen mekaanisimpiin työvaiheisiin. Näin työaikaa ja tutkijan aivokapasiteettia säästyy luovaa ajattelua, tulkintaa ja asiantuntemusta vaativiin tehtäviin. Tekoäly saattaa myös paljastaa tutkimusaiheen kannalta relevantteja töitä, jotka saattaisivat muutoin jäädä huomiotta. 

ChatGPT:n noustua suursuosioon tekoälykeskustelu on pyörinyt enimmäkseen juuri tekstiä ja kuvia tuottavan, laajaan kielimalliin perustuvan generatiivisen tekoälyn ympärillä. Chattibotti on kuitenkin vain yksi tekoälyn monista sovelluksista. 

”Yksinkertaisimmillaan tekoälyä voi hyödyntää kaksoiskappaleiden tunnistamiseen ja poistamiseen valmiiksi kootuista kirjallisuuslähteistä.”

Yksinkertaisimmillaan tekoälyä voi hyödyntää kaksoiskappaleiden tunnistamiseen ja poistamiseen valmiiksi kootuista kirjallisuuslähteistä. Tähän tarkoitukseen sopivat esimerkiksi Rayyan ja Covidence. 

Myös sopivien artikkelien etsimisessä voi käyttää apuna tähän tarkoitukseen kehitettyjä tekoälypalveluita. Kehittyneimmillä tekoälytyökaluilla voi jopa luonnostella tekstiä kirjallisuuskatsaukseen. Teknologia ei kuitenkaan ole aukotonta, joten sitä tulee käyttää varoen ja tekoälyn heikkoudet tiedostaen. 

Eri tekoälysovellukset sopivat eri työvaiheisiin 

Suunnittelun alkuvaiheessa tutkimuskysymystä voi yrittää sparrata laajaan kielimalliin perustuvan chattibotin, kuten ChatGPT:n avulla. Faktatiedon hakemisessa bottiin ei kannata luottaa, mutta botin kanssa käydyistä keskusteluista voi saada kehityskelpoisia ideoita katsauksen rajaamiseen. 

Myös tiedonhakustrategiaa voi kehittää tekoälyavusteisesti. Chattibotille voi syöttää manuaalisesti valittujen, relevanttien artikkelien otsikoita ja tiivistelmiä ja pyytää bottia tunnistamaan niissä esiintyviä yhteisiä teemoja ja avainsanoja. 

Markkinoilla on myös varta vasten tieteellisten artikkelien etsimiseen kehitettyjä palveluja. Research Rabbit on hakupalvelu, joka suosittelee tutkijalle sopivia artikkeleita samaan tapaan kuin Spotify suosittelee musiikkia kuuntelijan makuun perustuen. Palvelu myös esittää artikkelien välisiä viittaussuhteita verkostodiagrammina. 

”Markkinoilla on myös varta vasten tieteellisten artikkelien etsimiseen kehitettyjä palveluja.”

Tutkimusartikkelien etsiminen on toisteista ja aikaa vievää työtä, jota on mahdollista automatisoida tähän tarkoitukseen suunniteltujen työkalujen avulla. Nämä palvelut etsivät tieteellisiä artikkeleita tutkijan antamien hakutermien pohjalta ja suosittelevat lisää samankaltaisia artikkeleita sen perusteella, mitä tutkija valitsee mukaan katsaukseen. Hyvä lähtökohta on valita itse muutama avaintutkimus, joiden pohjalta tekoälyalgoritmit osaavat suositella lisää potentiaalisia artikkeleita. 

Kannattaa kuitenkin selvittää, mitä tietokantoja käytössä oleva työkalu skannaa. Tieteellisiä artikkeleita säilötään monissa eri tietokannoissa, joista osa on avoimia ja osa maksullisia. Elsevierin kaltaiset maksulliset tietokannat eivät välttämättä sisälly kaikkiin työkaluihin. 

Otsikko- ja tiivistelmätason seulonnassa tekoäly on tehokas apulainen, jolla voi poistaa joukosta epärelevantit artikkelit ja kaksoiskappaleet. Näin tutkijan työaika ja energia säästyy vaativampien rajatapausten pohtimiseen. 

Mitä pintapuolisempaa ja mekaanisempaa seulominen on, sitä todennäköisemmin työn voi ulkoistaa tekoälylle. Myös tieteenalalla on vaikutusta. Mitä rakenteellisempaa ja standardoidumpaa alan sanasto ja artikkelit ovat, sitä paremmin tekoäly todennäköisesti pärjää seulonnassa. 

”Mitä rakenteellisempaa ja standardoidumpaa alan sanasto ja artikkelit ovat, sitä paremmin tekoäly todennäköisesti pärjää seulonnassa.”

Seulonnan läpäisseiden artikkelien laadun arvioinnissa kannattaa kuitenkin olla tarkkana. Laadun arviointi vaatii esimerkiksi tutkimusmetodin tarkastelua, mikä voi olla tekoälylle liian monimutkainen tehtävä. 

Kielimalleihin pohjautuvat palvelut, kuten Elicit tai Elsevier Scopus AI, osaavat myös syntetisoida tekstiä katsaukseen sisällytettävistä artikkeleista. Tämä voi nopeuttaa kirjoitustyötä, mutta tutkijan tulee osata arvioida, onko tekoäly osannut tiivistää artikkelista oleellisen asiasisällön. Lisäksi mahdolliset virheet tulee osata tunnistaa. Siksi lähdemateriaalin tunteminen on olennaista. 

Tunne työkalu, jota käytät 

Tekoälyn käyttöön kirjallisuuskatsauksissa sisältyy myös hankalia kysymyksiä ja uudenlaisia haasteita. Ensinnäkin ihmisen rooli katsauksen tekijänä muuttuu. Tutkijan täytyy viime kädessä toimia laadunvalvojana ja tehdä lopulliset päätökset katsaukseen sisällytettävistä artikkeleista. On myös syytä pohtia, mitä työvaiheita tekoälylle voi ulkoistaa, ja miten tutkittava tieteenala vaikuttaa tekoälyn hyödyntämiseen.  

Toinen merkittävä haaste liittyy luotettavuuteen. Tieteellisen tutkimustiedon tulee olla luotettavaa, läpinäkyvää ja toistettavissa. Siksi tutkijan on tärkeää ymmärtää ja tehdä selväksi kirjallisuuskatsauksessa käytettyjen tekoälytyökalujen toimintaperiaatteet osana metodologiaa. 

Jos tekoäly on niin sanotusti ”musta laatikko”, jonka toimintaperiaatteet ovat tuntemattomat, sen tuottaman tiedon luotettavuutta on vaikea arvioida. Miten tutkijan tulisi siis suhtautua sinänsä toimiviin, mutta toiminnaltaan läpinäkymättömiin tekoälypalveluihin? Tämä on esimerkki hankalista kysymyksistä, joista tutkimuksen kentällä tarvittaisiin avointa keskustelua. Yksiselitteistä vastausta ei ole. 

”Käytetyn teknologian toimintaperiaatteiden tuntemus voi auttaa tutkijaa virheellisen tiedon ja vinoumien tunnistamisessa.”

Aivan kuin ihmiselle, myös tekoälylle voi syntyä vinoumia. Tähän voivat johtaa esimerkiksi tekoälyn käytettävissä olevat tietokannat ja mahdolliset algoritmin sisäiset vinoumat.  

Erityisesti kielimallit voivat myös tuottaa virheellistä tietoa eli niin sanotusti hallusinoida. Toisin kuin ihmiset, kielimallit eivät itse asiassa ymmärrä tuottamansa tekstin merkityksiä, mikä voi olla hämäävää. Virheiden välttämiseksi tekoälyn avustuksella luotu teksti on aina tarkistettava. Tutkija ei voi luovuttaa vastuutaan tutkimustulosten oikeellisuudesta tekoälylle. 

Käytetyn teknologian toimintaperiaatteiden tuntemus voi auttaa tutkijaa virheellisen tiedon ja vinoumien tunnistamisessa. Mitä paremmin tutkija tuntee käyttämänsä teknologian, sitä helpompi sen tuottamaa tietoa on arvioida ja tarvittaessa täydentää manuaalisesti. 

Antti Kailio

Asiantuntija, tiede ja päätöksenteko

Artikkeli on laadittu osana Jane ja Aatos Erkon säätiön rahoittamaa Tieteelliset Ilmiökartat -hanketta. Hankkeessa etsitään uusia ratkaisuja siihen, miten tieteen vaikuttavuutta voidaan edistää ja miten tutkittua tietoa saadaan tehokkaasti kanavoitua päätöksenteon tueksi. Julkaisemme kevään aikana sarjan tekoälyyn liittyviä artikkeleita, jotka avaavat tekoälyn hyödyntämisen potentiaalia ja rajoitteita. Lue lisää: Tieteelliset ilmiökartat -hanke.