Tekoäly tiedonhaussa: Etusivu

Tekoälyn hyödyntäminen tiedonhaussa

Tässä oppaassa käsitellään tekoälyä korkeakouluopinnoissa. Sisällön painopisteenä on tekoälyn hyödyntäminen tiedonhaussa, mutta nostamme esille myös tekoälyn käyttöön liittyviä eettisiä kysymyksiä. Tekoäly ja sen sovellukset kehittyvät nopeasti, samalla tavalla tämä opas on koko ajan työn alla. Käy tarkistamassa päivitykset ja seuraa alan kehitystä tai anna oppaasta kehittämisehdotuksia sähköpostitse.

Tekoäly on laaja käsite, joka tarkoittaa tietokonejärjestelmien kykyä suorittaa tehtäviä ja prosesseja, jotka normaalisti vaativat ihmisen älykkyyttä. Tällaisia tehtäviä voivat olla esimerkiksi kuvantunnistus, puheentunnistus, ongelmanratkaisu ja päätöksenteko. Tekoälyä hyödynnetään arjessamme jo monessa: erilaisten sovellusten antamissa suosittelulistoissa, kielenhuollossa, mainonnan kohdentamisessa, asuntojen hintojen ennustamisessa jne.


Keskeisiä käsitteitä

  • Tekoäly -Tekoälyllä tarkoitetaan koneen kykyä käyttää perinteisesti ihmisen älyyn liitettyjä taitoja, kuten päättelyä, oppimista, suunnittelemista tai luomista.
  • KoneoppiminenKoneoppiminen on tekoälyn osa-alue, jonka juuret ovat tilastotieteessä. Koneoppimismenetelmät oppivat annetun datan pohjalta ilman erillistä sääntöjen ohjelmointia. Ne parantavat suorituskykyään tietyssä tehtävässä sitä mukaa kuin lisää kokemusta tai dataa kertyy.
  • Suuret kielimallitSuuri kielimalli (”large language model”, LLM) tarkoittaa sanojen ja sanajonojen esiintymisen todennäköisyyksille perustuvaa mallia. Ne ennustavat annetulle tekstisyötteelle jatkoa tai tuottavat pyydetyn mukaista tekstiä.
  • Generatiivinen tekoälyGeneratiivinen tekoäly yhdistää koneoppimisen, syväoppimisen ja tekoälyn tehon. Se pystyy luomaan vastauksena sille annettuun pyyntöön alkuperäistä sisältöä esimerkiksi tekstiä, videoita, ääntä, koodia tai kuvia. Generatiivista tekoälymallia koulutetaan datan ja palautteen avulla ja tämän perusteella se pystyy luomaan yhä uusia innovatiivisia tuotoksia. OpenAI-niminen yritys julkaisi tekstiä generoivan ChatGPT-palvelun vapaasti käytettäväksi marraskuussa 2022 ja alkuvuodesta 2023 tekoäly nousi laajasti julkisuuteen ja käyttöön.

Laurean linjaukset

Laurea-ammattikorkeakoulun opiskelija ja henkilökunta

Tiivistelmä linjauksesta:

  • Tekoälyn käyttö on lähtökohtaisesti sallittua ja sen hyödyntämisestä on aina kerrottava.
  • Opinnäytetyössä ja tekstiä tuotettaessa tulee aina käyttää alkuperäisiä lähteitä (artikkeleita, kirjoja jne).
  • Jos opiskelija käyttää tekoälyä tehtävässä tai opinnäytetyössä, esimerkiksi osana tekstinhuoltoa, on tästä aina mainittava.
  • Lähde on aina mainittava, myös silloin, jos teksti on tuotettu tekoälyn avulla. Tekoälyä ei voi käyttää suoraan asiantuntijalähteenä, ja tekoälyn tuottamien tekstien lähteiden oikeellisuus tulee tarkistaa.
  • Opiskelija on aina itse vastuussa palauttamansa tekstin sisällöstä.
  • Opiskelijoilta odotetaan vastuullista ja eettistä tekoälysovellusten käyttöä, tekoälyä ei tule käyttää loukkaavalla tai sovellettavia lakeja, sääntöjä tai määräyksiä rikkovalla tavalla.
  • Yksityisyydestä, tietosuojasta ja tekoälypalvelun käyttöehdoista tulee huolehtia. Tekoälypalveluiden käyttäminen voi joskus vaatia henkilökohtaisten tietojen luovuttamista, kuten nimeä tai sähköpostiosoitetta. Opiskelijoiden ja opettajien tulee varmistaa, että he antavat vain tietoja, joita he ovat valmiita jakamaan. Palveluissa ei tule käsitellä luottamuksellisia tietoja, esimerkiksi työelämäkumppanin liiketoimintaan liittyen.

Ohjeistusta päivitetään ja tarkennetaan!

ChatGPT ja muut keskustelevat tekoälytyökalut

ChatGPT on OpenAI:n palvelu, josta on olemassa ilmainen (GPT 3.5)  ja maksullinen versio (GPT4). Sovellus löytyy osoitteesta https://chat.openai.com/chat. Käyttäminen vaatii rekisteröitymisen.

Palvelua käytetään niin, että sille kirjoitetaan tekstiä (prompt) ja se vastaa käyttäjän antamaan tekstisyötteeseen. Palvelun kanssa voi siis ikään kuin käydä dialogia käyttäjän haluamasta aiheesta.

ChatGPT on koulutettu valtavilla tekstimassoilla, se generoi oppimiensa tekstien pohjalta tilastollisen mallin perusteella vastaukset. Yksinkertaistettuna sitä voi verrata kännykän ennakoivaan tekstinsyöttöön. Se ei siis tiedä mitään, sen ilmaisversiolla ei ole pääsyä internettiin, eikä palvelua voi käyttää tietolähteenä. Se ei myöskään osaa arvioida tuottamansa tekstin luotettavuutta ja voikin väittää tosiksi epätosia asioita. OpenAI ei ole luovuttanut tietoja ChatGPT:n kouluttamiseen käytetyistä tiedoista. Kannattaa myös muistaa, että tekoälymallit ovat tunnetusti puolueellisia.

Muita keskustelevia tekoälytyökaluja: 

  • Bard (englanninkielinen) - Googlen keskusteleva tekoäly pyrkii ilmoittamaan käyttämänsä lähteet ja on integroitu Google-hakuun
  • Bard (suomenkielinen)  - Googlen keskustelevan tekoälyn suomenkielinen aloitussivu
  • Bing - Microsoftin Bing-chat yhdistää tekoälyn hakukoneeseen ja ilmoittaa tuotetun vastauksen pohjana käytetyt lähteet (yleensä 4-6 kpl). Toisinaan lähteet ovat aivan oivallisia, toisinaan taas eivät.
  • Consensus - hakukone, joka käyttää kielimalleja akateemisten tutkimusjulkaisujen väittämien löytämiseen ja syntetisointiin, ei varsinainen chattibotti.
  • Perplexity - Tekoälyyn perustuva keskusteleva hakukone, joka antaa vastauksia kysymyksiin kielimallien avulla ja tarjoaa muutamia verkkolähteitä kysyttyyn aiheeseen liittyen. Focus-toiminnon avulla voit määritellä minkälaisia lähteitä (all, academic, Youtube, Reddit, Wolfram|Alpha) vastauksen luomiseen käytetään.

ChatGPT tiedonhaun apuna

Aiheeseen orientoituminen

  • Voit käyttää ChatGPT:tä inspiraation apuna tutkimuskysymystä ideoidessa ja muotoillessa. Varaudu siihen, että se saattaa sisällyttää keskusteluun ennakkoluuloisia oletuksia. Ja muista, että sitä on koulutettu vuoteen 2021 asti olevilla tiedoilla, sillä ei ole tietoa uusimmista tutkimustuloksista. 

Haun valmistelu

  • ChatGPT voi auttaa löytämään hyviä hakusanoja tiedonhakuusi. Kannattaa pyytää ChatGPT:tä täydentämään sen antamaa hakusanalistaa useita kertoja, eikä tyytyä ensimmäiseen vastaukseen. Huomaa, että se ei kuitenkaan korvaa tarvetta tutustua alan sanastoihin ja tarkistaa alan asiantuntijoiden käyttämiä termejä. 
  • ChatGPT voi auttaa sinua tunnistamaan aiheeseesi sopivia työkaluja tai tietokantoja. Huomaa, että se ei välttämättä anna kattavaa vastausta saatavilla olevista alakohtaisista tietokannoista. Se ei myöskään osaa kertoa, tilaako kirjastomme tietyn tietokannan. Kattavan tiedon alakohtaisista ja monialaisista tietolähteistä saat kirjaston tietokantojen listauksesta.
  • Huomaa, että ChatGPT:tä ei ole koulutettu muotoilemaan hakulauseita tieteellisen tiedon etsimistä varten. Jos pyydät sitä rakentamaan sinulle hakulauseita, joudut todennäköisesti muokkaamaan ja muotoilemaan ne uudelleen. 

Haun suorittaminen

  • ChatGPT ei voi auttaa sinua varsinaisessa tiedonhaussa. Se ei osaa hakea tietoa järjestelmällisesti ja läpinäkyvästi. 
  • ChatGPT voi kertoa, miten tietokanta toimii. Suosittelemme kuitenkin, että tarkistat käyttöohjeet suoraan valitsemastasi tietokannasta. Toiminnot ovat saattaneet muuttua vuoden 2021 jälkeen, ja ChatGPT:n vastaus voi hyvinkin olla vanhentunut.

Tulosten arviointi

  • Et voi käyttää ChatGPT:tä hakutulosten arviointiin. Tiedon arviointi on inhimillinen taito, joka perustuu kriteereihin, joita itse pidät merkityksellisinä. Tutkijana tai opiskelijana, tiedonhakijana, sinun on päätettävä, onko lähde merkityksellinen työsi kannalta.
  • Voit kuitenkin käyttää ChatGPT:tä vaikeiden tekstien selventämiseen ja kääntämiseen, sillä se on hyvä tiivistämään tai muotoilemaan tekstiä uudelleen. Muista kuitenkin lähdekriittisyys eli älä usko kaikkea ja että palvelu voi esittää virheellisia tietoja.

Viittaaminen ja lähdeviitteet

  • ChatGPT ei pysty antamaan oikeita lähteitä kirjoittamilleen teksteille. Se pystyy kyllä tuottamaan lähdeluettelon pyydettäessä, mutta yleensä lähteet ovat virheellisiä tai täysin keksittyjä.
  • ChatGPT ei myöskään pysty luomaan lähdeluetteloita viittausmallien mukaisesti. Viitteidenhallintaohjelmat, kuten Zotero ja muut vastaavat tukevat lukemattomia viittaustyylejä ja ovat hyviä työkaluja siihen tarkoitukseen.

Huomioi aina käyttäessäsi tekoälysovelluksia, miten ne käsittelevät syöttämääsi dataa. Lähtökohtaisesti kaikki tekoälypalveluihin syötetty materiaali tallentuu EU/EEA-alueen ulkopuolelle eikä ole sieltä poistettavissa. Palveluihin ei saa syöttää esimerkiksi henkilötietoja, yrityssalaisuuksia, luottamuksellisia tietoja tai salassa pidettäviä tietoja.

Ohje miten rajoitat syötteittesi käytön tekoälyn kouluttamisessa ChatGPT:ssä.

Tekoälyyn viittaaminen

Pitäisikö minun viitata ChatGPT:hen?

Kyllä, jos olet käyttänyt ChatGPT:tä työssäsi, sinun on mainittava kaikki sen käyttö. Tarkista oman korkeakoulusi ohjeet:

Miten teet lähdeviitteen ChatGPT:hen tietyn viittaustyylin mukaan? Katso ohjeita esim.: https://www.scribbr.com/ai-tools/chatgpt-citations/.

  • Esimerkiksi APA-tyylisen lähdeviitteen kaava: 
    OpenAI. (Year). ChatGPT (Month Day version) [Large language model]. https://chat.openai.com

Omien tekstien (vastaukset tehtäviin, esseet jne.) kirjoittaminen ChatGPT:llä katsotaan useimmissa oppilaitoksissa plagioinniksi tai epärehellisyydeksi, vaikka mainitsisitkin lähteen. ChatGPT:n käyttämistä tällä tavoin ei suositella.

Opiskelijan tarkistuslista

  • Keskustele opinnon opettajan kanssa hyvissä ajoin, onko tekoälysovellusten (ja minkä) käyttö sallittua ja millä tavoin.
  • Tutustu tekoälysovelluksiin etukäteen: mihin ne pystyvät tiedonhaun tukena, mihin eivät, vertaile tuloksia.
  • Mieti, mihin voit käyttää tekoälysovellusta tiedonhaussa, ja mihin et.
  • Tutustu käyttämääsi tekoälysovellukseen: kuka sitä ylläpitää ja miksi; onko sen käyttö maksullista tai rajattua, vaikuttaako se tuloksiin?
  • Lähdekritiikki on yhä edelleen sinun tehtäväsi. Ole kriittinen tulosten suhteen: tee vertailevia otantoja eri tietoa tarjoavista lähteistä ja tarkista esim. tekoälyn tarjoamia viitteitä ja niiden saamia viittauksia tietokannoista.
  • Viittaa tekoälyyn ohjeiden mukaan, jos käytät sitä.

 

Kielimallit yhdistettynä hakukoneeseen

Kielimallin yhdistäminen internettiin ja hakukoneeseen mahdollistaa kielimallin vastaukset internet-hakujen perusteella. Esim. ChatGPT+pluginit, Bing Chat, Google Bard, Perplexity.ai ja You.com.

Toimintaperiaate:

  • Kielimalli tulkitsee käyttäjän kysymyksen ja mahdollisesti muotoilee sen uudelleen.
  • Hakukoneelle syötetään mallin ymmärryksen mukaan sopivat hakusanat ohjelmistorajapinnan kautta.
  • Hakukone palauttaa parhaita tuloksia kielimallille.
  • Kielimalli vastaa kysymykseen saamiensa lähteiden perusteella.

Tässäkin tapauksessa kielimalli voi hallusinoida tai tulkita lähteitä väärin. Ole siis lähdekriittinen. Useimmat työkalut edellyttävät kirjautumista.

Eettinen ja arvioiva käyttö

Generatiivinen tekoäly on työkalu, joka voi auttaa meitä jokapäiväisessä elämässä, työssä tai opiskelussa. Kuten minkä tahansa työkalun kohdalla, eettinen, arvioiva ja tarkoituksenmukainen käyttö on avainasemassa. 

  • Mis- ja disinformaatio:
    • Misinformaatio on puutteellista tai väärää tietoa, jota annetaan epähuomiossa eikä tarkoitus ole tahallisesti johtaa harhaan.

    • Disinformaatio on tietoisesti jaettua väärää tietoa, jonka motiivina voi olla muun muassa: poliittinen ja yhteiskunnallinen vaikuttaminen,  taloudellinen hyöty sekä ilkivalta

  • Informaatiolukutaito
    • Tekoälytyökalut eivät välttämättä ilmoita käyttämiään alkuperäisiä lähteitä, eivätkä ne välttämättä käytä sellaisia lähteitä, jotka täyttävät tieteellisen kirjoittamisen vaatimukset. Joissakin tapauksissa lähteet ovat osoittautuneet olemattomiksi tai epätarkoiksi. Jos käytät työkalua, joka tuottaa joitakin elementtejä työstäsi, työn arvostelevan henkilön on tiedettävä, mikä on sinun ja mikä muualta peräisin.  
    • Tekoälypohjaiset hakutyökalut saattaa vaikuttaa siltä, että se tekee tieteellistä tutkimusta helposti ja nopeasti.  Opiskelijan näkökulmasta tämä voi kuitenkin tarkoittaa, että opiskelija ei opi tärkeitä taitoja, kuten tieteellisen tutkimuksen perustaitoja kuten tiedonhakua, kriittistä arviointia ja ongelmanratkaisua.
  • Yksityisyyden suoja
    • Esimerkiksi ChatGPT:n käyttöä varten on luotava tili, mikä mahdollistaa tietojen keräämisen, mikä on yksityisyyden suojaan liittyvä ongelma. Tekoälytyökalut voivat vaatia antamaan puhelinnumeron tai muita henkilökohtaisia tietoja. Verkossa tulisi olla tarkkana siitä, mitä tietoja jakaa tiliä luodessaan.
    • Muista tutustua tarkkaan ohjelman tietosuojakäytäntöön ja käyttöehtoihin. Muista, että työkaluja käyttäessäsi keskustelusi tyypillisesti tallennetaan työkalun toimesta, ja niitä käytetään työkalun tarkoituksiin.
  • Tekijänoikeudet
    • Joissakin tapauksissa tekoälytyökalut voivat käyttää verkossa olevaa materiaalia ilman tekijöiden lupaa.Tekijänoikeuksien noudattaminen on osa akateemista hyvää tieteellistä käytäntöä, minkä vuoksi on erittäin tärkeää suhtautua kriittisesti tällaisten välineiden käyttöön akateemisessa työssä.

Muualla tuotettua tietoa akateemisista tekoälytyökaluista

Lisätietoa aiheesta

Helariutta, A., Jokiranta, H. & Marjamaa, M. 2023. Tiedonhaun kokeilukulttuuria: Tekoälyä käyttävät artikkelihaun työkalut. Kreodi 2/2023 http://urn.fi/URN:NBN:fi-fe2023060752750

TEEL, Zoë (Abbie); WANG, Ting; LUND, Brady. ChatGPT conundrums: Probing plagiarism and parroting problems in higher education practices. College & Research Libraries News, [S.l.], v. 84, n. 6, p. 205, june 2023. ISSN 2150-6698. Available at: <https://crln.acrl.org/index.php/crlnews/article/view/25931>. Date accessed: 03 aug. 2023. doi:https://doi.org/10.5860/crln.84.6.205.

Mitä tekoäly on?

What is AI? A video by Museum of Science, Boston (4,38)

Oppaan käyttöoikeudet

 

Tämä teos on lisensioitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä.

Oppaan pohjana on käytetty Tampereen yliopiston kirjaston Tiedonhaun opasta.

Laurea-kirjasto | Saavutettavuusseloste | Laurea Library | Accessibility statement