Siirry pääsisältöön

Tiedonhankinta

Tekoäly tiedonhaussa

Tällä sivulla käsitellään tekoälyä korkeakouluopintojen tiedonhaussa. Tekoäly ja sen sovellukset kehittyvät nopeasti, samalla tavalla tämä opas on koko ajan työn alla, käy tarkistamassa päivitykset ja seuraa alan kehitystä.

Keskeisiä käsitteitä

  • Tekoäly - Tekoälyllä tarkoitetaan koneen kykyä käyttää perinteisesti ihmisen älyyn liitettyjä taitoja, kuten päättelyä, oppimista, suunnittelemista tai luomista.
  • Koneoppiminen - Koneoppiminen on tekoälyn osa-alue, jonka juuret ovat tilastotieteessä. Koneoppimismenetelmät oppivat annetun datan pohjalta ilman erillistä sääntöjen ohjelmointia. Ne parantavat suorituskykyään tietyssä tehtävässä sitä mukaa kuin lisää kokemusta tai dataa kertyy.
  • Suuret kielimallit - Suuri kielimalli (”large language model”, LLM) tarkoittaa sanojen ja sanajonojen esiintymisen todennäköisyyksille perustuvaa mallia. Ne ennustavat annetulle tekstisyötteelle jatkoa tai tuottavat pyydetyn mukaista tekstiä.
  • Generatiivinen tekoäly - Generatiivinen tekoäly yhdistää koneoppimisen, syväoppimisen ja tekoälyn tehon. Se pystyy luomaan vastauksena sille annettuun pyyntöön alkuperäistä sisältöä esimerkiksi tekstiä, videoita, ääntä, koodia tai kuvia. Generatiivista tekoälymallia koulutetaan datan ja palautteen avulla ja tämän perusteella se pystyy luomaan yhä uusia innovatiivisia tuotoksia.

 

Xamkin tekoälylinjaukset

Tekoälyohjeita Xamkin opiskelijoille ja opettajille

Tekoälyohjeita Xamkin opettajille

Tekoäly ja lisensoidut aineistot

  • Xamkin lisensoituja aineistoja, esim. tieteellisiä artikkeleita tai e-kirjoja, ei saa syöttää mihinkään kielimalleihin tai muihinkaan tekoälytyökaluihin. CC-lisenssit eivät kumoa tätä sääntöä.

ChatGPT

ChatGPT on OpenAI:n palvelu, jossa voi käyttäjän valinnan mukaan käyttää eritasoista kielimallia, mm. ChatGPT (ilmainen) ja GPT4 (maksullinen). Sovellus löytyy osoitteesta https://chat.openai.com/chat. Sen käyttäminen vaatii OpenAI:n tunnukset.

Palvelua käytetään niin, että sille kirjoitetaan tekstiä (prompt) ja se vastaa käyttäjän antamaan tekstisyötteeseen. Palvelun kanssa voi siis ikään kuin käydä dialogia käyttäjän haluamasta aiheesta.

ChatGPT on koulutettu valtavilla tekstimassoilla, se generoi oppimiensa tekstien pohjalta tilastollisen mallin perusteella vastaukset. Yksinkertaistettuna sitä voi verrata kännykän ennakoivaan tekstinsyöttöön. Se ei siis tiedä mitään, sillä ei ole pääsyä internettiin, eikä sitä voi käyttää tietolähteenä. Se ei myöskään osaa arvioida tuottamansa tekstin luotettavuutta ja voikin väittää tosiksi epätosia asioita. OpenAI ei ole luovuttanut tietoja ChatGPT:n kouluttamiseen käytetyistä tiedoista. Kannattaa myös muistaa, että tekoälymallit ovat tunnetusti puolueellisia.

Huom! Open AI päivitti syyskuussa 2023 maksullisen ChatGPT-4, se pystyy nyt hyödyntämään internetiä. 

Aiheeseen orientoituminen

  • Voit käyttää ChatGPT:tä inspiraation apuna tutkimuskysymystä ideoidessa ja muotoillessa. Varaudu siihen, että se saattaa sisällyttää keskusteluun ennakkoluuloisia oletuksia. Ja muista, että sitä on koulutettu vuoteen 2021 asti olevilla tiedoilla, sillä ei ole tietoa uusimmista tutkimustuloksista. 

Haun valmistelu

  • ChatGPT voi auttaa löytämään hyviä hakusanoja tiedonhakuusi. Kannattaa pyytää ChatGPT:tä täydentämään sen antamaa hakusanalistaa useita kertoja, eikä tyytyä ensimmäiseen vastaukseen. Huomaa, että se ei kuitenkaan korvaa tarvetta tutustua alan sanastoihin ja tarkistaa alan asiantuntijoiden käyttämiä termejä. 
  • ChatGPT voi auttaa sinua tunnistamaan aiheeseesi sopivia työkaluja tai tietokantoja. Huomaa, että se ei välttämättä anna kattavaa vastausta saatavilla olevista alakohtaisista tietokannoista. Se ei myöskään osaa kertoa, tilaako kirjastomme tietyn tietokannan. Kattavan tiedon alakohtaisista ja monialaisista tietolähteistä saat kirjaston Tietokannat A-Z -listalta.
  • Huomaa, että ChatGPT:tä ei ole koulutettu muotoilemaan hakulauseita tieteellisen tiedon etsimistä varten. Jos pyydät sitä rakentamaan sinulle hakulauseita, joudut todennäköisesti muokkaamaan ja muotoilemaan ne uudelleen. 

Haun suorittaminen

  • ChatGPT ei voi auttaa sinua varsinaisessa tiedonhaussa. Se ei osaa hakea tietoa järjestelmällisesti ja läpinäkyvästi. 
  • ChatGPT voi kertoa, miten tietokanta toimii. Suosittelemme kuitenkin, että tarkistat käyttöohjeet suoraan valitsemastasi tietokannasta. Toiminnot ovat saattaneet muuttua vuoden 2021 jälkeen, ja ChatGPT:n vastaus voi hyvinkin olla vanhentunut.

Tulosten arviointi

  • Et voi käyttää ChatGPT:tä hakutulosten arviointiin. Tiedon arviointi on inhimillinen taito, joka perustuu kriteereihin, joita itse pidät merkityksellisinä. Tutkijana tai opiskelijana, tiedonhakijana, sinun on päätettävä, onko lähde merkityksellinen työsi kannalta.
  • Voit kuitenkin käyttää ChatGPT:tä vaikeiden tekstien selventämiseen ja kääntämiseen, sillä se on hyvä tiivistämään tai muotoilemaan tekstiä uudelleen. Muista kuitenkin lähdekriittisyys eli älä usko kaikkea ja että palvelu voi esittää puolueellisia näkemyksiä.

Viittaaminen ja lähdeviitteet

  • ChatGPT ei pysty antamaan oikeita lähteitä kirjoittamilleen teksteille. Se pystyy kyllä tuottamaan lähdeluettelon pyydettäessä, mutta yleensä lähteet ovat virheellisiä tai täysin keksittyjä.
  • ChatGPT ei myöskään pysty luomaan lähdeluetteloita viittausmallien mukaisesti. Viitteidenhallintaohjelmat, kuten Zotero ja muut vastaavat tukevat lukemattomia viittaustyylejä ja ovat hyviä työkaluja siihen tarkoitukseen.

Huomioi aina käyttäessäsi tekoälysovelluksia, miten ne käsittelevät syöttämääsi dataa. Lähtökohtaisesti kaikki tekoälypalveluihin syötetty materiaali tallentuu EU/EEA-alueen ulkopuolelle eikä ole sieltä poistettavissa. Palveluihin ei saa syöttää esimerkiksi henkilötietoja, yrityssalaisuuksia, luottamuksellisia tietoja tai salassa pidettäviä tietoja.

Ohje miten rajoitat syötteittesi käytön tekoälyn kouluttamisessa ChatGPT:ssä.

Muokattu kuvasta ”Is it safe to use ChatGPT for your task?” By Aleksander Tiulkanov CCBY

Microsoft Copilot

Microsoft Copilot (entinen Bing Chat Enterprise) on keskusteleva tekoälysovellus (kielimallina GPT-4 ja kuvamallina DALL-E 3). Copilot osaa hakea tietoja myös suoraan internetistä ja osaa luoda sanallisen kuvailun perusteella kuvia.

Copilot on käytettävissä Xamkin henkilökunnalla ja opiskelijoilla 

Copilotilla käsiteltävät tiedot eivät tallennu tekoälylle eikä tiedoilla kouluteta tekoälyä. Tekoälyn kanssa käydyn keskustelun viestit tuhoutuvat automaattisesti keskusteluistunnon päätyttyä. Katso lisätiedot Copilotin tietosuojasta

Tekoäly tieteellisen tiedon haussa

Tässä esitellään sovelluksia, joissa tekoälyä hyödynnetään lähinnä ulkomaisen tieteellisen tiedon haussa.

Esiteltyihin palveluihin ei ole organisaatiolisenssiä ja niiden kokeileminen ja käyttö on käyttäjän omalla vastuulla, muista tietoturva. Huomaa myös, että palvelut voivat muuttua maksullisiksi tai hävitä markkinoilta.

Keenious

  • Käytössä maksuton ja maksullinen versio. Maksullinen versio, Keenious Plus, sisältää enemmän ominaisuuksia kuin maksuton versio. Kirjautuneena saa käyttöönsä enemmän ominaisuuksia.
  • Työkalu, joka hyödyntää olemassa olevaa tekstiä tiedonhaun pohjana, se etsii sille syötetyn valmiin artikkelin tai muun tekstin pohjalta saman aiheisia artikkeleita. Artikkelihaun lisäksi Keenious tuottaa aihelistan, jonka se tulkitsee sille syötettyyn tekstiin liittyvän. Tämän perusteella hakija voi tarkentaa hakuaan haluamaansa suuntaan.
  • Työkalua voi käyttää verkkosivun lisäksi myös Word tai Google docs plug-in:n avulla.

Semantic Scholar

  • Vapaasti käytettävissä, mutta rekisteröitymällä saa käyttöönsä enemmän ominaisuuksia.
  • Haku on samantyyppinen sanahaku kuin Google Scholarissa.
  • Näyttää artikkelin viittaukset ja pyrkii löytämään viitatuimpien artikkeleiden lisäksi myös kaikkein merkityksellisimmät artikkelit. Se tekee myös artikkelisuosituksia käyttäjän valitsemien artikkeleiden pohjalta.
  • Sopii käyttäjälle, jolla on kiinnostusta suodattaa ja järjestää hakutulosta ja tallentaa artikkeleita uusien artikkelisuositusten saamiseksi.

Elicit

  • Palvelun käytön aloittaminen on maksutonta, mutta käyttö edellyttää kirjautumista. Palvelu muuttuu maksulliseksi kun tietty käyttömäärä ylittyy. Käytön määrä määrittelee hinnan.
  • Työkalu hakee ja tiivistää tieteellisiä artikkeleita sille annettuun tutkimuskysymykseen tai artikkeliin perustuen. Hakutulossivulla Elicit ei ilmoita perinteisistä hakupalveluista poiketen hakutulosten määrää, vaan näyttää seitsemän relevanteinta artikkelia.
  • Elicit tarjoaa myös muita apuvälineitä akateemiseen työskentelyyn, se auttaa tutkimuskysymyksen muotoilussa ja artikkelien analysoinnissa ja tiivistelmien luonnissa.

Litmaps

  • Tarjolla maksuton ja maksullinen version, joissa on eroja artikkelien ja karttojen määrässä.
  • Tekee kirjallisuuskartan yhden julkaisun tiedoilla tai vaihtoehtoisesti useammasta julkaisusta BibTeX/RIS -tiedostoilla.
  • Litmaps näyttää tieteellisten artikkelien väliset suhteet dynaamisessa verkostograafimuodossa. Tekee ehdotuksia artikkeleista artikkelien välisiin yhteyksiin perustuen, joten se auttaa löytämään artikkeleita hakusanojen ulkopuolelta.

Research Rabbit

  • Vaatii tunnusten luomista.
  • Työkalun käytön voi alkaa yhden hyvän artikkelin lisäämisellä kokoelmaan. Työkalu luo suosituksia kokoelmasi perusteella perustuen otsikoihin, tiivistelmään ja muuhun metadataan.
  • Visualisoi muodostuneet julkaisujen väliset verkostot. Voit liikkua kartalla eteenpäin, luoda uusia julkaisuverkostoja myös tekijöillä ja lähteillä. Työkalu auttaa löytämään uusia yhteyksiä tutkittavien ilmiöiden ja tutkijoiden väliltä.

Tekoälyn eettinen käyttö tiedonhaussa

  • Generatiivinen tekoäly on työkalu, joka voi auttaa meitä jokapäiväisessä elämässä, työssä tai opiskelussa. Kuten minkä tahansa työkalun kohdalla, eettinen, arvioiva ja tarkoituksenmukainen käyttö on avainasemassa. 

 

  • Saako tekoälyä käyttää tehtävässä? Jos saa niin mihin? Ja miten siitä pitää raportoida?
  • Misinformaatio on puutteellista tai väärää tietoa, jota annetaan epähuomiossa eikä tarkoitus ole tahallisesti johtaa harhaan.

  • Disinformaatio on tietoisesti jaettua väärää tietoa, jonka motiivina voi olla muun muassa: poliittinen ja yhteiskunnallinen vaikuttaminen,  taloudellinen hyöty sekä ilkivalta

  • Tekoälytyökalut eivät välttämättä ilmoita käyttämiään alkuperäisiä lähteitä, eivätkä ne välttämättä käytä sellaisia lähteitä, jotka täyttävät tieteellisen kirjoittamisen vaatimukset. Joissakin tapauksissa lähteet ovat osoittautuneet olemattomiksi tai epätarkoiksi. Jos käytät työkalua, joka tuottaa joitakin elementtejä työstäsi, työn arvostelevan henkilön on tiedettävä, mikä on sinun ja mikä muualta peräisin.  
  • Tekoälypohjaiset hakutyökalut saattaa vaikuttaa siltä, että se tekee tieteellistä tutkimusta helposti ja nopeasti.  Opiskelijan näkökulmasta tämä voi kuitenkin tarkoittaa, että opiskelija ei opi tärkeitä taitoja, kuten tieteellisen tutkimuksen perustaitoja kuten tiedonhakua, kriittistä arviointia ja ongelmanratkaisua.
  • Esimerkiksi ChatGPT:n käyttöä varten on luotava tili, mikä mahdollistaa tietojen keräämisen, mikä on yksityisyyden suojaan liittyvä ongelma. Tekoälytyökalut voivat vaatia antamaan puhelinnumeron tai muita henkilökohtaisia tietoja. Verkossa tulisi olla tarkkana siitä, mitä tietoja jakaa tiliä luodessaan.
  • Muista tutustua tarkkaan ohjelman tietosuojakäytäntöön ja käyttöehtoihin. Muista, että työkaluja käyttäessäsi keskustelusi tyypillisesti tallennetaan työkalun toimesta, ja niitä käytetään työkalun tarkoituksiin.
  • Joissakin tapauksissa tekoälytyökalut voivat käyttää verkossa olevaa materiaalia ilman tekijöiden lupaa.Tekijänoikeuksien noudattaminen on osa akateemista hyvää tieteellistä käytäntöä, minkä vuoksi on erittäin tärkeää suhtautua kriittisesti tällaisten välineiden käyttöön akateemisessa työssä.

Tekoälyä ohjaavien kehotteiden eli promptien muotoilu

 

Tekoäly toimii kehotteiden eli promptien avulla. Tekoäly ei ole ajatustelukija, joten tuottaakseen toivomiasi tuloksia sinun tulee kuvata pyyntösi huolellisesti ja tarkentaa sitä tarvittaessa. Kehotteiden taitava suunnittelu ja rakentaminen (kehotemuotoilu/prompt engineering) onkin tekoälyn onnistuneen käytön edellytys. Tampereen korkeakouluyhteisön vinkkipankissa kuvataan perusasiat kehotteiden luomiseksi.

Tekoälyä ohjaavien kehotteiden eli promptien muotoilu | Vinkkipankki | Tampereen korkeakouluyhteisö (tuni.fi)

Opiskelijan tarkistuslista

  • Keskustele kurssin opettajan tai seminaarin ohjaajan kanssa hyvissä ajoin, onko tekoälysovellusten (ja minkä) käyttö sallittua työsi tiedonhaussa.
  • Tutustu tekoälysovelluksiin etukäteen: mihin ne pystyvät tiedonhaun tukena, mihin eivät, vertaile tuloksia.
  • Mieti, mihin voit käyttää tekoälysovellusta tiedonhaussa, ja mihin et.
  • Tutustu käyttämääsi tekoälysovellukseen: kuka sitä ylläpitää ja miksi; onko sen käyttö maksullista tai rajattua, vaikuttaako se tuloksiin?
  • Lähdekritiikki on yhä edelleen sinun tehtäväsi. Ole kriittinen tulosten suhteen: tee vertailevia otantoja eri tietoa tarjoavista lähteistä ja tarkista esim. tekoälyn tarjoamia viitteitä ja niiden saamia viittauksia tietokannoista.
  • Katso Xamkin lähdeohje: tekoälysovelluksen käyttämisestä tekstin tuottamisen tukityökaluna.

Tämä Tekoäly tiedonhaussa -opas pohjautuu Tampereen yliopiston kirjaston oppaaseen Tiedonhaun opas, Tiedonhaku ja tekoäly: https://libguides.tuni.fi/tiedonhaun-opas/tiedonhaku-tekoaly

Saavutettavuusseloste | Accessibility statement