Datanhallinnan ja laskennan kehittämisohjelma

Opetus- ja kulttuuriministeriö toteuttaa tutkimus- ja innovaatiotoimijoiden kanssa datanhallinnan ja laskennan tutkimusinfrastruktuurien kehittämisohjelman vuosina 2017−2021.

Kehittämisohjelmassa investoidaan 37 miljoonaa euroa datanhallinnan ja laskennan infrastruktuureihin sekä niihin liittyviin palveluihin. Hallitus päätti 33 miljoonan euron rahoituksesta vuonna 2017 ja 4 miljoonan euron lisärahoituksesta vuonna 2018.

Kehittämisohjelmalla on päivitetty CSC – Tieteen tietotekniikan keskus Oy:n infrastruktuureja kansainvälisen yhteistyön varmistavalle tasolle. Uudistettu infrastruktuuri ja siihen liittyvät palvelut tarjotaan tutkimusyhteisön käyttöön aiempaa laajemmin. CSC:n omaa sekä laajenevan käyttäjäkunnan osaamista on vahvistettu noin kahdella miljoonalla eurolla.

Kehittämisohjelmassa huomioidaan erityisesti alan eurooppalainen tutkimusinfrastruktuuripolitiikkakehitys. Eurooppalaisen rahoitusyhteistyön avulla rakennetaan maailman mittakaavassa kilpailukykyinen suurteholaskennan EuroHPC-ekosysteemi. CSC:n Kajaanin datakeskukseen sijoitettava LUMI-supertietokone avautuu asiakkaiden käyttöön vuonna 2021. Suomessa työskentelevien tutkijoiden saataville tulee myös kahden muun EuroHPC-supertietokoneen laskentakapasiteetti.

Laskennallisen ja datakeskeisen tutkimuksen tarpeita

Suuren skaalan simulaatiot

  • Perinteinen suurteholaskenta, jonka hyödyntäjinä erityisesti fysikaalisten tieteiden edustajat
  • Tutkimuskohteina mm. ilmastonmuutos, avaruussää, fuusioreaktiot, tähtitieteen ja hiukkasfysiikan ilmiöt

Keskikokoiset simulaatiot

  • Materiaalitieteiden tutkimus, energiateknologiset haasteet, kemian ja muiden luonnontieteiden tutkimuskysymykset (esim. biofysikaalinen solun toiminnan simulointi)
  • Paikkatietoaineistojen hyödyntäminen

Dataintensiivinen laskenta

  • Bioinformatiikan tutkimus
  • Kielitieteellinen tutkimus ja muut digitaaliset ihmistieteet
  • Data-analytiikan käyttö liiketoimintatiedon analysoinnissa ja taloustutkimuksessa

Dataintensiivinen laskenta sensitiivisellä datalla

  • Lääketieteellinen potilasaineistoihin perustuva tutkimus, esim. syöpä- ja epilepsiatutkimukset sekä geeni- ja kuvantamisdatan analysointi
  • Yhteiskuntatieteellisen tutkimuksen ja ihmistieteiden haastatteluaineistot sekä ääni-, kuva- ja videotallenteet
  • Rekisteriaineistot ja muut yksilöiviä henkilötietoja sisältävät aineistot
  • Edellyttää muun muassa paremman tietoturvatason ympäristöä ja työkaluja datan käyttöoikeuksien hallintaan

Tekoäly

  • Oppivien algoritmien ja moninaisten datalähteiden hyödyntäminen tieteen ja elinkeinoelämän haasteisiin, esim. keinonäkö ja älykäs liikenne
  • Käyttö laajenemassa uusille alueille, kuten bio- ja ihmistieteet, esim. luonnollisen kielen tutkimus

Internet of Things (IoT) ja datavirrat

  • Jatkuvan datavirran tietolähteiden hyödyntäminen, kuten mittaussatelliitit, säätutkat, sensoriverkostot, osakekurssit, sosiaalisen median viestivirrat
  • Internettiin kytkeytyvien datavirtalähteiden hyödyntäminen (esineiden Internet) esim. robotiikassa ja teollisuuden sovelluksissa