Datanhallinnan ja laskennan kehittämisohjelma

Opetus- ja kulttuuriministeriö toteuttaa tutkimus- ja innovaatiotoimijoiden kanssa datanhallinnan ja laskennan tutkimusinfrastruktuurien kehittämisohjelman vuosina 2017−2021. Kehittämisohjelmassa investoidaan noin 35 miljoonaa euroa datanhallinnan ja laskennan infrastruktuureihin sekä niihin liittyviin palveluihin.

Kehittämisohjelmalla päivitetään CSC – Tieteen tietotekniikan keskus Oy:n infrastruktuureja kansainvälisen yhteistyön varmistavalle tasolle. Uudistettava infrastruktuuri ja siihen liittyvät palvelut tarjotaan tutkimusyhteisön käyttöön aiempaa laajemmin.

Kehittämisohjelmassa huomioidaan erityisesti alan eurooppalainen tutkimusinfrastruktuuripolitiikkakehitys.

Laskennallisen ja datakeskeisen tutkimuksen tarpeita 

Suuren skaalan simulaatiot

  • Perinteinen suurteholaskenta, jonka hyödyntäjinä erityisesti fysikaalisten tieteiden edustajat
  • Tutkimuskohteina mm. ilmastonmuutos, avaruussää, fuusioreaktiot, tähtitieteen ja hiukkasfysiikan ilmiöt

Keskikokoiset simulaatiot

  • Materiaalitieteiden tutkimus, energiateknologiset haasteet, kemian ja muiden luonnontieteiden tutkimuskysymykset (esim. biofysikaalinen solun toiminnan simulointi)
  • Paikkatietoaineistojen hyödyntäminen
  • Kattavat laskenta-ajassa mitattuna ison osan CSC:n nykyisestä asiakaskäytöstä

Dataintensiivinen laskenta

  • Bioinformatiikan tutkimus, jonka tutkijat muodostavat tällä hetkellä suurimman dataintensiivisen laskennan käyttäjäryhmän CSC:llä
  • Kielitieteellinen tutkimus ja muut digitaaliset ihmistieteet
  • Data-analytiikan käyttö liiketoimintatiedon analysoinnissa ja taloustutkimuksessa

Dataintensiivinen laskenta sensitiivisellä datalla

  • Lääketieteellinen potilasaineistoihin perustuva tutkimus, esim. syöpä- ja epilepsiatutkimukset sekä geeni- ja kuvantamisdatan analysointi
  • Yhteiskuntatieteellisen tutkimuksen ja ihmistieteiden haastatteluaineistot sekä ääni-, kuva- ja videotallenteet
  • Rekisteriaineistot ja muut yksilöiviä henkilötietoja sisältävät aineistot
  • Edellyttää muun muassa paremman tietoturvatason ympäristöä ja työkaluja datan käyttöoikeuksien hallintaan

Tekoäly

  • Oppivien algoritmien ja moninaisten datalähteiden hyödyntäminen tieteen ja elinkeinoelämän haasteisiin, esim. keinonäkö ja älykäs liikenne
  • Käyttö laajenemassa uusille alueille, kuten bio- ja ihmistieteet, esim. luonnollisen kielen tutkimus

Internet of Things (IoT) ja datavirrat

  • Jatkuvan datavirran tietolähteiden hyödyntäminen, kuten mittaussatelliitit, säätutkat, sensoriverkostot, osakekurssit, sosiaalisen median viestivirrat
  • Internettiin kytkeytyvien datavirtalähteiden hyödyntäminen (esineiden Internet) esim. robotiikassa ja teollisuuden sovelluksissa