Pro gradu: Suuri puhelutietokanta

Tämä teksti on vuodelta 2005.

Tässä on tietojenkäsittelytieteen opintoihini liittynyt Pro gradu -tutkielma, joka valmistui helmikuussa 1999. Tutkielman otsikko on Suuri puhelutietokanta, ja julkaisen sen nyt ensimmäistä kertaa netissä. Tutkielman sisältö oli salainen kaksi vuotta hyväksymispäivästä.

Gradun käyttöehto on Creative Commons Nimeä 3.0 Muokkaamaton. Suoran indeksoimisen ja suoran linkkiviittauksen estämiseksi tutkielma on suojattu salasanalla. Salasana on www.heikkisiltala.com ja tämän lisäksi tutkielma on suojattu tekstin kopioinnilta. Katselu ja tulostus on kuitenkin sallittu. Lataa tästä tutkielma PDF-muodossa (259 kt, 97 sivua).

  • Helsingin yliopisto
  • Tiedekunta/Osasto: Matemaattis-luonnontieteellinen
  • Laitos: Tietojenkäsittelytieteen laitos
  • Tekijä: Heikki Siltala
  • Työn nimi: Suuri puhelutietokanta
  • Oppiaine: Tietojenkäsittelytiede
  • Työn laji: Pro gradu -tutkielma
  • Aika: 11.2.1999
  • Sivumäärä: 82
  • Computing Reviews Classification:
    • H.2.4 Infromation Systems, Database Management, Systems
    • H.2.8 Infromation Systems, Database Management, Database Applications
  • Avainsanat: Puhelutietokanta, tietovarasto, tietokooste, tiedon tiivistys
  • Säilytyspaikka: Tietojenkäsittelytieteen laitoksen kirjasto
  • Muita tietoja: Tutkielman sisältö on salainen kaksi vuotta hyväksymispäivästä.

Tässä tutkielmassa etsitään keinoja toteuttaa tehokas puhelutietokanta. Puhelutietokanta on tärkeä osa puhelutietoja käsittelevää tietojärjestelmää. Paitsi tietojärjestelmän osa, on se myös arvokas tietovarasto, jonka avulla voidaan tutkia puhelimen käyttäjien soittokäyttäytymistä.

Tutkielmassa selvitetään, mikä puhelutietokanta on, mitä vaatimuksia sille asetetaan ja mitä ongelmia sen toteuttamiseen liittyy. Ongelmiin etsitään ratkaisuja kirjallisista lähteistä, pääasiassa akateemisten konferenssijulkaisujen artikkeleista. Tutkielmassa osoitetaan, että puhelutietokantaa voidaan pitää tietovarastona. Puhelutietokanta täyttää myös monia tilastollisten ja tieteellisten tietokantojen piirteitä. Koska puhelutietokantaa koskevaa tietoa on huonosti saatavissa, perehdytään tutkielmassa tietovarastoihin sekä tilastollisiin ja tieteellisiin tietokantoihin liittyviin tietoihin ja sovelletaan näitä puhelutietokantaan.

Tutkielmassa syvennytään kahteen tapaan tehostaa puhelutietokannan toimintaa: tietokoosteisiin ja tiedon tiivistämiseen. Tietokoosteet ovat tietokannan tiedoista muodostettua ja tietokantaan tallennettua toisteista tietoa, jonka avulla kyselyjen suoritusnopeutta parannetaan. Tietokoosteita pidetään tehokkaimpana tapana tehostaa tietovaraston toimintaa. Niiden käyttäminen nopeuttaa erityisesti puhelutietokantaan kohdistuvia analyysikyselyjä. Tiedon tiivistys taas on suurissa tietokannoissa yleisesti käytetty tapa vähentää kannan levytilan tarvetta ja tehostaa kannan toimintaa.

Tutkielmaan sisältyy lyhyt tuotevertailu, jossa vertaillaan viittä tietokantatuotetta ja valitaan niistä se, joka sopii parhaiten puhelutietokannaksi. Vertailussa käy ilmi, että tuotteiden välillä on suuria eroja ja että tuote-esitteiden antama tieto on usein harhaanjohtavaa. Vertailun tuotteista on kuitenkin melko helppo löytää paras.

  • Tarkastuslausunto pro gradu -tutkielmasta Heikki Siltala: Suuri puhelutietokanta
  • Tarkastajat: Seppo Sippu ja Hannu Erkiö

Puhelinoperaattorin ylläpitämään puhelutietokantaan lisätään päivittäin hyvin suuri määrä uusia tietueita (soitetut puhelut) ja toisaalta siihen kohdistetaan laajoja kooste- ja analyysikyselyitä (puheluiden laskutus, valvonta, soittokäyttäytyminen ym). Tutkielman lähtökohtana on ollut pohtia puhelutietokannan toteuttamiseen liittyviä kriittisiä tekijöitä ja arvioida tarjolla olevien järjestelmien soveltuvuutta puhelutietokannan hallintajärjestelmäksi.

Tekijä on tutkielmaansa varten käynyt läpi mittavan määrän ongelma-alueen kirjallisuutta. Perustellusti tekijä on päätynyt tarkastelemaan puhelutietokantaa tietovarastona ja esittelee sen vuoksi tietovaraston hallinnan keskeisintä problematiikkaa: tietokoosteiden tallennusta, valintaa ja ylläpitoa. Toiseksi tärkeäksi puhelutietokannan tehostuskeinoksi tekijä näkee tiedon tiivistyksen ja käy läpi tunnettuja tietokantatiivistyksessä sovellettuja menetelmiä. Työ on selkeästi motivoitu ja kokonaisuutena onnistunut. Esitys on asianmukaisesti jäsennetty ja etenee johdonmukaisesti. Eri menetelmät esitetään pääosin ymmärrettävästi ja sopivan tarkasti. Muutamassa kohdassa esitys on jäänyt liian yleisluontoiseksi ja toisaalta yksinkertaisia asioita on joskus selostettu tarpeettoman laveasti.

Tutkielmansa lopuksi tekijä tarkastelee viittä kaupallisia tiedonhallintajärjestelmää ja arvioi niiden soveltuvuutta puhelutietokannan toteutukseen. Vertailtavissa järjestelmissä on toivottavia ominaisuuksia (tietokoosteet ja tiedon tiivistys) aika niukasti, joten vertailu ei ainakaan tältä osin voi olla kovinkaan antoisa. Perustelut järjestelmien keskinäiselle paremmuusjärjestykselle jäävät pakostakin varsin yleisluontoisiksi.

Tutkielma on huolellisesti laadittu ja kieliasultaan hyvä.

Tutkielma esitetään hyväksyttäväksi arvosanalla magna cum laude approbatur.