angle-left Migraatio – uhka vai mahdollisuus?
6.3.2018
Blogi

Migraatio – uhka vai mahdollisuus?

Sisältömigraatiolla tarkoitetaan sisällön siirtoa alustasta toiseen. Ovatko migraatiot kauheita koettelemuksia vai tilaisuuksia laadun parannukseen?

Migraatiota tarkoitetaan joskus myös termeillä: 

  • sisällönsiirto 
  • koneellinen tiedonsiirto 
  • massavienti, massapäivitys 

Ei näin: kaikki sisältö sellaisenaan - maksoi mitä maksoi 

Eikä näin: kaikki käsityönä, ettei maksaisi mitään 

Vaan näin: siirrettäväksi soveltuvat sisällöt paranneltuina, muut ihmisen toimesta 

Mitä voi migroida? 

Rakenteinen, määrämuotoinen ja muuttumaton, sellaisenaan ”arkistoitava” data on omiaan koneellisesti siirrettäväksi eli migroitavaksi. Tyypillisesti tämä tarkoittaa esimerkiksi tiedotteita, uutisia, yhteys- tai tuotetietoja, tapahtumia, keskusteluja ja artikkeleita.  

Näitä sisältöjä on yleensä paljon, joten niiden käsin syöttämisen välttäminen tehostaa sivustouudistusta. Sen sijaan ne ovat määrämuotoisuutensa vuoksi otollisia koneelliselle importoinnille, sillä niiden käsittelyyn ei liity tulkinnanvaraisuuksia. Rakenteen osaset voidaan ohjata sellaisenaan uusille, vastaaville paikoilleen – otsikko otsikkokenttään, ja niin edelleen. 

Mitä ei kannata migroida? 

Ainutkertaiset, yksittäiset tai harvalukuiset ja keskenään erilaiset sisällöt, joita ovat yleensä esimerkiksi etusivu ja osioetusivut, taustatietosivut, palvelukuvaukset, ohjeet ym. ovat työläitä saada sopimaan koneellisen tiedonsiirron ymmärrykseen.  

Migraatio on tällöin raskas operaatio, jonka lopputulos vaatii joka tapauksessa ihmisen tekemiä korjauksia.  

Näissä tapauksissa sisällön vienti käsin, uuden sivuston ulkoasua ja käyttöliittymää, tilankäyttöä ja typografiaa silmällä pitäen, on tehokkaampaa. Ihmisagentti huomioi heti mm. sisäiset linkitykset, brändäykset ynnä muut korjausta vaativat asiat. 

Minkä kokoinen on ”massa”? 

Koneellisen migraation soveltuvuutta manuaaliseen sisällönsyöttöön verrattuna voi arvioida suhteuttamalla sisältölajin kappalemäärän sisältölajin sisäiseen määrämuotoisuuteen: 

Manuaalisesti vai migroimalla?

Manuaalisesti vai migroimalla?

Tilaisuus satsata laatuun 

Asioita, joita migraation yhteydessä voi aineistossa parantaa: 

  • asiasanoitus – karsinta, yhdistäminen, täydentäminen, nimeämiskäytännöt 
  • kategoriat – karsinta, yhdistäminen, täydentäminen, nimeämiskäytännöt 
  • otsikkohierarkiat – mielivaltaisen sisällönsyötön systemaattinen optimointi 
  • taulukot – tyylimuokkausten ja asetusten siivous 
  • sisältövirheet – etsi, korvaa -tyyppinen muokkaus 
  • sisältöpuutteet – esimerkiksi puuttuvien ingressien luonti automaattisesti 
  • lisätiedot – esimerkiksi julkaisuvuosikategorian liittäminen siihen perustuvia hakuja ja suodatuksia varten 
  • linkkieheys – entisen urlin tunnistus ja ohjaus uuteen vastineeseen 

Liferay rakastaa rakenteista dataa 

Liferaylle ominaista on sen tapa käsitellä sisältöjä rakenteisina yksiköinä, joita voidaan esittää rajattomasti eri suodatusperustein esitysportleteissa, mutta kuitenkin hallita, muokata ja poistaa keskitetysti. Yksittäinen staattinen informaatiosivun sisältö esitetään omassa portletissaan kerran; yhteystieto samanlaisena monessa paikassa; ja uutinen eri listauksilla esim. uutuusperusteella ja tagiperusteilla. 

Rakenteisuus tarkoittaa käytännössä jokaiselle sisältötyypille muodostettavaa rakennetta, eli tarvittavista osista muodostuvaa "lomaketta". Rakenteisia osia tai kenttiä ovat esimerkiksi otsikko, ingressi, sisältö, kuva, julkaisupäivämäärä, tekijä, lisätietolaatikko, sitaatti ja video. Näihin voi sitten kohdistaa toimenpiteitä, kuten päivämääräperusteinen listausjärjestys tai tekijään kohdistuva haku. 

Aineisto ei välttämättä ole ennestään samalla tavalla rakenteista, mutta sitä voidaan jalostaa siihen suuntaan, esimerkiksi muodostamalla puuttuva ingressi sisältötekstin alusta. Liferayssa rakenteinen data on aina valmiina mahdolliseen seuraavaan migraatioon, ja vietävissä esimerkiksi XML -muodossa toisiin järjestelmiin. 

Sisäänlukuun käytetty tuontisuodatin toteutetaan tapauskohtaisesti, mutta järjestelmään kirjoittamisessa voidaan hyödyntää aiempia toteutuksia. 

Cowboy ja hevoslauma - ohjelmoija ja data

Cowboy ja hevoslauma - ohjelmoija ja data

Ch5:n case-esimerkit: kolme K:ta 

Case Kirkkojakaupunki.fi 

Entisestä Valomerkki-verkkomediasta siirrettiin noin 17 000 artikkelia uuteen järjestelmään. Oleellista oli varmistaa uudelleenohjaukset. Tämä tehtiin juttutasolla ID-perusteisesti, ohjaamalla vanhaan palveluun vievät osoitteet (urlit) uuden palvelun vastaaviin artikkeleihin. 

Jatkuvassa printtilehden julkaisujärjestelmään kytketyssä sisällönsiirrossa toimituksen prosesseja on tehostettu esimerkiksi tunnistamalla videolinkit automaattisesti videoesitykseen vietäviksi.  

Kirkkojakaupunki.fi valitsi Liferay Portal 7.0 CE:n paljolti sen kehittyneen rakenteisen datan tuen vuoksi. Esimerkiksi säännölliset master data exportit tuotetaan järjestelmästä vaivatta. 

Case Kielikello.fi 

Kielenhuoltolehden moneen kertaan migroitu aineisto oli tunnetusti epätasalaatuista ja se oli aiheuttanut murhetta edellisissä alustavaihdoissa. 2632 kpl artikkeleita tuotiin liittämällä koneelliseen tuontiin sääntöjä, joilla mm. parannettiin väliotsikoiden hierarkkisuutta, siivottiin tarpeettomia muotoiluja ja tehostettiin kategorioiden ja asiasanojen käytäntöjä. Aineistoon myös lisättiin mahdollisia tulevia listaustarpeita varten vuosilukukategoria. 

Aihepiirin vuoksi tähän migraatioon liittyivät myös korkeat merkistö- ja oikeellisuusvaatimukset. Esimerkiksi typografian valinnassa oli lähellä, että olisi pitäydyttävä Times New Roman -fontissa. Onneksi Googlen Noto-fontti riitti täyttämään vaatimukset ja modernisoimaan samalla typografisen ilmeen. 

Tämänkin verkkomedian kohdalla vanhan palvelun artikkelilinkit ohjattiin keskitetysti uusiin vastineisiin. 

Tulevaisuudessa rakenteinen aineisto on sujuvaa siirtää tarvittaessa edelleen Liferay Portal CE 7.0:n muodostaman xml:n avulla. 

Case Koneviesti.fi 

Vanhaan alustaan jääneen näköislehtien pdf-arkiston säilyttäminen ja siihen viittaaminen uudesta alustasta aiheutti riesaa. Ei ollut erityisen mielekästä ylläpitää useita järjestelmiä vain arkistokokoelmien vuoksi. Uuden arkiston määrittely oli vielä kesken. Luotiin menetelmä paketoida koko arkisto liitteineen ja metatietoineen monikäyttöiseen, xml-ohjattuun muotoon. Metatietoineen pdf:t ovat kytkettävissä arkistohakuun tai tilastointiin.  

Näin asiakkaan aineiston tulevaisuus varmistettiin tyylikkäästi, eikä työtä tarvinnut jarruttaa lopullista tahtotilaa ja sen määrittely odotellessa.