Sólin Sólin Rís 05:43 • sest 21:13 í Reykjavík
Tunglið Tunglið Rís 13:37 • Sest 06:11 í Reykjavík
Flóð Flóð Árdegis: 02:59 • Síðdegis: 15:47 í Reykjavík
Fjaran Fjara Árdegis: 09:39 • Síðdegis: 21:50 í Reykjavík

Hvernig er öruggast að geyma rafræn gögn?

Njörður Sigurðsson

Hér er einnig að finna svör við eftirfarandi spurningum:

Hvernig er hægt að framtíðartryggja sig gegn úreldingu sniða? Hvaða aðferðir eru notaðar við varðveislu rafrænna gagna? Hvernig fara þjóðskjalasöfn að því að geyma rafræn gögn?

Til að svara spurningu um varðveislu rafrænna gagna er fyrst rétt að skoða þann vanda og þær áskoranir sem langtímavarðveisla rafrænna gagna felur í sér.

Varðveisla rafrænna gagna til frambúðar er á margan hátt vandasamari en varðveisla pappírsskjala. Hægt er að tryggja varðveislu pappírsskjala í mörg hundruð ár ef valinn er vandaður pappír, sem uppfyllir staðla um endingu, og varðveisluaðstæður eru eins og best verður á kosið. Sem dæmi má nefna að elsta pappírsskjal í Þjóðskjalasafni Íslands frá árinu 1541 er enn í góðu ástandi.

Síða úr Manntalinu 1703. Manntalið er einn helsti dýrgripur Þjóðskjalasafns Íslands.

Nokkrir áhættuþættir eru við vörslu rafrænna gagna og hefur reynslan sýnt að ekki er hægt að treysta á að hægt sé að nota rafræn gögn sem eru orðin nokkurra ára gömul. Hröð þróun í hug- og vélbúnaði gerir það meðal annars að verkum að gögn úreldast fljótt og verða óaðgengileg. Einkum þarf að hafa tvennt í huga við varðveislu rafrænna gagna: að vörslumiðill sé haldgóður og að vistunarsnið þeirra tryggi aðgengi að gögnunum til framtíðar.

Margir hugbúnaðarframleiðendur viðhalda hugbúnaði og stýrikerfum aðeins í skamman tíma vegna framfara í tækni og þróun hugbúnaðar. Tafla 1 sýnir hvernig hugbúnaðarframleiðandinn Microsoft hefur haldið við mismunandi útgáfum af ritvinnsluforritinu Word. Þá má jafnframt benda á að í mars 2014 gaf Microsoft út að það myndi hætta uppfærslum á stýrikerfinu Windows XP sem sett var á markað árið 2001 og var mjög útbreytt á sínum tíma. Þetta hefur í för með sér að gögn sem sköpuð eru í þessum forritum og keyra á þessum stýrikerfum verður ef til vill ekki hægt að nota síðar í öðrum forritum. Þó reyna hugbúnaðarframleiðendur að haga málum þannig að notendur geta flutt gögnin yfir í nýja forritið, til dæmis með þeim hætti að hægt er að vista skjal sem búið var til í tiltekinni útgáfu hugbúnaðarins í nýju útgáfunni og fær það þá einkenni og snið þeirrar útgáfu.

Tafla 1. Viðhald Microsoft á útgáfum af ritvinnsluforritinu Word.

Vörslumiðlar rafrænna gagna úreldast einnig hratt. Disklingar (sem voru í stærðum 8“, 5 ¼“, 3 ½“ og svo framvegis) voru til dæmis algengur vörslumiðill rafrænna gagna um 1980-2000 og voru flestar tölvur búnar disklingadrifum til þess að lesa upplýsingarnar. Disklingar hafa vikið fyrir öðrum vörslumiðlum, svo sem geisladiskum (CD-ROM, DVD, Blu-Ray), USB-minnislyklum og utanáliggjandi hörðum diskum. Hversu lengi þess háttar vörslumiðlar verða í notkun er ómögulegt að segja en reynslan sýnir að ný tækni mun líklega innan fárra ára ryðja þessum lausnum til hliðar. Hættan er sú að rafræn gögn lokist inni í úreltum vörslumiðlum og að ekki verði til vélbúnaður til að lesa upplýsingarnar í framtíðinni.

Þjóðskjalasöfn heimsins hafa síðustu áratugi þróað aðferðir til að tryggja varðveislu og aðgengi að rafrænum gögnum til framtíðar með tilliti til þeirra áskorana sem að ofan greinir. Almennt má segja að helstu aðferðir við langtímavarðveislu rafrænna gagna séu þessar:

  • Söfnunaraðferðin (e. museum): Rafræn gögn eru varðveitt í sínu upprunalega skráarsniði. Vél- og hugbúnaði er safnað til þess að geta lesið rafræn gögn og þannig reynt að varðveita upprunalegt umhverfi gagnanna. Safna þarf öllum hugbúnaði og öllum vélbúnaði svo unnt sé að tryggja aðgengi að upplýsingunum. Þessi aðferð þykir óframkvæmanleg til lengri tíma. Umfang vélbúnaðar og hugbúnaðar yrði mikið og viðhald á ólíkum tölvum, drifum, stýrikerfum og hugbúnaði kostnaðarsamt.
  • Hermun (e. emulation): Aðferðin byggir á því að rafræn gögn eru varðveitt á upprunalegu skráarsniði og gerð aðgengileg í gegnum hugbúnað sem hermir eftir því umhverfi sem gögnin voru mynduð í.
  • Umbreyting (e. migration): Umbreyting eða yfirfærsla er aðferð þar sem rafræn gögn eru færð yfir á önnur skráarsnið sem eru aðgengileg með nútímatækni. Með þessari aðferð þarf að yfirfæra rafræn gögn reglulega á það skráarsnið sem þykir fýsilegt hverju sinni.

Flest þjóðskjalasöfn, meðal annars öll þjóðskjalasöfn Norðurlandanna, varðveita rafræn gögn með því að umbreyta þeim yfir á önnur skráarsnið þó að aðferðarfræði þeirra sé mismunandi. Það telst almennt viðurkennt að hagstæðasta leiðin til varðveislu rafrænna gagna til lengri tíma sé umbreyting yfir á skráarsnið sem eru samkvæmt opnum alþjóðlegum stöðlum og eru mikið notuð á hverjum tíma. Þá er hægt, hvenær sem þurfa þykir, að búa til forrit til þess að lesa rafræn gögn sem vistuð eru í samræmi við tiltekinn staðal.

Aðferð Þjóðskjalasafns Íslands við langtímavarðveislu rafrænna gagna er fengin frá Ríkisskjalasafni Danmerkur (Statens Arkiver). Farin er sú leið að umbreyta upprunalegu skráarsniðum rafrænu gagnanna (til dæmis .docx, .pdf, .xls og svo framvegis) yfir í skráarsnið sem vistuð eru til geymslu í sniðum sem eru samkvæmt opnum stöðlum. Stundum kallað „kerfisóháð“ snið eða form. Samkvæmt reglum Þjóðskjalasafns eru myndir varðveittar á skráarsniðinu Tiff 6.0 eða JPEG-2000 (ISO- 15444-1), hljóðraðir samkvæmt MP3 (ISO 11172-3), myndskeið samkvæmt MPEG-2 (ISO 13218-2) og texti samkvæmt Unicode táknuninni UTF-8. Rafræn gögn eru vistuð í ofangreind skráarsnið eftir því sem við á og varðveitt í svokallaðri vörsluútgáfu í Þjóðskjalasafni Íslands.

Mynd frá kortadeild Breska þjóðskjalasafnsins.

Til þess að tryggja heilleika gagnanna og að þau lokist ekki í úreltum hug- og vélbúnaði eru rafræn gögn afhent ekki eldri en fimm ára gömul til safnsins. Til samanburðar má nefna að pappírsskjöl eru afhent þegar þau eru orðin 30 ára gömul. Hver vörsluútgáfa er varðveitt í þremur eintökum. Eitt eintak á lokaðri diskastæðu sem er ekki nettengd og tvö á DVD-diskum og á að varðveita annað eintakið fyrir utan höfuðstöðvar safnsins. Þetta er hugsað til þess að tryggja að alla vega eitt eintak af gögnunum varðveitist ef hin tvö tapast, svo sem vegna eldsvoða. Þá er jafnframt gætt að því að þau tvö eintök diska sem gerð eru af hverri vörsluútgáfu séu ekki úr sömu framleiðslulínu ef galli skyldi leynast í einu þeirra. Þjóðskjalasafn þarf síðar að færa hin rafrænu gögn yfir á annan vörslumiðil sem telst öruggur á þeim tíma. Reglulega þarf svo að yfirfæra gögnin á ný skráarsnið þegar þau sem nú eru notuð úreldast. Varðveisla rafrænna gagna krefst þess að stöðugt sé fylgst með þeim og þau færð á nýja miðla og snið til að tryggja varðveislu og aðgengi að þeim í framtíðinni.

Fyrir einstaklinga sem eiga mikið að rafrænum gögnum og vilja tryggja varðveislu þeirra skiptir máli að hafa gögnin á skráarsniðum sem eru eftir opnum stöðlum. Má þar til dæmis nefna PDF/A, TIFF 6.0, JPEG-2000 og svo framvegis. Þá þurfa einstaklingar, eins og skjalasöfn, að fylgjast með sínum rafrænu gögnum og færa þau yfir á ný snið og vörslumiðla þegar aðstæður krefjast og huga vel að afritatöku. Þá kann að vera að í sumum tilfellum sé best að prenta út rafræn gögn á pappír og varðveita upplýsingarnar þannig sé það mögulegt. Hafa verður þó í huga að ekki er hægt að yfirfæra og varðveita öll rafræn gögn á pappír, svo sem hljóðskeið, myndskeið og gagnagrunna. Við yfirfærslu á pappír tapast einnig upplýsingar í hinu rafræna skjali, svo sem lýsigögn.

Heimildir:
  • Danielsen, Jan og Ulla Mortensen: „Strategier for elektroniske arkivaliers tekniske overlevelse. Tænkelige strategier for langtidsopbevaring af elektroniske arkivalier. Statens Arkivers migreringsstrategi.“ Arkiv 5 (2000), bls. 78-84.
  • Microsoft support: Microsoft Product Lifecycle Search - Word. (Sótt 13.03.2014).
  • Microsoft support: Microsoft Product Lifecycle Search – Windows XP. (Sótt 13.03.2014).
  • Millar, Laura: Archives: Principles and Practices. New York 2004. Bls. 205-222.
  • Þjóðskjalasafn Íslands. Rafræn skjalavarsla. Reglur um rafræn opinber gögn og skil á þeim. (Sótt 13.03.2014).

Myndir:

Höfundur

Njörður Sigurðsson

sviðsstjóri skjalasviðs Þjóðskjalasafns Íslands og stundakennari í skjalfræði við Háskóla Íslands

Útgáfudagur

28.3.2014

Spyrjandi

Ríkarður Örn Pálsson

Tilvísun

Njörður Sigurðsson. „Hvernig er öruggast að geyma rafræn gögn?“ Vísindavefurinn, 28. mars 2014. Sótt 18. apríl 2024. http://visindavefur.is/svar.php?id=66853.

Njörður Sigurðsson. (2014, 28. mars). Hvernig er öruggast að geyma rafræn gögn? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=66853

Njörður Sigurðsson. „Hvernig er öruggast að geyma rafræn gögn?“ Vísindavefurinn. 28. mar. 2014. Vefsíða. 18. apr. 2024. <http://visindavefur.is/svar.php?id=66853>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Hvernig er öruggast að geyma rafræn gögn?
Hér er einnig að finna svör við eftirfarandi spurningum:

Hvernig er hægt að framtíðartryggja sig gegn úreldingu sniða? Hvaða aðferðir eru notaðar við varðveislu rafrænna gagna? Hvernig fara þjóðskjalasöfn að því að geyma rafræn gögn?

Til að svara spurningu um varðveislu rafrænna gagna er fyrst rétt að skoða þann vanda og þær áskoranir sem langtímavarðveisla rafrænna gagna felur í sér.

Varðveisla rafrænna gagna til frambúðar er á margan hátt vandasamari en varðveisla pappírsskjala. Hægt er að tryggja varðveislu pappírsskjala í mörg hundruð ár ef valinn er vandaður pappír, sem uppfyllir staðla um endingu, og varðveisluaðstæður eru eins og best verður á kosið. Sem dæmi má nefna að elsta pappírsskjal í Þjóðskjalasafni Íslands frá árinu 1541 er enn í góðu ástandi.

Síða úr Manntalinu 1703. Manntalið er einn helsti dýrgripur Þjóðskjalasafns Íslands.

Nokkrir áhættuþættir eru við vörslu rafrænna gagna og hefur reynslan sýnt að ekki er hægt að treysta á að hægt sé að nota rafræn gögn sem eru orðin nokkurra ára gömul. Hröð þróun í hug- og vélbúnaði gerir það meðal annars að verkum að gögn úreldast fljótt og verða óaðgengileg. Einkum þarf að hafa tvennt í huga við varðveislu rafrænna gagna: að vörslumiðill sé haldgóður og að vistunarsnið þeirra tryggi aðgengi að gögnunum til framtíðar.

Margir hugbúnaðarframleiðendur viðhalda hugbúnaði og stýrikerfum aðeins í skamman tíma vegna framfara í tækni og þróun hugbúnaðar. Tafla 1 sýnir hvernig hugbúnaðarframleiðandinn Microsoft hefur haldið við mismunandi útgáfum af ritvinnsluforritinu Word. Þá má jafnframt benda á að í mars 2014 gaf Microsoft út að það myndi hætta uppfærslum á stýrikerfinu Windows XP sem sett var á markað árið 2001 og var mjög útbreytt á sínum tíma. Þetta hefur í för með sér að gögn sem sköpuð eru í þessum forritum og keyra á þessum stýrikerfum verður ef til vill ekki hægt að nota síðar í öðrum forritum. Þó reyna hugbúnaðarframleiðendur að haga málum þannig að notendur geta flutt gögnin yfir í nýja forritið, til dæmis með þeim hætti að hægt er að vista skjal sem búið var til í tiltekinni útgáfu hugbúnaðarins í nýju útgáfunni og fær það þá einkenni og snið þeirrar útgáfu.

Tafla 1. Viðhald Microsoft á útgáfum af ritvinnsluforritinu Word.

Vörslumiðlar rafrænna gagna úreldast einnig hratt. Disklingar (sem voru í stærðum 8“, 5 ¼“, 3 ½“ og svo framvegis) voru til dæmis algengur vörslumiðill rafrænna gagna um 1980-2000 og voru flestar tölvur búnar disklingadrifum til þess að lesa upplýsingarnar. Disklingar hafa vikið fyrir öðrum vörslumiðlum, svo sem geisladiskum (CD-ROM, DVD, Blu-Ray), USB-minnislyklum og utanáliggjandi hörðum diskum. Hversu lengi þess háttar vörslumiðlar verða í notkun er ómögulegt að segja en reynslan sýnir að ný tækni mun líklega innan fárra ára ryðja þessum lausnum til hliðar. Hættan er sú að rafræn gögn lokist inni í úreltum vörslumiðlum og að ekki verði til vélbúnaður til að lesa upplýsingarnar í framtíðinni.

Þjóðskjalasöfn heimsins hafa síðustu áratugi þróað aðferðir til að tryggja varðveislu og aðgengi að rafrænum gögnum til framtíðar með tilliti til þeirra áskorana sem að ofan greinir. Almennt má segja að helstu aðferðir við langtímavarðveislu rafrænna gagna séu þessar:

  • Söfnunaraðferðin (e. museum): Rafræn gögn eru varðveitt í sínu upprunalega skráarsniði. Vél- og hugbúnaði er safnað til þess að geta lesið rafræn gögn og þannig reynt að varðveita upprunalegt umhverfi gagnanna. Safna þarf öllum hugbúnaði og öllum vélbúnaði svo unnt sé að tryggja aðgengi að upplýsingunum. Þessi aðferð þykir óframkvæmanleg til lengri tíma. Umfang vélbúnaðar og hugbúnaðar yrði mikið og viðhald á ólíkum tölvum, drifum, stýrikerfum og hugbúnaði kostnaðarsamt.
  • Hermun (e. emulation): Aðferðin byggir á því að rafræn gögn eru varðveitt á upprunalegu skráarsniði og gerð aðgengileg í gegnum hugbúnað sem hermir eftir því umhverfi sem gögnin voru mynduð í.
  • Umbreyting (e. migration): Umbreyting eða yfirfærsla er aðferð þar sem rafræn gögn eru færð yfir á önnur skráarsnið sem eru aðgengileg með nútímatækni. Með þessari aðferð þarf að yfirfæra rafræn gögn reglulega á það skráarsnið sem þykir fýsilegt hverju sinni.

Flest þjóðskjalasöfn, meðal annars öll þjóðskjalasöfn Norðurlandanna, varðveita rafræn gögn með því að umbreyta þeim yfir á önnur skráarsnið þó að aðferðarfræði þeirra sé mismunandi. Það telst almennt viðurkennt að hagstæðasta leiðin til varðveislu rafrænna gagna til lengri tíma sé umbreyting yfir á skráarsnið sem eru samkvæmt opnum alþjóðlegum stöðlum og eru mikið notuð á hverjum tíma. Þá er hægt, hvenær sem þurfa þykir, að búa til forrit til þess að lesa rafræn gögn sem vistuð eru í samræmi við tiltekinn staðal.

Aðferð Þjóðskjalasafns Íslands við langtímavarðveislu rafrænna gagna er fengin frá Ríkisskjalasafni Danmerkur (Statens Arkiver). Farin er sú leið að umbreyta upprunalegu skráarsniðum rafrænu gagnanna (til dæmis .docx, .pdf, .xls og svo framvegis) yfir í skráarsnið sem vistuð eru til geymslu í sniðum sem eru samkvæmt opnum stöðlum. Stundum kallað „kerfisóháð“ snið eða form. Samkvæmt reglum Þjóðskjalasafns eru myndir varðveittar á skráarsniðinu Tiff 6.0 eða JPEG-2000 (ISO- 15444-1), hljóðraðir samkvæmt MP3 (ISO 11172-3), myndskeið samkvæmt MPEG-2 (ISO 13218-2) og texti samkvæmt Unicode táknuninni UTF-8. Rafræn gögn eru vistuð í ofangreind skráarsnið eftir því sem við á og varðveitt í svokallaðri vörsluútgáfu í Þjóðskjalasafni Íslands.

Mynd frá kortadeild Breska þjóðskjalasafnsins.

Til þess að tryggja heilleika gagnanna og að þau lokist ekki í úreltum hug- og vélbúnaði eru rafræn gögn afhent ekki eldri en fimm ára gömul til safnsins. Til samanburðar má nefna að pappírsskjöl eru afhent þegar þau eru orðin 30 ára gömul. Hver vörsluútgáfa er varðveitt í þremur eintökum. Eitt eintak á lokaðri diskastæðu sem er ekki nettengd og tvö á DVD-diskum og á að varðveita annað eintakið fyrir utan höfuðstöðvar safnsins. Þetta er hugsað til þess að tryggja að alla vega eitt eintak af gögnunum varðveitist ef hin tvö tapast, svo sem vegna eldsvoða. Þá er jafnframt gætt að því að þau tvö eintök diska sem gerð eru af hverri vörsluútgáfu séu ekki úr sömu framleiðslulínu ef galli skyldi leynast í einu þeirra. Þjóðskjalasafn þarf síðar að færa hin rafrænu gögn yfir á annan vörslumiðil sem telst öruggur á þeim tíma. Reglulega þarf svo að yfirfæra gögnin á ný skráarsnið þegar þau sem nú eru notuð úreldast. Varðveisla rafrænna gagna krefst þess að stöðugt sé fylgst með þeim og þau færð á nýja miðla og snið til að tryggja varðveislu og aðgengi að þeim í framtíðinni.

Fyrir einstaklinga sem eiga mikið að rafrænum gögnum og vilja tryggja varðveislu þeirra skiptir máli að hafa gögnin á skráarsniðum sem eru eftir opnum stöðlum. Má þar til dæmis nefna PDF/A, TIFF 6.0, JPEG-2000 og svo framvegis. Þá þurfa einstaklingar, eins og skjalasöfn, að fylgjast með sínum rafrænu gögnum og færa þau yfir á ný snið og vörslumiðla þegar aðstæður krefjast og huga vel að afritatöku. Þá kann að vera að í sumum tilfellum sé best að prenta út rafræn gögn á pappír og varðveita upplýsingarnar þannig sé það mögulegt. Hafa verður þó í huga að ekki er hægt að yfirfæra og varðveita öll rafræn gögn á pappír, svo sem hljóðskeið, myndskeið og gagnagrunna. Við yfirfærslu á pappír tapast einnig upplýsingar í hinu rafræna skjali, svo sem lýsigögn.

Heimildir:
  • Danielsen, Jan og Ulla Mortensen: „Strategier for elektroniske arkivaliers tekniske overlevelse. Tænkelige strategier for langtidsopbevaring af elektroniske arkivalier. Statens Arkivers migreringsstrategi.“ Arkiv 5 (2000), bls. 78-84.
  • Microsoft support: Microsoft Product Lifecycle Search - Word. (Sótt 13.03.2014).
  • Microsoft support: Microsoft Product Lifecycle Search – Windows XP. (Sótt 13.03.2014).
  • Millar, Laura: Archives: Principles and Practices. New York 2004. Bls. 205-222.
  • Þjóðskjalasafn Íslands. Rafræn skjalavarsla. Reglur um rafræn opinber gögn og skil á þeim. (Sótt 13.03.2014).

Myndir:

...