Sólin Sólin Rís 05:26 • sest 21:28 í Reykjavík
Tunglið Tunglið Rís 21:24 • Sest 05:22 í Reykjavík
Flóð Flóð Árdegis: 06:10 • Síðdegis: 18:30 í Reykjavík
Fjaran Fjara Árdegis: 00:11 • Síðdegis: 12:20 í Reykjavík

Hvernig er best að geyma stafræn gögn?

Hjálmtýr Hafsteinsson

Upprunalega spurningin hljóðaði svona:
Hvað endast tölvugögn lengst með núverandi tækni, svo sem á harðdiskum, minnislyklum og geisladiskum? Ef trúa má "Gróu á Neti" er hámarkstími um 30 ár. Varla viðunandi fyrir einstaklinga, hvað þá bóka- og skjalasöfn. En hvaða úrræði standa þá helzt til boða?

Þetta er spurning sem margir sem starfa við bóka- og skjalasöfn hafa miklar áhyggjur af. Innan bókasafnsfræðinnar er meira að segja til heilt svið sem kallast stafræn varðveisla (e. Digital preservation).

Stafrænir geymslumiðlar eru orðnir nær allsráðir í dag. Það er ekki skrítið því þeir hafa marga kosti, svo sem mikið gagnamagn með hraðvirku aðgengi, sem auðvelt er að leita í. Þeir hafa hins vegar líka ákveðna galla, til dæmis að þeir nota síbreytilega tækni sem úreldist og að það er mjög auðvelt að skemma mikið gagnamagn í ógáti. Ein lítil rispa á geisladiski getur eyðilagt gögn sem eru jafngildi hundruða venjulegra bóka.

Til að meta hversu lengi hægt er að geyma gögn á stafrænum miðlum þá þarf að huga að tvennu. Annars vegar endingartíma geymslumiðlanna sjálfra, það er geisladiska, harðdiska og þess háttar, og hins vegar úreldingu á geymslutækninni, það er vélbúnaðinum sem les geymslumiðlanna og sniðinu sem gögnin eru geymd á.

Varðveisla stafrænna gagna er stanslaus vinna. Mikilvægt er að velja úr þau gögn sem ætlunin er að geyma. Á nokkurra ára fresti er æskilegt að flytja safnið yfir á nýrri tegund geymslumiðils.

Það er nokkuð misjafnt hversu lengi stafrænir geymslumiðlar endast. Yfirleitt er talið að geisladiskar endist lengst af þessum hefðbundnu nútíma miðlum. Eðlileg ending er á bilinu 25 til 50 ár. Framleiðendur gefa þó oft upp enn lengri tíma, en varla er hægt að treysta á það. Segulbönd og seguldiskar endast heldur styttra, eða 10 til 30 ár. Endingin er þó háð ýmsum þáttum. Ódýrir skrifanlegir geisladiskar endast oftast styttra en hágæða forskrifaðir geisladiskar. Einnig skiptir máli hvernig miðlarnir eru geymdir. Sólarljós er mjög slæmt fyrir geisladiska og raki hefur slæm áhrif á segulmiðla. Mikil notkun getur stytt endingartíma geymslumiðlanna. Ein rannsókn bendir til þess að ef harðdiskar eru í stöðugri notkun þá er um helmingur þeirra orðinn ónýtur eftir um 7 ár og fáir diskar lifa í 15 ár af stanslausri notkun. Að vísu eru gögnin líklega að mestu leyti óskemmd á skífum harðdisksins, en diskaeiningin virkar ekki og það er mikið mál að ná gögnunum af skífunum.

En jafnvel þó gögnin geymist á geymslumiðlunum í mörg ár þá er ekki þar með sagt að þau séu aðgengileg allan þann tíma. Vegna sífelldrar endurnýjunar á geymslutækni þá úreldist vélbúnaður geymslumiðlanna hratt. Í dag er til dæmis mjög erfitt að komast yfir vélbúnað til að lesa disklinga (e. floppy disk), sérstaklega eldri gerðir. Sama má segja um geymslutækni sem náði ekki nægilegri útbreiðslu, eins og DAT-segulbönd, zip-diskar frá Iomega og MiniDisc-diskarnir frá Sony. Gögnin á geymslumiðlunum eru því óaðgengileg, jafnvel þó þau hafi ekki skemmst á miðlinum sjálfum. En það er ekki aðeins vélbúnaðurinn sem úreldist, heldur einnig gagnasniðið og hugbúnaðarumhverfið til þess að afkóða gögnin. Sem dæmi má nefna ritvinnsluforrit, eins og Wordperfect, sem voru mjög algeng, en finnast varla lengur. Ennþá erfiðara getur verið að nálgast gögn sem geymd voru í úreltum gagnasafnskerfum, svo sem dBase IV, FoxPro, eða jafnvel ennþá eldri stórtölvukerfum eins og IBM IMS.

En hvað er þá til ráða fyrir fólk sem vill geyma stafræn gögn um ófyrirséða framtíð? Í fyrsta lagi er mikilvægt að ákveða hvaða gögn á að varðveita. Það er ekki skynsamlegt að reyna að geyma öll stafræn gögn sem við eigum, heldur ætti að velja úr þær ljósmyndir, rafrænu skjöl og myndbönd sem við viljum geta notað í framtíðinni. Síðan þarf að skipuleggja gögnin þannig að auðvelt sé að bæta í safnið (við erum jú alltaf að taka nýjar ljósmyndir) og að auðvelt sé að leita í því. Loks ætti að geyma allt safnið á að minnsta kosti tveimur ólíkum stöðum, til dæmis á geisladiskum, á harðdiski heimatölvunnar eða á tölvuskýi tölvuþjónustu. Auk þess þyrfti öðru hverju, til dæmis á fimm ára fresti, að flytja safnið yfir á nýrri tegund geymslumiðils. Til allrar hamingju er stærð geymslumiðla sífellt að vaxa, þannig að minna mál er að koma safninu fyrir í hverjum flutningi, en aftur á móti er stöðugt að bætast við gögn sem við viljum varðveita. Varðveisla stafrænna gagna er því stanslaus vinna. Það er af sem áður var þegar hægt var að skrifa sögur á kálfskinn og þá var málið leyst!

Mynd:

Höfundur

Hjálmtýr Hafsteinsson

dósent í tölvunarfræði við HÍ

Útgáfudagur

11.2.2014

Spyrjandi

Ríkarður Örn Pálsson

Tilvísun

Hjálmtýr Hafsteinsson. „Hvernig er best að geyma stafræn gögn? “ Vísindavefurinn, 11. febrúar 2014. Sótt 23. apríl 2024. http://visindavefur.is/svar.php?id=66738.

Hjálmtýr Hafsteinsson. (2014, 11. febrúar). Hvernig er best að geyma stafræn gögn? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=66738

Hjálmtýr Hafsteinsson. „Hvernig er best að geyma stafræn gögn? “ Vísindavefurinn. 11. feb. 2014. Vefsíða. 23. apr. 2024. <http://visindavefur.is/svar.php?id=66738>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Hvernig er best að geyma stafræn gögn?
Upprunalega spurningin hljóðaði svona:

Hvað endast tölvugögn lengst með núverandi tækni, svo sem á harðdiskum, minnislyklum og geisladiskum? Ef trúa má "Gróu á Neti" er hámarkstími um 30 ár. Varla viðunandi fyrir einstaklinga, hvað þá bóka- og skjalasöfn. En hvaða úrræði standa þá helzt til boða?

Þetta er spurning sem margir sem starfa við bóka- og skjalasöfn hafa miklar áhyggjur af. Innan bókasafnsfræðinnar er meira að segja til heilt svið sem kallast stafræn varðveisla (e. Digital preservation).

Stafrænir geymslumiðlar eru orðnir nær allsráðir í dag. Það er ekki skrítið því þeir hafa marga kosti, svo sem mikið gagnamagn með hraðvirku aðgengi, sem auðvelt er að leita í. Þeir hafa hins vegar líka ákveðna galla, til dæmis að þeir nota síbreytilega tækni sem úreldist og að það er mjög auðvelt að skemma mikið gagnamagn í ógáti. Ein lítil rispa á geisladiski getur eyðilagt gögn sem eru jafngildi hundruða venjulegra bóka.

Til að meta hversu lengi hægt er að geyma gögn á stafrænum miðlum þá þarf að huga að tvennu. Annars vegar endingartíma geymslumiðlanna sjálfra, það er geisladiska, harðdiska og þess háttar, og hins vegar úreldingu á geymslutækninni, það er vélbúnaðinum sem les geymslumiðlanna og sniðinu sem gögnin eru geymd á.

Varðveisla stafrænna gagna er stanslaus vinna. Mikilvægt er að velja úr þau gögn sem ætlunin er að geyma. Á nokkurra ára fresti er æskilegt að flytja safnið yfir á nýrri tegund geymslumiðils.

Það er nokkuð misjafnt hversu lengi stafrænir geymslumiðlar endast. Yfirleitt er talið að geisladiskar endist lengst af þessum hefðbundnu nútíma miðlum. Eðlileg ending er á bilinu 25 til 50 ár. Framleiðendur gefa þó oft upp enn lengri tíma, en varla er hægt að treysta á það. Segulbönd og seguldiskar endast heldur styttra, eða 10 til 30 ár. Endingin er þó háð ýmsum þáttum. Ódýrir skrifanlegir geisladiskar endast oftast styttra en hágæða forskrifaðir geisladiskar. Einnig skiptir máli hvernig miðlarnir eru geymdir. Sólarljós er mjög slæmt fyrir geisladiska og raki hefur slæm áhrif á segulmiðla. Mikil notkun getur stytt endingartíma geymslumiðlanna. Ein rannsókn bendir til þess að ef harðdiskar eru í stöðugri notkun þá er um helmingur þeirra orðinn ónýtur eftir um 7 ár og fáir diskar lifa í 15 ár af stanslausri notkun. Að vísu eru gögnin líklega að mestu leyti óskemmd á skífum harðdisksins, en diskaeiningin virkar ekki og það er mikið mál að ná gögnunum af skífunum.

En jafnvel þó gögnin geymist á geymslumiðlunum í mörg ár þá er ekki þar með sagt að þau séu aðgengileg allan þann tíma. Vegna sífelldrar endurnýjunar á geymslutækni þá úreldist vélbúnaður geymslumiðlanna hratt. Í dag er til dæmis mjög erfitt að komast yfir vélbúnað til að lesa disklinga (e. floppy disk), sérstaklega eldri gerðir. Sama má segja um geymslutækni sem náði ekki nægilegri útbreiðslu, eins og DAT-segulbönd, zip-diskar frá Iomega og MiniDisc-diskarnir frá Sony. Gögnin á geymslumiðlunum eru því óaðgengileg, jafnvel þó þau hafi ekki skemmst á miðlinum sjálfum. En það er ekki aðeins vélbúnaðurinn sem úreldist, heldur einnig gagnasniðið og hugbúnaðarumhverfið til þess að afkóða gögnin. Sem dæmi má nefna ritvinnsluforrit, eins og Wordperfect, sem voru mjög algeng, en finnast varla lengur. Ennþá erfiðara getur verið að nálgast gögn sem geymd voru í úreltum gagnasafnskerfum, svo sem dBase IV, FoxPro, eða jafnvel ennþá eldri stórtölvukerfum eins og IBM IMS.

En hvað er þá til ráða fyrir fólk sem vill geyma stafræn gögn um ófyrirséða framtíð? Í fyrsta lagi er mikilvægt að ákveða hvaða gögn á að varðveita. Það er ekki skynsamlegt að reyna að geyma öll stafræn gögn sem við eigum, heldur ætti að velja úr þær ljósmyndir, rafrænu skjöl og myndbönd sem við viljum geta notað í framtíðinni. Síðan þarf að skipuleggja gögnin þannig að auðvelt sé að bæta í safnið (við erum jú alltaf að taka nýjar ljósmyndir) og að auðvelt sé að leita í því. Loks ætti að geyma allt safnið á að minnsta kosti tveimur ólíkum stöðum, til dæmis á geisladiskum, á harðdiski heimatölvunnar eða á tölvuskýi tölvuþjónustu. Auk þess þyrfti öðru hverju, til dæmis á fimm ára fresti, að flytja safnið yfir á nýrri tegund geymslumiðils. Til allrar hamingju er stærð geymslumiðla sífellt að vaxa, þannig að minna mál er að koma safninu fyrir í hverjum flutningi, en aftur á móti er stöðugt að bætast við gögn sem við viljum varðveita. Varðveisla stafrænna gagna er því stanslaus vinna. Það er af sem áður var þegar hægt var að skrifa sögur á kálfskinn og þá var málið leyst!

Mynd:

...