Sólin Sólin Rís 05:05 • sest 21:47 í Reykjavík
Tunglið Tunglið Rís 00:00 • Sest 00:00 í Reykjavík
Flóð Flóð Árdegis: 09:35 • Síðdegis: 22:03 í Reykjavík
Fjaran Fjara Árdegis: 03:36 • Síðdegis: 15:35 í Reykjavík

Tapa lög eða önnur gögn gæðum við geymslu á hörðum diski eða við flutning milli tölva?

Hjálmtýr Hafsteinsson

Nei, harðir diskar og disklingar eiga að geyma gögnin alveg nákvæmlega eins og þau eru, bita fyrir bita. Sama gildir um flutning gagna yfir net. Gögnin eiga ekki að breytast við að fara á milli tölva.

Auðvitað geta komið upp villur, skemmd í diskinum eða truflun á netsambandinu. Slíkar villur koma þó mjög sjaldan upp og auk þess uppgötvast yfirleitt að þær hafi orðið og þá er reynt að skrifa aftur á diskinn eða senda gögnin aftur yfir netið.



Þessi hefur örugglega ekki tapað neinum gögnum við þjöppun!

Algengasta ástæðan fyrir því að gögn tapa gæðum er þjöppun þeirra. Til eru tvær tegundir þjöppunaraðferða. Önnur tegundin varðveitir allar þær upplýsingar sem gögnin geyma (e. lossless compression). Hin tegundin eyðir upplýsingum til að ná fram ennþá betri þjöppun (e. lossy compression).

Í flestum gögnum sem unnið er með í tölvum er mikið af endurtekningum. Til dæmis eru oft stór svæði með sama litnum í stafrænum myndum. Í stað þess að segja um hvern einasta punkt á svæðinu að hann sé blár, þá getum við sagt að svæðið sem afmarkast af fjórum ákveðnum punktum sé allt blátt. Þá þarf bara að telja upp fjóra punkta og einn lit, í stað þess að segja þúsund sinnum litinn. Þetta væri dæmi um þjöppun sem tapar engum upplýsingum, því það skiptir ekki máli á hvorn veginn við lýsum þessu svæði myndarinnar.

Ef stafræna myndin væri til dæmis af himninum og notaði örlítið mismunandi bláa liti milli ólíkra svæða, þá gætum við náð fram mikilli þjöppun með því að segja að allur himininn væri af sama bláa litnum. Ef lítill munur væri á bláu litunum í upphaflegu myndinni þá sæist kannski enginn munur. Þetta væri dæmi um þjöppun sem tapar upplýsingum, því að nú lýsa þjappaða og óþjappaða myndin ólíkum hlutum og ekki er hægt að fara frá þjöppuðu myndinni aftur í óþjöppuðu myndina, því það hafa horfið út upplýsingar um hvaða bláu litir voru notaðir og hvar þeir voru notaðir. Þjöppunin getur hins vegar verið mjög mikil.



Ætli blái himininn sé skilgreindur oftar en einu sinni?

Sem dæmi um algenga þjöppunaraðferð má nefna ZIP-skrár. Þær tapa engum upplýsingum, enda er þessi aðferð oft notuð til að þjappa textaskrám og keyrsluskrám, þar sem hver einasti biti getur skipt sköpum. Við fáum þó oftast ekki nema tvö- tll þrefalda þjöppun með ZIP-aðferðinni.

Í myndum og hljóði skiptir hver biti ekki eins miklu máli og þar er oft hægt að nota öflugri þjöppunaraðferðir sem eyða út upplýsingum sem notandinn mun varla taka eftir.

JPEG-þjöppunin fyrir myndir tapar gögnum. Það er meira að segja hægt að velja hversu miklu hún tapar (og þá hversu mikla þjöppun við fáum). Í mörgum tilfellum er hægt að fá 20-falda þjöppun án þess að myndgæðin skaðist að ráði. Þannig gætum við tekið 1 Mb óþjappaða mynd og þjappað henni niður í um 50 kb. Þetta fer þó eftir eðli upphaflegu myndarinnar og eftir því hversu miklar kröfur við gerum til gæða þjöppuðu myndarinnar.

Með MP3-þjöppun fyrir hljóðskrár eða lög tapast einnig upplýsingar. Hljóð á tónlistargeisladiskum er geymt þannig að fyrir hverja sekúndu eru geymd 44.100 tónagildi. Hvert tónagildi er 16 bitar eða 2 bæti (x2 fyrir stereó), svo að hver sekúnda af tónlist á geisladiski er 2x2x44.100 = 176.400 bæti. Hver mínúta er því um 10MB, og dæmigert lag 30-40MB. Þegar laginu er þjappað með MP3-þjöppun er hægt að ráða því hversu margir bitar eru notaðir á sekúndu. Algengt er að nota 128.000 bita á sekúndu, eða 16.000 bæti. Þjöppunin er þá 176.400/16.000 = 11-föld. Einnig væri hægt að nota 64 kbita á sekúndu, með 22-faldri þjöppun, en þá heyrist oftast greinilegur munur á gæðum tónlistarinnar.

Athugið að eftir að MP3-skráin, eða JPEG-skráin, hefur verið búin til þá er hægt að flytja hana milli tölva og skrifa hana aftur og aftur án þess að neinar upplýsingar tapist. Upplýsingarnar tapast aðeins við þjöppunina sjálfa sem er yfirleitt aðeins framkvæmd einu sinni.

Frekara lesefni af Vîsindavefnum:

Myndir:

Höfundur

Hjálmtýr Hafsteinsson

dósent í tölvunarfræði við HÍ

Útgáfudagur

13.12.2002

Spyrjandi

Tryggvi Ingason

Tilvísun

Hjálmtýr Hafsteinsson. „Tapa lög eða önnur gögn gæðum við geymslu á hörðum diski eða við flutning milli tölva?“ Vísindavefurinn, 13. desember 2002. Sótt 29. apríl 2024. http://visindavefur.is/svar.php?id=2956.

Hjálmtýr Hafsteinsson. (2002, 13. desember). Tapa lög eða önnur gögn gæðum við geymslu á hörðum diski eða við flutning milli tölva? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=2956

Hjálmtýr Hafsteinsson. „Tapa lög eða önnur gögn gæðum við geymslu á hörðum diski eða við flutning milli tölva?“ Vísindavefurinn. 13. des. 2002. Vefsíða. 29. apr. 2024. <http://visindavefur.is/svar.php?id=2956>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Tapa lög eða önnur gögn gæðum við geymslu á hörðum diski eða við flutning milli tölva?
Nei, harðir diskar og disklingar eiga að geyma gögnin alveg nákvæmlega eins og þau eru, bita fyrir bita. Sama gildir um flutning gagna yfir net. Gögnin eiga ekki að breytast við að fara á milli tölva.

Auðvitað geta komið upp villur, skemmd í diskinum eða truflun á netsambandinu. Slíkar villur koma þó mjög sjaldan upp og auk þess uppgötvast yfirleitt að þær hafi orðið og þá er reynt að skrifa aftur á diskinn eða senda gögnin aftur yfir netið.



Þessi hefur örugglega ekki tapað neinum gögnum við þjöppun!

Algengasta ástæðan fyrir því að gögn tapa gæðum er þjöppun þeirra. Til eru tvær tegundir þjöppunaraðferða. Önnur tegundin varðveitir allar þær upplýsingar sem gögnin geyma (e. lossless compression). Hin tegundin eyðir upplýsingum til að ná fram ennþá betri þjöppun (e. lossy compression).

Í flestum gögnum sem unnið er með í tölvum er mikið af endurtekningum. Til dæmis eru oft stór svæði með sama litnum í stafrænum myndum. Í stað þess að segja um hvern einasta punkt á svæðinu að hann sé blár, þá getum við sagt að svæðið sem afmarkast af fjórum ákveðnum punktum sé allt blátt. Þá þarf bara að telja upp fjóra punkta og einn lit, í stað þess að segja þúsund sinnum litinn. Þetta væri dæmi um þjöppun sem tapar engum upplýsingum, því það skiptir ekki máli á hvorn veginn við lýsum þessu svæði myndarinnar.

Ef stafræna myndin væri til dæmis af himninum og notaði örlítið mismunandi bláa liti milli ólíkra svæða, þá gætum við náð fram mikilli þjöppun með því að segja að allur himininn væri af sama bláa litnum. Ef lítill munur væri á bláu litunum í upphaflegu myndinni þá sæist kannski enginn munur. Þetta væri dæmi um þjöppun sem tapar upplýsingum, því að nú lýsa þjappaða og óþjappaða myndin ólíkum hlutum og ekki er hægt að fara frá þjöppuðu myndinni aftur í óþjöppuðu myndina, því það hafa horfið út upplýsingar um hvaða bláu litir voru notaðir og hvar þeir voru notaðir. Þjöppunin getur hins vegar verið mjög mikil.



Ætli blái himininn sé skilgreindur oftar en einu sinni?

Sem dæmi um algenga þjöppunaraðferð má nefna ZIP-skrár. Þær tapa engum upplýsingum, enda er þessi aðferð oft notuð til að þjappa textaskrám og keyrsluskrám, þar sem hver einasti biti getur skipt sköpum. Við fáum þó oftast ekki nema tvö- tll þrefalda þjöppun með ZIP-aðferðinni.

Í myndum og hljóði skiptir hver biti ekki eins miklu máli og þar er oft hægt að nota öflugri þjöppunaraðferðir sem eyða út upplýsingum sem notandinn mun varla taka eftir.

JPEG-þjöppunin fyrir myndir tapar gögnum. Það er meira að segja hægt að velja hversu miklu hún tapar (og þá hversu mikla þjöppun við fáum). Í mörgum tilfellum er hægt að fá 20-falda þjöppun án þess að myndgæðin skaðist að ráði. Þannig gætum við tekið 1 Mb óþjappaða mynd og þjappað henni niður í um 50 kb. Þetta fer þó eftir eðli upphaflegu myndarinnar og eftir því hversu miklar kröfur við gerum til gæða þjöppuðu myndarinnar.

Með MP3-þjöppun fyrir hljóðskrár eða lög tapast einnig upplýsingar. Hljóð á tónlistargeisladiskum er geymt þannig að fyrir hverja sekúndu eru geymd 44.100 tónagildi. Hvert tónagildi er 16 bitar eða 2 bæti (x2 fyrir stereó), svo að hver sekúnda af tónlist á geisladiski er 2x2x44.100 = 176.400 bæti. Hver mínúta er því um 10MB, og dæmigert lag 30-40MB. Þegar laginu er þjappað með MP3-þjöppun er hægt að ráða því hversu margir bitar eru notaðir á sekúndu. Algengt er að nota 128.000 bita á sekúndu, eða 16.000 bæti. Þjöppunin er þá 176.400/16.000 = 11-föld. Einnig væri hægt að nota 64 kbita á sekúndu, með 22-faldri þjöppun, en þá heyrist oftast greinilegur munur á gæðum tónlistarinnar.

Athugið að eftir að MP3-skráin, eða JPEG-skráin, hefur verið búin til þá er hægt að flytja hana milli tölva og skrifa hana aftur og aftur án þess að neinar upplýsingar tapist. Upplýsingarnar tapast aðeins við þjöppunina sjálfa sem er yfirleitt aðeins framkvæmd einu sinni.

Frekara lesefni af Vîsindavefnum:

Myndir:...