Sólin Sólin Rís 05:36 • sest 21:19 í Reykjavík
Tunglið Tunglið Rís 16:44 • Sest 05:50 í Reykjavík
Flóð Flóð Árdegis: 04:37 • Síðdegis: 17:05 í Reykjavík
Fjaran Fjara Árdegis: 10:57 • Síðdegis: 23:09 í Reykjavík

Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu?

Hjálmtýr Hafsteinsson

Athugasemd ritstjórnar: Glöggur lesandi benti okkur á hvernig fá má fram íslenskar gæsalappir í Macintosh OS X. Fyrri gæsalappirnar („) fást með því að halda inni ALT-hnappi lyklaborðsins og ýta um leið á 'Ð'. Hinar seinni (“) má fá með því að gera slíkt hið sama, en halda einnig inni skiptihnappi (e. shift).


Spurningin hljómaði svona í heild sinni:

Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu? Er þessi stafur til í ISO-8859-1(5)? Virkar hann í öllum kerfum?

Í gegnum tíðina hafa nokkuð ólíkar venjur skapast um það hvernig gæsalappir skuli ritaðar í mismunandi tungumálum. Sem dæmi má nefna að í ensku eru notaðar sveigðar gæsalappir (e. curved quotes) þar sem fyrri gæsalappirnar eru “ og þær seinni eru ”. Í íslensku (einnig í þýsku og öðrum málum) er venjan að skrifa fyrri gæsalappirnar niðri („) en þær seinni uppi (“).

Gæsalappir. Ekki er vitað hvort þessar séu íslenskar eða ekki.

Þegar allur texti var handskrifaður eða prentaður með blýmótum var þetta misræmi ekki mikið vandamál því auðvelt var að búa til þær gæsalappir sem þörf var á. Með tilkomu ritvéla og ekki síst tölva fór þetta fyrst að valda vandræðum. Til að þurfa ekki eins marga lykla á lyklaborðinu notuðu ritvélar beinar gæsalappir (") þar sem sömu gæsalappirnar eru ritaðar í upphafi og lok tilvitnunar. Í fyrstu tölvunum og stafasettunum var því aðeins gert ráð fyrir þessum beinu gæsalöppum (að vísu bæði einföldum og tvöföldum). Sveigðar gæsalappirnar voru ekki í upphaflega ASCII-stafasettinu og heldur ekki í arftaka þess ISO-8859. Í ISO-8859 þótti væntanlega nógu mikið mál að koma fyrir öllum helstu sérþjóðlegu bókstöfunum þótt ekki væri líka verið að setja inn „smáatriði“ eins og mismunandi útgáfur af gæsalöppum.

Nýjasta stafasettið, Unicode, leysir úr flestum þessum vandræðum. Þar er komið fyrir öllum helstu gerðum gæsalappa auk gífurlegs magns sérþjóðlegra tákna af ýmsum gerðum. Kóðinn fyrir íslensku gæsalappirnar í Unicode er 8222 (líka skrifað U+201E í Unicode) fyrir fremri gæsalappirnar („) og 8220 (eða U+201C) fyrir þær seinni (“). Þessi kóði virkar í öllum kerfum sem ráða við Unicode. Öll nýleg ritvinnslukerfi kunna á Unicode en eldri kerfi gætu átt í vandræðum með kóðann.

Hvernig er þá hægt að búa til íslenskar gæsalappir þegar verið er að skrifa texta? Það er ennþá dálítið klunnalegt. Þegar verið er að skrifa HTML skjal er hægt að nota og til að fá íslensku gæsalappirnar „ og “. Í HTML (það er HTML 4 og nýrra) er líka hægt að fá ýmsar gerðir gæsalappa með sérstökum skipunum, til dæmis og til að fá íslensku gæsalappirnar „ og “. Í nýjustu gerðum af Office-forritum, til dæmis Microsoft Word, er hægt að skrifa sum Unicode-tákn með því að halda niðri ALT-lyklinum og slá kóðann inn á talnaborðið hægra megin á lyklaborðinu. Til dæmis er hægt að skrifa fremri íslensku gæsalappirnar með því að halda niðri ALT og slá inn 8222 og þær seinni með því að halda niðri ALT og slá inn 8220.

Íslenskar gæsalappir koma þó yfirleitt sjálfkrafa með því að halda einfaldlega niðri SHIFT og slá inn 2 í nýjustu útgáfum á Word, ef tungumálið er stillt á íslensku (sjá á stikunni neðst til vinstri við hliðina á orðafjöldanum).

Microsoft bjó á sínum tíma til sitt eigið stafasett til að koma fyrir ýmsum táknum sem ekki voru í ASCII (og síðar ISO-8859). Þar eru mörg greinamerkjatákn, þar á meðal flestar gerðir gæsalappa. Þessi stafasett eða stafasíður (e. codepage) heita Microsoft-1250, Microsoft-1251, ..., Microsoft-1258. Stafasíðan Microsoft-1252 er mjög svipuð stafasettinu ISO-8859-1 (sem líka kallast Latin-1) og inniheldur alla séríslensku stafina. Eini munurinn á kóðunum er að þar sem ISO-8859-1 setur tiltekin stýritákn (kóðana 128 til 159) setur Microsoft-1252 ýmis birtanleg tákn, þar á meðal íslensku gæsalappirnar. Fyrri gæsalappirnar eru þar með kóðann 132 og þær seinni með kóðann 147. Þess vegna er hægt að búa til íslenskar gæsalappir í MS Word með því að halda niðri ALT-hnappinum á lyklaborðinu og slá inn 0132 á talnaborðinu fyrir fyrri gæsalappirnar og fyrir seinni gæsalappirnar er ALT-hnappinum haldið niðri og slegið inn 0147 á talnaborðinu. Það er þó hægt að breyta þessu og búa til sína eigin styttri leið (e. shortcut key) með því að fara inn í Insert-Symbol-More Symbols-Shortcut key.

Vandamálið er að kóðarnir í MS Word eru ekki þeir sömu og í Unicode. Fyrri gæsalappirnar þar höfðu kóðann 8222 og þeir seinni 8220. Önnur stýrikerfi, sem fara frekar eftir ISO-8859 eða Unicode, þekkja því ekki kóðann 132 eða 147 sem íslenskar gæsalappir. Að vísu setur Word ávallt auðkenningu um að verið sé að nota stafasíðuna Microsoft-1252 þegar skjalið er vistað á öðru formi en sem Word-skjal, til dæmi sem HTML-skjal. Vafrar ættu því að geta birt íslensku gæsalappirnar rétt. Þó er þetta ekki hægt þegar skjalið er vistað sem hreint textaskjal; þá breytir Word yfirleitt öllum gæsalöppum í beinar gæsalappir.

Microsoft er smátt og smátt að færa sig yfir í Unicode en það tekur tíma. Á meðan ætti að vera í lagi að nota Microsoft-kóðana fyrir íslensku gæsalappirnar í Word en þeir sem skiptast mikið á gögnum við notendur annarra stýrikerfa ættu kannski að byrja að venja sig á að nota Unicode-kóðana.

Frekara lesefni og mynd

Höfundur

Hjálmtýr Hafsteinsson

dósent í tölvunarfræði við HÍ

Útgáfudagur

4.1.2006

Spyrjandi

Freysteinn Alfreðsson

Tilvísun

Hjálmtýr Hafsteinsson. „Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu?“ Vísindavefurinn, 4. janúar 2006. Sótt 20. apríl 2024. http://visindavefur.is/svar.php?id=5537.

Hjálmtýr Hafsteinsson. (2006, 4. janúar). Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=5537

Hjálmtýr Hafsteinsson. „Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu?“ Vísindavefurinn. 4. jan. 2006. Vefsíða. 20. apr. 2024. <http://visindavefur.is/svar.php?id=5537>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu?
Athugasemd ritstjórnar: Glöggur lesandi benti okkur á hvernig fá má fram íslenskar gæsalappir í Macintosh OS X. Fyrri gæsalappirnar („) fást með því að halda inni ALT-hnappi lyklaborðsins og ýta um leið á 'Ð'. Hinar seinni (“) má fá með því að gera slíkt hið sama, en halda einnig inni skiptihnappi (e. shift).


Spurningin hljómaði svona í heild sinni:

Íslenskar gæsalappir eru „svona“, en hvar finn ég '„' á íslenska lyklaborðinu? Er þessi stafur til í ISO-8859-1(5)? Virkar hann í öllum kerfum?

Í gegnum tíðina hafa nokkuð ólíkar venjur skapast um það hvernig gæsalappir skuli ritaðar í mismunandi tungumálum. Sem dæmi má nefna að í ensku eru notaðar sveigðar gæsalappir (e. curved quotes) þar sem fyrri gæsalappirnar eru “ og þær seinni eru ”. Í íslensku (einnig í þýsku og öðrum málum) er venjan að skrifa fyrri gæsalappirnar niðri („) en þær seinni uppi (“).

Gæsalappir. Ekki er vitað hvort þessar séu íslenskar eða ekki.

Þegar allur texti var handskrifaður eða prentaður með blýmótum var þetta misræmi ekki mikið vandamál því auðvelt var að búa til þær gæsalappir sem þörf var á. Með tilkomu ritvéla og ekki síst tölva fór þetta fyrst að valda vandræðum. Til að þurfa ekki eins marga lykla á lyklaborðinu notuðu ritvélar beinar gæsalappir (") þar sem sömu gæsalappirnar eru ritaðar í upphafi og lok tilvitnunar. Í fyrstu tölvunum og stafasettunum var því aðeins gert ráð fyrir þessum beinu gæsalöppum (að vísu bæði einföldum og tvöföldum). Sveigðar gæsalappirnar voru ekki í upphaflega ASCII-stafasettinu og heldur ekki í arftaka þess ISO-8859. Í ISO-8859 þótti væntanlega nógu mikið mál að koma fyrir öllum helstu sérþjóðlegu bókstöfunum þótt ekki væri líka verið að setja inn „smáatriði“ eins og mismunandi útgáfur af gæsalöppum.

Nýjasta stafasettið, Unicode, leysir úr flestum þessum vandræðum. Þar er komið fyrir öllum helstu gerðum gæsalappa auk gífurlegs magns sérþjóðlegra tákna af ýmsum gerðum. Kóðinn fyrir íslensku gæsalappirnar í Unicode er 8222 (líka skrifað U+201E í Unicode) fyrir fremri gæsalappirnar („) og 8220 (eða U+201C) fyrir þær seinni (“). Þessi kóði virkar í öllum kerfum sem ráða við Unicode. Öll nýleg ritvinnslukerfi kunna á Unicode en eldri kerfi gætu átt í vandræðum með kóðann.

Hvernig er þá hægt að búa til íslenskar gæsalappir þegar verið er að skrifa texta? Það er ennþá dálítið klunnalegt. Þegar verið er að skrifa HTML skjal er hægt að nota og til að fá íslensku gæsalappirnar „ og “. Í HTML (það er HTML 4 og nýrra) er líka hægt að fá ýmsar gerðir gæsalappa með sérstökum skipunum, til dæmis og til að fá íslensku gæsalappirnar „ og “. Í nýjustu gerðum af Office-forritum, til dæmis Microsoft Word, er hægt að skrifa sum Unicode-tákn með því að halda niðri ALT-lyklinum og slá kóðann inn á talnaborðið hægra megin á lyklaborðinu. Til dæmis er hægt að skrifa fremri íslensku gæsalappirnar með því að halda niðri ALT og slá inn 8222 og þær seinni með því að halda niðri ALT og slá inn 8220.

Íslenskar gæsalappir koma þó yfirleitt sjálfkrafa með því að halda einfaldlega niðri SHIFT og slá inn 2 í nýjustu útgáfum á Word, ef tungumálið er stillt á íslensku (sjá á stikunni neðst til vinstri við hliðina á orðafjöldanum).

Microsoft bjó á sínum tíma til sitt eigið stafasett til að koma fyrir ýmsum táknum sem ekki voru í ASCII (og síðar ISO-8859). Þar eru mörg greinamerkjatákn, þar á meðal flestar gerðir gæsalappa. Þessi stafasett eða stafasíður (e. codepage) heita Microsoft-1250, Microsoft-1251, ..., Microsoft-1258. Stafasíðan Microsoft-1252 er mjög svipuð stafasettinu ISO-8859-1 (sem líka kallast Latin-1) og inniheldur alla séríslensku stafina. Eini munurinn á kóðunum er að þar sem ISO-8859-1 setur tiltekin stýritákn (kóðana 128 til 159) setur Microsoft-1252 ýmis birtanleg tákn, þar á meðal íslensku gæsalappirnar. Fyrri gæsalappirnar eru þar með kóðann 132 og þær seinni með kóðann 147. Þess vegna er hægt að búa til íslenskar gæsalappir í MS Word með því að halda niðri ALT-hnappinum á lyklaborðinu og slá inn 0132 á talnaborðinu fyrir fyrri gæsalappirnar og fyrir seinni gæsalappirnar er ALT-hnappinum haldið niðri og slegið inn 0147 á talnaborðinu. Það er þó hægt að breyta þessu og búa til sína eigin styttri leið (e. shortcut key) með því að fara inn í Insert-Symbol-More Symbols-Shortcut key.

Vandamálið er að kóðarnir í MS Word eru ekki þeir sömu og í Unicode. Fyrri gæsalappirnar þar höfðu kóðann 8222 og þeir seinni 8220. Önnur stýrikerfi, sem fara frekar eftir ISO-8859 eða Unicode, þekkja því ekki kóðann 132 eða 147 sem íslenskar gæsalappir. Að vísu setur Word ávallt auðkenningu um að verið sé að nota stafasíðuna Microsoft-1252 þegar skjalið er vistað á öðru formi en sem Word-skjal, til dæmi sem HTML-skjal. Vafrar ættu því að geta birt íslensku gæsalappirnar rétt. Þó er þetta ekki hægt þegar skjalið er vistað sem hreint textaskjal; þá breytir Word yfirleitt öllum gæsalöppum í beinar gæsalappir.

Microsoft er smátt og smátt að færa sig yfir í Unicode en það tekur tíma. Á meðan ætti að vera í lagi að nota Microsoft-kóðana fyrir íslensku gæsalappirnar í Word en þeir sem skiptast mikið á gögnum við notendur annarra stýrikerfa ættu kannski að byrja að venja sig á að nota Unicode-kóðana.

Frekara lesefni og mynd

...