Sólin Sólin Rís 05:19 • sest 21:35 í Reykjavík
Tunglið Tunglið Rís 25:18 • Sest 04:56 í Reykjavík
Flóð Flóð Árdegis: 07:07 • Síðdegis: 19:24 í Reykjavík
Fjaran Fjara Árdegis: 01:08 • Síðdegis: 13:14 í Reykjavík

Hvernig förum við að því að þekkja andlit?

Heiða María Sigurðardóttir

Flest getum við heyrt, snert, fundið bragð og lykt, skynjað hita, kulda og sársauka. Án efa eru þó augun eitt mikilvægasta skynfæri okkar. Augun eru þó aðeins upphafspunkturinn í flóknu ferli sem gerir okkur kleift að sjá heiminn og umhverfi okkar. Í heilanum eru ótal mörg svæði sem vinna úr sjónrænum upplýsingum svo við getum borið kennsl á hluti í umhverfi okkar. Við erum svo góð í þessu að það kemur okkur á óvart hversu krefjandi þetta er í raun. Það sést kannski einna best á því að það hefur reynst þrautin þyngri að kenna tölvum, sem eru afar öflugar reiknivélar, að þekkja andlit – nokkuð sem menn eru sérfræðingar í og fást við á hverjum degi.

Eitt vandasamasta verkefnið sem sjónkerfi manna þarf að leysa er hið svokallaða óbreytnivandamál (e. invariance problem). Óbreytni (e. invariance) felst í því að kóða, skrá eða tákna bara það sem skiptir máli og hunsa þann breytileika sem skiptir ekki máli. Skoðið til dæmis samsettu myndina af höfundi þessa svars hér fyrir neðan. Kannski sjáið þið að þetta er allt sama manneskjan, en ef þið hugsið aðeins málið sjáið þið að myndirnar sjálfar eiga fátt sameiginlegt séu þær bornar saman punkt fyrir punkt. Mynd af mér þegar ég horfi til hægri er í raun miklu líkari mynd af Donald Trump að horfa til hægri heldur en fyrrnefnda myndin er lík mynd af mér að horfa beint fram.

Sama manneskjan á þremur myndum en ef myndirnar eru bornar saman punkt fyrir punkt þá eiga þær fátt sameiginlegt.

Ein aðferðin sem sjónkerfið virðist nota til þess að takast á við óbreytnivandamálið er að tengja saman það sem birst hefur eitt á eftir öðru í tímaröð. Ef þú hittir mig sæirðu mig alveg örugglega ekki bara frá einu sjónarhorni, heldur frá mörgum sjónarhornum hverju á eftir öðru. Heilinn virðist nota þá þumalputtareglu að það sem fer saman í tíma tilheyri líklega sama hlutnum. Næst þegar þú hittir mig gætirðu því mögulega þekkt mig frá ýmsum sjónarhornum af því að þú – eða heilinn í þér – ert búinn að læra að þrátt fyrir að myndirnar sem berast augunum líkist tæknilega séð eiginlega ekki neitt þá sé þetta eftir allt saman ein og sama manneskjan.

Þetta er líka ein af ástæðunum fyrir því að við erum merkilega léleg í því að þekkja fólk sem við höfum ekki hitt áður af myndum. Mynd hefur jú bara eitt sjónarhorn, einn bakgrunn, eitt birtustig og svo framvegis. Ef við sjáum viðkomandi úti á götu í einhverjum öðrum aðstæðum, kannski frá öðru sjónarhorni og í annars konar birtuskilyrðum, er allnokkuð líklegt að við áttum okkur ekki á því að þetta sé manneskjan á myndinni. Þegar verið er að lýsa eftir fólki, til dæmis þegar lögreglan leitar að týndum börnum, er því mikilvægt að láta ekki eina mynd af viðkomandi duga, heldur sýna margar myndir og jafnvel myndbönd af manneskjunni til að auka líkurnar á að óbreytnivandamálið komi ekki í veg fyrir að fólk beri kennsl á þann sem lýst er eftir.

Til þess að taka ekki „feil“ á mér og Donald Trump þarf sjónkerfið einhvern veginn að hunsa breytilegt sjónarhorn, bakgrunn, birtustig og annað sem litlu máli skiptir en tákna fremur það sem er einkennandi fyrir mig sem persónu, til dæmis hvort ég sé með lítil eða stór augu, hvort þau séu dökk eða ljós, hvort þau séu kringlótt, möndlulaga eða skáleit og svo framvegis. Allt þetta væri líklega dæmi um svonefnda þáttaháða skynjun (e. part-based processing), þar sem hlutir eru greindir niður í smærri parta eða þætti, og borin eru kennsl á hlutinn út frá einkennum þessara þátta.

Þáttaháð skynjun er samt ekki það sem talið er einkennandi fyrir andlitsskynjun. Það sem virðist sérstakt við andlitsskynjun, og sem er oft helst talið greina hana frá skynjun annarra hluta, er að heildræn skynjun (e. holistic processing) gegnir veigamiklu hlutverki. Skoðið til dæmis myndina hér fyrir neðan sem fór víða á Netinu fyrir nokkrum árum. Á myndinni er búið að skeyta saman innri andlitspörtum Sigmundar Davíðs Gunnlaugssonar og ytri andlitsumgjörð Bjarna Benediktssonar. Það áhugaverða við myndina er að útkoman er ekki eitthvert meðaltal af Sigmundi og Bjarna, einhver Bjarnmundur, heldur allt annar maður sem líkist þeim ekkert endilega sérlega mikið en sem vill svo til að er ansi líkur fjölmiðlamanninum Ásgeiri Kolbeinssyni! Þegar við horfum á andlit þá virðist heildin ekki einungis vera summa partanna sem mynda hana; það hvernig maður táknar eða skynjar einstaka andlitsþætti fer eftir því hvernig aðrir andlitsdrættir eru og saman hafa þeir áhrif á heildaryfirbragð andlitsins.

Sigmundur Davíð, Bjarni Benediktsson og Ásgeir Kolbeinsson.

Það er mjög líklegt að heilinn noti ekki bara eina aðferð heldur margar til þess að bera kennsl á andlit. Margir vísindamenn aðhyllast þó að ein af þessum aðferðum feli í sér að hvert andlit sé kóðað eða táknað sem staðsetning á tilteknum víddum (e. dimensions) eða ásum (e. axes). Eitt dæmi um slíka vídd gæti verið hversu grannleitt eða búlduleitt andlitið er. Annað dæmi gæti verið hversu fíngert eða grófgert andlitið er. Þetta eru þó bara uppdiktuð dæmi, og alls er óvíst að slík orð nái utan um þær víddir sem heilinn notar raunverulega til þess að tákna andlit.

Nýlega var þó gerð áhugaverð rannsókn þar sem vísindamenn mældu virkni í tilteknum taugafrumum í sjónkerfi apa á meðan aparnir horfðu á hin ýmsu andlit, en sjónkerfi apa er afar líkt sjónkerfi manna. Vísindamennirnir breyttu andlitunum eftir fyrirfram gefnum víddum, þeir gátu til dæmis stjórnað hversu grannleitt eða búlduleitt hvert andlit væri, og skoðuðu svo hvaða áhrif það hefði á taugavirkni. Þeir komust að því að hver taugafruma virtist tákna tiltekna andlitsvídd en hunsa breytingar á öðrum víddum. Sem dæmi mætti ef til vill finna taugafrumu sem jók virkni sína við það að apinn sá grannleitt andlit og minnkaði virkni sína við það að apinn sá búlduleitt andlit; breytingar á því hversu fíngert eða grófgert andlitið væri hefði aftur á móti engin sérstök áhrif á virkni þessarar tilteknu frumu. Aftur á móti mætti svo að öllum líkindum finna aðra taugafrumu sem breytti virkni sinni eftir fíngert-grófgert andlitsvíddinni, en hunsaði breytingar á öðrum víddum svo sem grannleitt-búlduleitt víddinni. Saman gætu allmargar slíkar frumur táknað útlit andlitsins. Þetta er skref í þá átt að leysa gátuna um það hvernig við förum að því að þekkja andlit.

Helstu heimildir:
  • Chang, L. og Tsao, D. Y. (2017). The code for facial identity in the primate brain. Cell, 169, 1013-1028.
  • Peterson, M. A. og Rhodes, G. (Eds.). (2003). Perception of faces, objects, and scenes: Analytic and holistic processes. Oxford: Oxford University Press.
  • Sinha, P., Balas, B., Ostrovsky, Y. og Russell, R. (2006). Face recognition by humans: Nineteen results all computer vision researchers should know about. Proceedings of the IEEE, 94(11), 1948-1962.

Myndir:

Höfundur

Heiða María Sigurðardóttir

prófessor við Sálfræðideild

Útgáfudagur

6.9.2017

Spyrjandi

Ritstjórn

Tilvísun

Heiða María Sigurðardóttir. „Hvernig förum við að því að þekkja andlit?“ Vísindavefurinn, 6. september 2017. Sótt 25. apríl 2024. http://visindavefur.is/svar.php?id=74379.

Heiða María Sigurðardóttir. (2017, 6. september). Hvernig förum við að því að þekkja andlit? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=74379

Heiða María Sigurðardóttir. „Hvernig förum við að því að þekkja andlit?“ Vísindavefurinn. 6. sep. 2017. Vefsíða. 25. apr. 2024. <http://visindavefur.is/svar.php?id=74379>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Hvernig förum við að því að þekkja andlit?
Flest getum við heyrt, snert, fundið bragð og lykt, skynjað hita, kulda og sársauka. Án efa eru þó augun eitt mikilvægasta skynfæri okkar. Augun eru þó aðeins upphafspunkturinn í flóknu ferli sem gerir okkur kleift að sjá heiminn og umhverfi okkar. Í heilanum eru ótal mörg svæði sem vinna úr sjónrænum upplýsingum svo við getum borið kennsl á hluti í umhverfi okkar. Við erum svo góð í þessu að það kemur okkur á óvart hversu krefjandi þetta er í raun. Það sést kannski einna best á því að það hefur reynst þrautin þyngri að kenna tölvum, sem eru afar öflugar reiknivélar, að þekkja andlit – nokkuð sem menn eru sérfræðingar í og fást við á hverjum degi.

Eitt vandasamasta verkefnið sem sjónkerfi manna þarf að leysa er hið svokallaða óbreytnivandamál (e. invariance problem). Óbreytni (e. invariance) felst í því að kóða, skrá eða tákna bara það sem skiptir máli og hunsa þann breytileika sem skiptir ekki máli. Skoðið til dæmis samsettu myndina af höfundi þessa svars hér fyrir neðan. Kannski sjáið þið að þetta er allt sama manneskjan, en ef þið hugsið aðeins málið sjáið þið að myndirnar sjálfar eiga fátt sameiginlegt séu þær bornar saman punkt fyrir punkt. Mynd af mér þegar ég horfi til hægri er í raun miklu líkari mynd af Donald Trump að horfa til hægri heldur en fyrrnefnda myndin er lík mynd af mér að horfa beint fram.

Sama manneskjan á þremur myndum en ef myndirnar eru bornar saman punkt fyrir punkt þá eiga þær fátt sameiginlegt.

Ein aðferðin sem sjónkerfið virðist nota til þess að takast á við óbreytnivandamálið er að tengja saman það sem birst hefur eitt á eftir öðru í tímaröð. Ef þú hittir mig sæirðu mig alveg örugglega ekki bara frá einu sjónarhorni, heldur frá mörgum sjónarhornum hverju á eftir öðru. Heilinn virðist nota þá þumalputtareglu að það sem fer saman í tíma tilheyri líklega sama hlutnum. Næst þegar þú hittir mig gætirðu því mögulega þekkt mig frá ýmsum sjónarhornum af því að þú – eða heilinn í þér – ert búinn að læra að þrátt fyrir að myndirnar sem berast augunum líkist tæknilega séð eiginlega ekki neitt þá sé þetta eftir allt saman ein og sama manneskjan.

Þetta er líka ein af ástæðunum fyrir því að við erum merkilega léleg í því að þekkja fólk sem við höfum ekki hitt áður af myndum. Mynd hefur jú bara eitt sjónarhorn, einn bakgrunn, eitt birtustig og svo framvegis. Ef við sjáum viðkomandi úti á götu í einhverjum öðrum aðstæðum, kannski frá öðru sjónarhorni og í annars konar birtuskilyrðum, er allnokkuð líklegt að við áttum okkur ekki á því að þetta sé manneskjan á myndinni. Þegar verið er að lýsa eftir fólki, til dæmis þegar lögreglan leitar að týndum börnum, er því mikilvægt að láta ekki eina mynd af viðkomandi duga, heldur sýna margar myndir og jafnvel myndbönd af manneskjunni til að auka líkurnar á að óbreytnivandamálið komi ekki í veg fyrir að fólk beri kennsl á þann sem lýst er eftir.

Til þess að taka ekki „feil“ á mér og Donald Trump þarf sjónkerfið einhvern veginn að hunsa breytilegt sjónarhorn, bakgrunn, birtustig og annað sem litlu máli skiptir en tákna fremur það sem er einkennandi fyrir mig sem persónu, til dæmis hvort ég sé með lítil eða stór augu, hvort þau séu dökk eða ljós, hvort þau séu kringlótt, möndlulaga eða skáleit og svo framvegis. Allt þetta væri líklega dæmi um svonefnda þáttaháða skynjun (e. part-based processing), þar sem hlutir eru greindir niður í smærri parta eða þætti, og borin eru kennsl á hlutinn út frá einkennum þessara þátta.

Þáttaháð skynjun er samt ekki það sem talið er einkennandi fyrir andlitsskynjun. Það sem virðist sérstakt við andlitsskynjun, og sem er oft helst talið greina hana frá skynjun annarra hluta, er að heildræn skynjun (e. holistic processing) gegnir veigamiklu hlutverki. Skoðið til dæmis myndina hér fyrir neðan sem fór víða á Netinu fyrir nokkrum árum. Á myndinni er búið að skeyta saman innri andlitspörtum Sigmundar Davíðs Gunnlaugssonar og ytri andlitsumgjörð Bjarna Benediktssonar. Það áhugaverða við myndina er að útkoman er ekki eitthvert meðaltal af Sigmundi og Bjarna, einhver Bjarnmundur, heldur allt annar maður sem líkist þeim ekkert endilega sérlega mikið en sem vill svo til að er ansi líkur fjölmiðlamanninum Ásgeiri Kolbeinssyni! Þegar við horfum á andlit þá virðist heildin ekki einungis vera summa partanna sem mynda hana; það hvernig maður táknar eða skynjar einstaka andlitsþætti fer eftir því hvernig aðrir andlitsdrættir eru og saman hafa þeir áhrif á heildaryfirbragð andlitsins.

Sigmundur Davíð, Bjarni Benediktsson og Ásgeir Kolbeinsson.

Það er mjög líklegt að heilinn noti ekki bara eina aðferð heldur margar til þess að bera kennsl á andlit. Margir vísindamenn aðhyllast þó að ein af þessum aðferðum feli í sér að hvert andlit sé kóðað eða táknað sem staðsetning á tilteknum víddum (e. dimensions) eða ásum (e. axes). Eitt dæmi um slíka vídd gæti verið hversu grannleitt eða búlduleitt andlitið er. Annað dæmi gæti verið hversu fíngert eða grófgert andlitið er. Þetta eru þó bara uppdiktuð dæmi, og alls er óvíst að slík orð nái utan um þær víddir sem heilinn notar raunverulega til þess að tákna andlit.

Nýlega var þó gerð áhugaverð rannsókn þar sem vísindamenn mældu virkni í tilteknum taugafrumum í sjónkerfi apa á meðan aparnir horfðu á hin ýmsu andlit, en sjónkerfi apa er afar líkt sjónkerfi manna. Vísindamennirnir breyttu andlitunum eftir fyrirfram gefnum víddum, þeir gátu til dæmis stjórnað hversu grannleitt eða búlduleitt hvert andlit væri, og skoðuðu svo hvaða áhrif það hefði á taugavirkni. Þeir komust að því að hver taugafruma virtist tákna tiltekna andlitsvídd en hunsa breytingar á öðrum víddum. Sem dæmi mætti ef til vill finna taugafrumu sem jók virkni sína við það að apinn sá grannleitt andlit og minnkaði virkni sína við það að apinn sá búlduleitt andlit; breytingar á því hversu fíngert eða grófgert andlitið væri hefði aftur á móti engin sérstök áhrif á virkni þessarar tilteknu frumu. Aftur á móti mætti svo að öllum líkindum finna aðra taugafrumu sem breytti virkni sinni eftir fíngert-grófgert andlitsvíddinni, en hunsaði breytingar á öðrum víddum svo sem grannleitt-búlduleitt víddinni. Saman gætu allmargar slíkar frumur táknað útlit andlitsins. Þetta er skref í þá átt að leysa gátuna um það hvernig við förum að því að þekkja andlit.

Helstu heimildir:
  • Chang, L. og Tsao, D. Y. (2017). The code for facial identity in the primate brain. Cell, 169, 1013-1028.
  • Peterson, M. A. og Rhodes, G. (Eds.). (2003). Perception of faces, objects, and scenes: Analytic and holistic processes. Oxford: Oxford University Press.
  • Sinha, P., Balas, B., Ostrovsky, Y. og Russell, R. (2006). Face recognition by humans: Nineteen results all computer vision researchers should know about. Proceedings of the IEEE, 94(11), 1948-1962.

Myndir:

...