lauantai 26. heinäkuuta 2008

Mitä tarkoitetaan ymmärtämisellä?

Tämä on vanha minua vaivannut kysymys, johon Marvin Minsky antoi aikoinaan minulle suhteellisen riittävän selityksen: "Jokin asiantila tai käsite ymmärretään, jos osataan yhdistää se kaikkiin siihen liittyviin muihin käsitteisiin tai riippuvaisuuksiin." Tämä riitti minulle pitkän aikaa.
Viime aikoina olen alkanut ajatella, että selitys ei aivan riitä. Viitaten pariin aikaisempaan kirjoitteluuni, olen sitä mieltä, että ymmärtämistä on (ainakin) kahta täysin erilaista. Lojbanin käsite:
jimpe X1 ymmärtää totuuden X2, X3:sta
Tarkoittaa "semanttista ymmärtämistä". Semanttinen ymmärtäminen tapahtuu semanttisen, käsitemuistin, kielen tasolla. Se on sitä ymmärämistä, johon "kiinalaisen huoneen" sanakirja, tulkitsija-yhdistelmä pystyy.
http://erin.mit.jyu.fi/pako/kurssit/AI2001/l1/lect1/node9.html

Mutta toinen ymmärtämisen taso, joka kytkee ymmärtäjän reaalimaailmaan, on "common sense -ymmärtäminen". CS-ymmärtäminen on tietoisuuden alapuolella tapahtuvaa ymmärtämistä, joka hyvin monipuoleisten linkkien ja suhteisen avulla liittää ymmärrettävän asian aistein havaittavaan reaalimaailmaan. Kiinalainen huone ei tähän pysty. Mutta esimerkiksi vasta 2v ikäinen lapsi pystyy jo hyvin suuressa määrin CS-ymmärrykseen. Todennäköisesti yksikään tietokonejärjestelmä ei vielä vuonna 2008 pysty 2v ikäisen lapsen tasoiseen CS-ymmärrykseen, vaikka semanttisessa ymmärryksessä olisikin valtavan paljon parempi, jopa luonnollisen kielen ymmärryksessä.

Mutta voiko tekoälyjärjestelmä olla oikeasti toimintakykyinen, joustava, oppiva, luova, vaikka sillä ei olisi mitään (aisti-)kontaktia reaalimaailmaan, siis ei myöskään CS-ymmärrystä? Monien mielestä ei voi. Minä en ole asiasta aivan varma. Olen taipuvainen ajattelemaan, että on mahdollista olla aidosti älykäs tekoälyjärjestelmä, jolla on vain oma, suppea, rajattu (sisäinen) toimintamaailmansa ja vaikkapa pelkkä sarjamuotoinen tekstiyhteys, chatti, ulkomaailmaan, mutta kaikki muu järjestelmän kokema todellisuus on tietokoneen muistin datarakenteita.

Voiko joku selittää, miksi olen väärässä?

Ps. Niiden kahden ymmärtämisen lisäksi voi olla hieman spekulatiivisempiä ymmärtämisen lajeja, esim. "emotionaalinen ymmärtäminen" tai "spirituaalinen ymmärtäminen". Mutta en halua jatkaa niistä. Ne eivät ole tämän blogin tonttia.

5 kommenttia:

Anonyymi kirjoitti...

Ymmärrys-käsitettä ei saisi rajoittaa aivotoimintoihin.

Wikipedian mukaan
Keskushermosto on ihmisen toiminnan lähde. Se käsittelee tietoja ja pitää meidät yhteydessä ulkomaailmaan.

Tämä on nykyaikainen käsitys ja siinä on potentiaalinen virhe. Tuskinpa vastaavaa keskushermosto-käsitettä olisi olemassa ilman teollista aikaa.

Kukaan ei voi kiistää etteikö ihmisen kokonaisvaltaista älykkyyttä olekin jatkuvasti ulkoistettu teknologian haltuun. Esimerkiksi vanhanaikainen kirjanpainokone on tällainen joka hoitaa yhden osan ajatteluprosessista siksi että vaikkapa painetuissa almanakoissa asioita on laskettu valmiiksi, jotta ihminen vapautuu siltä ajatustyöltä. Tästä on kyse: Se osa ymmärryksestä korvataan joka suinkin on korvattavissa. Tässä korvattiin sormilla laskeminen. Kukaan ei enää laske sormilla eli sormi ei ole tietoinen.

Tekoälyjärjestelmät eivät simuloi samaa todellisuutta. Simulointi edellyttäisi aikamoista perhosensiipiefektien laskemista.

Tekoälyjärjestelmä on kuitenkin voimakas vaikuttaja, ja se ehkä siksi lasketaan "tiedostavaksi" olennoksi, kuten esim tuli ennen.

Tulella on ihmisen historiassa merkittävä rooli, ja se on ehkä ollut ensimmäisiä palvottavia asioita, joita ihminen on hallinnut, aluksi huonommin ja sitten yhä paremmin.

JuSa kirjoitti...

"Ymmärrys-käsitettä ei saisi rajoittaa aivotoimintoihin."

Tottakai ymmärrys-käsitettä voi laajentaa, mutta siinä tapauksessa laajennukselle pitäisi ottaa käyttöön uusi sana. Ei ole mielestäni mikään erityinen sekaannuksen riski, jos "bioaivoymmärrys" ja koneymmärrys ilmaistaan samalla sanalla, mutta esimerkiksi sosiaalinen tai kollektiivinen ymmärrys on hieman eri käsite. Samoin välineiden (tietokone, laskin, byrokraattinen järjestelmä ym) varassa oleva ymmärrys on selvästi eri käsite.

Minulla on paljon "lukemattomia kirjoja". Niiden sisältämä ymmärrys on fyysisesti minua lähellä ja joissakin tapauksessa helposti käytettävissäkin, mutta silti ei minun omaa ymmärrystäni.

Lisäisin vielä alkuperäisiin ymmärryksen käsitteilleni, siis semanttiselle ymmärrykselle ja CM-ymmärrykselle tuttummat nimet:
"teoreettinen ymmärrys" ja "intuitivinen ymmärrys", jota mielestäni tarkoittavat suunnilleen samaa, kuin alkuperäiset nimikeet

Anonyymi kirjoitti...

"Samoin välineiden (tietokone, laskin, byrokraattinen järjestelmä ym) varassa oleva ymmärrys on selvästi eri käsite."

Niin on, ja se olisi korjattava. On luovuttava vaikka sitten ymmärrys käsitteestä.

Wittgensteinin myöhäisajattelu meni jotakuinkin niin että jos eläin osaisi puhua, emme ymmärtäisi sitä. Se ei ehkä pidä täysin paikkaansa mutta eri yksilöillä, ikäisillä, rodulla, lajeilla ja varsinkin täysin eri tavoin koostuvilla agenteilla (ihminen ja kone) on niin suuria eroja ajattelussa, ettei vertaaminen ole tarpeellista.

Jos kieli vaikuttaa ajatussisältöön niin esimerkiksi perimä vaikuttaa suotuisasti tai epäsuotuisasti kielen oppimiseen.

JuSa kirjoitti...

"tekstin ymmärtäminen kokonaisuutena muodostuu viittauksista tekstin yksittäisiin osiin, ja yksittäisten kohtien ymmärtäminen puolestaan viittauksista kokonaisuuteen"

Täm on suunnileen sitä, mitä Pei Wang tarkottaa ilmaisulla "non-aximatic intelligency".

Siis ymmärtäminen ei perustu aksioomeihin vaan probabilistisiin keskinäisiin osien suhteisiin ja ymmärtäminen on edelläkuvatun kaltainen iteratiivinen prosessi, joka ankkuroituu ainoastaan kokemusperäisiin havaintoihin (jotka nekin tulkitaan realistisesti epävarmoiksi, vähintään niiden muistijäljet).

Anonyymi kirjoitti...

Ymmärrän nuo käsitteet jotenkin... En ole täysin samaa mieltä siitä että käsitteellinen ajattelu olisi "pintaväreilyä", mutta ymmärrän että se on ikään kuin murto-osa ajattelusta. Oikeastaan minun on vaikea erottaa aksiomaattista ja probabilistista ajattelua, koska ne ovat korvattavissa toisilla. Probabilistinen tutkimus pitää myös perustella aksiomaattisesti.

Ainahan asioita yritetään ankkuroida aksioomeihin mutta ne minustakin lopulta ankkuroituu vain "nähtävissä oleviin" ilmiöihin. Ja näkeminen on hermosolutason toimintaa.