lauantai 6. joulukuuta 2008

Yleisen tekoälyn tilanne

Todellinen ymmärrys yleisen tekoälyn (AGI: Artificial General Intelligence) teknologisesta tilanteesta ja vakavastiotettavuudesta on hyvin puutteelista tekniikan asiantuntijoiden, yhteiskunnallisten päättäjien ja luonnollisesti myös "tavallisten ihmisten" keskuudessa. Onko yleinen tekoäly, AGI jotakin, joka liittyy vain scifi-kirjallisuuden fantasiamaailmoihin tai ehkä todellisuutta joskus satojen vuosien kuluttua? Yleisestä tekoälystä käytetään myös merkitykseltään läheisiä käsitteitä kuten "vahva tekoäly" tai epämääräinen "todellinen tekoäly". Lisäksi yleisen tekoälyn saavuttaminen tunnutaan yhdistettävän ihmisaivojen rakenteen täydelliseen ymmärtämiseen, ilmeisesti myös väärinkäsityksien seurauksena.

Jos AGI on vain kaukainen mahdollisuus, niin siinä tapauksessa siitä kirjoittaminen on vain viihdettä tai akateemista pohdiskelua. Mutta jos tilanne olisi sellainen, että esim. ihmisaivojen suorituskykyä useimmissa kategorioissa lähentelevä AGI voisi olla todellisuutta suhteellisen lähiaikoina, mihin asioihin tällä voisi olla merkittäviä seurauksia? Minä erittelisin kolme merkittävää asiaryhmää:
1. Työllisyys ja maailmantalous
2. AGI:n vaikutus muiden tieteen ja teknologian alojen kehitykseen.
3. AGI:n vaikutus AGI:n itsensä kehitykseen.
Neljäntenä ryhmänä voisi olla AGI:n vaikutus sotateknologiaan ja siihen liittyvät globaalit turvallisuusuhat.

1700-luvulta alkaen tekniikan kehityksen mahdollistama automaatio on, paitsi vallankumouksellisesti parantanut teollisen työn ja pääoman tuottavuutta (ja siten pudottanut lähes kaikkien teollisten tuotteiden reaalihintoja), myös automaatio on vähentänyt materiaalisten hyödykkeiden tuotannosta elantonsa saavien ihmisten suhteellista osuutta, eikä tämä kehitys on mitenkään vielä päättynyt. Siten yhä suurempi osa väestöstä hankkii palkkatulonsa tuottamalla palveluita tai toimimalla erilaisissa informaationkäsittelyammateissa (toimistotyöskentelijät, suunnittelijat, johtajat ym.). Näidenkin alojen tuottavuutta automaatio ja informaatiotekniikka on parantanut, mutta kehitys ei ole ollut yhtä rajua kuin teollisuustuotannossa. Yhä useammat ihmiset ansaitsevat toimeentulonsa tietokoneruudun ja näppäimistön ääressä. Näiden viimeksimainittujen työntekijöiden tehtäville AGI voi tuoda vastaavan, mutta vielä nopeamman kehityksen kuin mitä teollisuusammateille on käynyt. Tämän kehityksen seurauksena myös informaationkäsittelyammattien työllistävyys voi romahtaa hyvinkin nopeasti. Tällainen kehitys voisi laukaista tapahtumaketjun, joka ensin leikkaisi ostovoiman valtavalta joukolta ihmisiä ja sen seurauksena mullistaisi maailmantalouden.

Yleinen tekoäly on työkalu, joka jo hieman vaatimattomammallakin suorituskyvyllä mahdollistaa teknisen tuotekehityksen ja tieteellisen tutkimuksen rutiinitehtävien joustavan automatisoinnin ilman rankkaa erikoistyökalujen tuotekehitysvaihetta, vain opettamalla uudet tehtävät AGI:lle. Seurauksena on todennäköisesti tutkimuksen ja tuotekehityksen merkittävä nopeutuminen.

AGI:n käyttäminen "kehittämään itseään" on mielenkiintoinen ja vaarallinen vaihe. Siinä vaiheessa, kun tavoite- ja arvohierarkiat ovat muutoksen ulkopuolella, vaarat ovat pienempiä, mutta jos projekti ja AGI:n oma arkkitehtuuri ovat kokonaisuudessaan sen itsensä muutettavissa, ollaan hyvin, hyvin vaarallisilla vesillä.

Edellämainituista syistä on tärkeää, että vastuulliset tahot ymmärtävät mihin suuntaan maailma on menossa, jos asia on niin, että yleinen tekoäly on toteutettavissa suhteellisen lähitulevaisuudessa eikä vasta joskus vuosisatojen kuluttua. Jos tilanne on tämä, niin esim. AGI-kehityksen kieltäminen, rajoittaminen tai valvonta ei ole vaihtoehto, koska esim. ydinasekehitykseen verrattuna AGI-kehitys on halpaa ja helposti salassapidettävää, siis mahdotonta valvoa.

Mutta nyt pääasiaan. Mikä on AGI-tutkimuksen ja tuotekehityksen tila? Onko niin, että esim. 60-luvun varhaisten odotusten ja lupausten muuttuminen pettymyksiksi samaan tapaan kuin japanilaisten "viidennen sukupolven tietokone" -hanke 80-luvulla, ovat edelleen päteviä todisteita siitä, että yleinen tekoäly on joko pysyvästi tai pitkään ihmisteknologian tavoittamattomissa? Ovatko vanhat epäonnistumiset todiste tulevaisuuden suhteen? Mielestäni tuollainen päättely olisi hyvin kehittymätöntä analyysia. Vanhat epäonnistumiset voivat kertoa tulevasta vain niillä edellytyksillä, että olosuhteet ja resulssit ovat pysyneet muuttumattomina ja epäonnistumisista ei ole opittu mitään. Mutta näiden edellytysten mukainen tila on hyvin kaukana todellisuudesta. Epäonnistumiset on analysoitu, paljon uutta tietoa ja ymmärrystä on hankittu, sekä laitteistotehot ovat tuhat- tai miljoonakertaistuneet.

Kaksi keskeistä (paljon muitakin olisi helppo luetella) aikaisempien vuosikymmenten virhettä, jotka yleiseen tekoälyyn tähtäävät hankkeet ovat tehneet ovat:
1. Luottaminen yhteen (tai muutamaan) paradigmaan järjestelmäarkkitehtuurissa.
2. Common Sense -tiedon ja -ymmärryksen välttämättömyyden ymmärtämättömyys.

Järjestelmäarkkitehtuurin paradigmoilla tarkoitan keskeisiä käytettyjä menetelmiä ja kognitiivisiä rakenteita, kuten esimerkiksi funktionaalinen ohjelmointi, aksiomaattisiin sääntöjärjestelmiin perustuvat asiantuntijajärjestelmät, semanttiset verkot, sumea logiikka, keinotekoiset neuroverkot ym. Nykyisin ymmärretään, että toimiva AGI-arkkitehtuuri edellyttää useiden, hyvin monien, paradigmojen integrointia toimivaksi kokonaisuudeksi.

Samoin ymmärretään järjestelmän tarvitsevan sen lisäksi, että järjestelmään eksplisiittisesti ohjelmoidaan rajoitettu, vaikka hyvinkin suuri joukko sääntöjä ja faktoja, vielä esim sata-, jopa monituhatkertaisen määrän vaikeasti symbolisesti muodostettavia sääntöjä ja havaintoja, joista suurin osa on epävarmoja, probabilistisia. Tämä "Common Sense" -tietämyskanta, jota tarvitaan luomaan "todellisuuteen maadoitettu" sisäinen malli maailmasta, on mahdollista hankkia ainostaan samankaltaisen oppimisprosessin kautta, jonka ihmislapsi käy läpi. Tätä tietokokonaisuutta järjestelmä käyttää esimerkiksi luonnollisen kielen oppimiseen ja ymmärtämiseen sekä reaalimaailman ilmiöiden ymmärtämiseen.

Mikä on sitten alan tämänhetkinen tilanne, vuoden 2008 lopussa? Verrattuna esim. vuosikymmenen takaiseen tilanteeseen, voidaan todeta, että yleisen tekoälyn tutkimus ja kehitys on vilkastunut merkittävästi, vaikka tehokkaasti rahallisesti tuetut hankkeet puuttuvatkin vielä, ainakin julkisuudesta. AGI-piireissä järjestetään vuosittain useita tapaamisia ja konferensseja, useita aihetta käsitteleviä tasokkaita kirjoja julkaistaan vuosittain ja ennenkaikkea, työn alla on useita suhteellisen tasokkaan kypsyysasteen saavuttaneita projekteja, joiden toteuttajien välillä vallitsee vilkas keskusteluyhteys. Useat näistä projekteista pystyvät esittelemään prorotyyppitasolla vakuutavaa toimintakykyä.

Esimerkkejä (mielestäni) merkittävimmista projekteista:
Novamente Cognition Engine
http://www.agiri.org/wiki/Novamente_Cognition_Engine
LIDA
http://ccrg.cs.memphis.edu/projects.html
SOAR
http://sitemaker.umich.edu/soar/home
CYC
http://www.cyc.com/
SNePS
http://www.cse.buffalo.edu/sneps/

Mikään näistä projekteista ei todennäköisesti ole valmistumassa ihan lähivuosina "kypsäksi AGI-järjestelmäksi". Todennäköisempää on, että moni näistä toimii perustana uusille uusille, seuraavan vuosikymmenen aikana käynnistettävälle projekteille, hyödyntäen hankitun osaamisen ehkä useammasta muustakin projektista. On tietysti mahdollista, jopa todennäköistä, että on olemassa myös täysin salaisia, hyvinkin edistyneitä projekteja.

Lueteltujen konkreettisten projektien ja muiden vastaavien lisäksi kehitetään useita AGI-hankkeita tukevia teknologioita, kuten esimerkiksi Semanttinen Web, jonka piiriin kuuluu olellisesti semanttisen tiedon ja ymmärryksen poimiminen vapaamuotoisesta tekstistä, siis luonnollisen kielen ymmärrys, esimerkkinä tästä esim. Twine-projekti.
http://www.twine.com

Vertaan tilannetta siihen, mikä oli GSM-matkapuhelinteknologialla 30v sitten, 1978. Silloin oltiin rakentamassa sen edeltäjää, analogista NMT-teknologiaa. ARP-verkko edusti Suomessa teknologian käytännön tasoa, mutta digitaalisen matkapuhelintekniikan perusteet olivat samalla tavalla yleisesti ymmärrettynä tietona kuin AGI-järjestelmän perusteet ymmärretään tänään. Mutta kesti neljä vuotta, ennenkuin 1982 perustettiin Groupe Spécial Mobile (GSM) määrittelemään järjestelmää, jonka toteuttaminen kesti vielä yhdeksän vuotta, kunnes 1991 Radiolinja käynnisti maailman ensimmäisen GSM-verkon. Samoin pidän mahdollisena, että esim. n.2012 käynnistyy iso, kaupallinen, suuren rahan projekti, joka yhdistää aikaisempaa AGI-osaamista laajalti, ja hankkeen tuloksena esim. n.2021 on valmiina toimivana yleisen tekoälyn järjestelmä, joka kommunikoi sujuvasti ihmisten kanssa luonnollisia kieliä käyttäen, pystyy omaksumaan uutta osaamista vapaamuotoisista ohjeista, oppii virheistään ja kykenee suoriutumaan useimmista niistä tehtävistä, joista toimistotyöntekijät tänä päivänä suoriutuvat tietokonetta työkalunaan käyttäen. Järjestelmä on siis työntekijänä useimmilta osin ihmisen kykyinen, mutta tuottavampi ja väsymätön. Tietenkään kehitys ei lopu tähän vaan on itseään ruokkivaa.

Tämä on kaikki mahdollista, mutta ei varmaa. Mutta tällaisen lähitulevaisuuden todennäköisyysaste on niin suuri, että päättävässä asemassa olevien olisi jo erittäin kiire alkaa valmistautua siihen, mikä ehkä jo 14v kuluttua (tai aikaisemmin!) voi olla todellisuutta ja muuttaa maailmaa oleellisesti enemmän kuin internet alkaen n.15v sitten.