sunnuntai 25. toukokuuta 2008

Lojban manifesti

Tämä manifesti on yhteenvetoni lojban-kielen merkitystä koskevasta näkemyksestäni. Se käsittää neljä osaa:
  1. 1.Kielten olemus ja merkitys ihmiskunnalle.
  2. 2.Lojban-kielen olemus
  3. 3.Kielen merkitys maailman ja ihmiskunnan suurten ongelmien ja eksistentiaaliriskien hallinnassa.
  4. 4.Lojban-kielen osuus merkittävänä osana ongelmien kokonaisratkaisua.
Esitän tässä manifestissa, että kielet ovat ihmisen sivilisaation perusta. Nyt kuitenkin niiden puhekieleen pohjautuva rakenne on käynyt riittämättömäksi, kun edessä on yhä monimutkaisempien ongelmien ja koko ihmiskuntaa uhkaavien haasteiden ratkaiseminen. Esitän, että luonnollisiin kieliin perustumaton lojban-kieli tarjoaa luonnollisia kieliä tehokkaamman työkalun kaikkeen tieteelliseen ja yhteiskunnalliseen ongelmanratkaisuun. Tätä työkalua ihmiskunnalla ei ole varaa jättää käyttämättä.

Kielten olemus ja merkitys ihmiskunnalle

Kieli on ihmiselle ja ihmissivilisaatioille ominainen ajattelun väline. Minä sanoisin, että ihmisestä tuli ihminen silloin, kun ihmiskieli kehittyi sille tasolle, että kielenkäyttö alkoi sisältää sellaisia käsitteitä, kuin vaikkapa isä, äiti, lapsi, tytär, aamu, ateria. Käsitteellisiä ilmauksia näistä teki se, että ”isä” tarkoitti ketä tahansa isää, ”aamu” mitä tahansa aamua ja ”ateria” mitä tahansa ateriaa. Näitä sanoja opittiin käyttämään kielessä ja ennenkaikkea ajattelussa yksityisten isien, aamujen ja aterioiden yleistyminä.

Ihmisten käyttämiä kieliä ei yleensä ole suunniteltu joitakin poikkeuksia lukuunottamatta. Kielet ovat syntyneet hyvin pitkän, kymmeniä tai satoja tuhansia vuosia kestävän kulttuurievoluution tuloksena. Tämä kulttuurievoluutio oli niin pitkä, että se aivan ilmeisesti tapahtui rinnan, vuorovaikutuksessa biologisen evoluution kanssa. Tämä vuorovaikutus kehitti ihmisaivoihin kyvyn lapsena sujuvasti, itse asiassa hämmästyttävän helposti, omaksua vanhempien puhuma kieli. Siten asiantuntijoilla on yleisenä käsityksenä, että vaikka kielen mekanismi ei olekaan todennäköisesti sellaisenaan tallentunut geneettiseen perimään, ihmisen perimässä on voimakas ”induktiivinen bias”, mekanismi, joka tukee luonnollisten kielten oppimista ja myös kielen käyttöä abstraktin ajattelun välineenä. Tämä kielenkäytön kyky on se perusta, jolle sivilisaatiomme ovat rakentuneet.

Luonnolliset kielet eri puolilla maailmaa ilmeisesti muistuttavat toisiaan sen vuoksi, että ne ovat ihmiskunnan yhteisen biologisen perimän ilmentymiä. Puhekielet erovat toisistaan vain sen verran, kuin tämä yhteinen biologinen perimä joustaa. Luonnollisten kielten rakenne ei ole sellainen kuin niillä on, vain sen vuoksi, että tällainen rakenne (huomioiden sen vaihtelu eri kulttuureissa) olisi ainoa tai paras mahdollinen kielen rakenne. Se on sellainen siksi, että evoluution prosessi on kokeilujen, sattumien ja harhapolkujenkin tuloksena sen sellaiseksi muovannut. Ihmispopulaation onnistunut kielellinen kyvykkyys on usein ollut ratkaiseva tekijä tämän populaation säilymisessä ja leviämisessä.

Historillinen aika, siis kirjoitustaidon ja korkeakulttuurien syntyminen, toi kieleen uusia tasoja, jotka nykyään ilmenevät saman kielen erilaisina muotoina samassa kulttuurissa. Esihistoriallisena aikana oli olemassa vain puhekieli. Väitän, että nämä uudet muodot syntyivät kultuurien ratkaisuina luonnollisten kielten olemuksen sisältämiin ongelmiin. Näitä kielten erilaisia muotoja ovat nykyisin esimerkiksi
  • Puhekieli
  • Yleiskieli
  • Virallinen kieli
  • Kapulakieli
Puhekieli on sitä kieltä, jota ihmiset puhuvat kotonaan ja arjessa keskenään. Yleiskieli on ilmaisuiltaan muodollisempaa kuin puhekieli, jättäen jotakin pois ja lisäten jotakin. Yleiskieltä on esimerkiksi kieli, jolla asioidaan muodollisemmissa olosuhteissa, vieraiden ihmisten kanssa. Virallinen kieli on esimerkiksi laadukkaampien tiedoitusvälineiden, hallinnollisten tiedoitteiden ja juhlapuheiden kieli. Sen ilmaisut ovat vielä rajatumpia ja hallitumpia kuin yleiskielen ilmaisut, vaikka siihenkin on toisaalta lisätty ilmaisuja, jotka yleiskielestä puuttuvat. Yleissääntö on, että virallinen kieli pyrkii olemaan ilmaisultaan täsmällisempää ja tarkempaa kuin yleiskieli. Yleiskieli vuorostaan on täsmällisempää ja tarkempaa kuin puhekieli.

Puhekielessä luotetaan hyvin paljon siihen, että ilmaisut ovat kuulijalle tuttuja ja tunnistettavia jokapäiväisistä asiayhteyksistä, siitä huolimatta, että kielen rakenteiden johdonmukaisuudesta tingitäänkin.
Erikoisin ja kiinnostavin tapaus on ”kapulakieli”, jota tarvitaan välttämättä sellaisissa sovelluksissa, joissa ilmaisun yksiselitteisyys on tärkein kriteeri ymmärrettävyyden kustannuksella. Yleiskieli on on syntynyt puhekielestä, virallinen kieli yleiskielestä ja kapulakieli virallisesta kielestä. Kaikissa tapauksissa syynä muunteluun on ollut tarve välttää väärinkästyksiä, varmistaa välitettävän ajatuksen perillemeno sellaisille kuulijoille tai lukijoille, joilla ei ole kaikille ilmaisuille täsmälleen samoja viitekehyksiä. Sovellettaessa puhekieltä arjessa nämä viitekehykset ovat osapuolille tuttuja. Huoliteltu yleiskieli saattaa olla ymmärrettävyydeltäänkin parempaa kuin puhekieli. Kuitenkin jo virallinen kieli herättää kuulijassa usein ymmärtämisen vaikeuksia, joiden taakse esim. politiikan piirissä onkin tullut käytännöksi piilottaa merkittävää sisältöä vailla olevaa fraseologiaa.

Kapulakieltä tarvitaan esim. lakikielenä, sopimuskielenä ja patenttikielenä, joissa hyvinkin monimutkaiset asiasisällöt ja niiden sisäiset riippuvaisuudet on voitava esittää muodollisesti yksiselitteisesti. Yksiselitteisyyden kriteeri on, että tällaiseen kieleen erikoistuneet ammattilaiset ovat keskenään yksimielisiä sisällöstä. Kapulakielen ymmärrettävyys ei-ammattilaisille ei ole tärkeänä pidetty piirre.

Mitä kauemmas tässä saman kielen, esim. suomenkielen muunnelmien ketjussa erotaan puhekielestä, sitä huonompi tuki kielelle on aivojen arkkitehtuurisilla rakenteilla. Aivot ovat erikoistuneet nimenomaan puhekielen muodostamiseen ja ymmärtämiseen. Jo yleiskielen käytössä tarvitaan laajempaa opillista sisvistyneisyyttä ja harjautuneisuutta kapaulakielestä puhumattakaan. Kuitenkin puhekielen syvärakenteet ovat pohjana myös kapulakielessä.

Lähes kaikki ns. keinokielet, esim esperanto ja interlingua, perustuvat luonnollisiin kieliin eli puhekieleen ja soveltavat rakenteissaan puhekielen rakenteita. Siksi niitäkin käytettäessä on samanlainen tarve erilliseen kapulakieleen silloin, kun on tarvetta ilmaista absoluuttisen yksiselitteisesti erittäin monimutkaisia ajatusrakenteita. Näitä mainittuja keinokieliä ei ole insinööriajattelun mukaisesti suunniteltu logiikan ja informaatioteorian perusteista lähtien. Niiden tavoitteena ei ole se, että kieltä käyttäen olisivat mahdollisia täydellisen yksiselitteiset ilmaukset kielen normaalirakenteita käyttäen, ilman kapulakielen lisäyksiä. Nämä lisäykset toisaalta tekevät kielen käyttökelvottamaksi muuhun käyttöön.

Lojban-kielen olemus

Lojban-kielen kehitys alkoi 1950-luvulta, jolloin James Cooke Brown kiinnostui Sapir-Whorf hypoteesistä, jonka mukaan puhuttu kieli vaikuttaa erityisellä tavalla puhujan ajattelutapaan, tapaan hahmottaa ympäröivää maailmaa. Cooke Brown halusi luoda kielen, jolla testata hypotesia. Hän alkoi kehittää loglan-kieltä. Hän oletti, että kieli, joka on, toisin kuin luonnolliset kielet, mahdollisimman looginen ja yksiselitteinen, toisi selvimmin esiin Sapir-Whorf hypoteesin vaikutuksen.

Loglanin perustaksi Cooke Brown valitsi ensimmäisen kertaluvun predikaattilogiikan. Sanasto kehitettiin yhdistämällä algoritmisesti maailman kuusi puhutuinta kieltä loglanin ehdoilla. 1987 tekijänoikeuskiistan vuoksi lojban erosi loglan-kehittelystä omaksi kielekseen, mutta jatkaen jo omaksuttua linjaa. Lojbanin kehitystä jatkoi “The Logical Language Group”. Koska tällä välin lähdekielten (englanti, espanja, venäjä, arabia, hindi ja kiina) puhujien määrien suhteet olivat muuttuneet, niin käytetty ja uusittu algoritmi antoi hieman erilaisen sanaston. Lojban-kieli valmistui nykyiseen asuunsa 1997 yli 40v kestäneen huolellisen kehittelyn tuloksena.

Toisin kuin luonnolliset kielet ja niiden pohjalta kehitetyt keinokielet, lojban on insinööriajattelun mukaisesti suunniteltu logiikan ja informaatioteorian perusteista lähtien. Sen tavoitteena on, että kieltä käyttäen olisivat mahdollisia täydellisen yksiselitteiset ilmaukset kielen normaalirakenteita käyttäen, ilman kapulakielen lisäyksiä. Osoituksena tavoitteen saavuttamisesta lojban-kielelle on toteutettu BNF ja PEG jäsentimet (parserit). Lojbankielisen tekstin sisältö on siis tietyin edellytyksin mahdollista ohjelmallisesti tulkita semanttiseksi verkoksi riippumatta ilmaistavan ajatusrakennelman monimutkaisuudesta. Tämä tavoite ei ole lähelläkään toteutumista millekään luonnolliselle kielelle tai niiden pohjalta kehitetyille keinokielille.

Lojban on tarkoitettu ihmisten puhumaksi kieleksi. Se ei ole ohjelmointikieli eikä muutenkaan ”tietokonekieli”. Sitä käyttäen on kuitenkin aivan helppoa tuottaa sekavaa, sumeaa puhetta, josta ei saa tolkkua, vaikka se olisikin kieliopillisesti virheetöntä. Mutta luonnollisiin kieliin nähden tilanne eroaa siinä, että sisällön johdonmukaisuus on mahdollista testata joko ihmisen, tai puolueettomasti, tietokoneen toimesta.
Lojban olisi täydellinen kieli kaikkiin niihin tehtäviin, jossa nyt tarvitaan luonnollisiin kieliin pohjautuvaa kapulakieltä. Kapulakieltä on hyvin vaativaa tulkita ilman erityiskoulutusta (juristi, patenttiasiamies ym), mutta sitä ei ole siitä huolimatta mahdollista tulkita konellisesti, koska se edelleen sisältää asiayhteyksistä riippuvaista osaamista. Tämä tarkoittaa hyvin laajaa yleis-ja erikoistietoa edellyttävää osaamista, jota tietokonejärjestelmällä ei toistaiseksi ole.

Lojbanin etu olisi siis myös se, että se mahdollistaisi monien inhimillisille virheille, heikkouksille ja puolueellisuuksille alttiiden informaationkäsittelytehtävien toteuttamisen luotettavammin ja puolueettomammin tietokoneavusteisesti. Eivätkä monen tällaisen työkalun toteutukset vielä edellyttäisi mitään ”vahvaksi tekoälyksi” kutsuttua teknologiaa.

Tässä yhteydessä ei ole mahdollista mennä yksityiskohtiin, mutta jo lojban-kielen juurisanaston määrittely mallintaa maailmaa perustavaalaatuisesti eri tavalla kuin luonnolliset kielet. Lojbanissa ei ole esim. substantiivejä, verbejä ja adjektiiveja, vaan juurisanat ovat kaikki predikaattilogiikan relaatiota, suhdesanoja, jotka määrittelevät parametrien suhteita toisiinsa. Lojbankieliset lauseet jäsentyvät siten suhteellisen yksinkertaisesti semanttiseksi verkoksi. Lojban-tyypisen loogisen ajattelutavan opiskelu ja omaksuminen saattaa viedä aikaa.

Lojbanin kehitys ei ole vielä lopussa. Koska sen käyttö on vasta ollut kokeilevaa ja lähinnä viihteellistä, osaajia on vähän, eikä sitä ole sovellettu todella vaativiin tehtäviin. Siten esimerkiksi sen sanastoa on täydennettävä, jotta aukottomien, konsistenttien ontologisten käsiteverkkojen määrittely olisi lojbanilla mahdollista.

Kielen merkitys maailman ja ihmiskunnan suurten ongelmien ja eksistentiaaliriskien hallinnassa

Ludwig Wittgenstein, ehkä 1900-luvun merkittävin filosofi, oli vakaasti ja perustellusti sitä mieltä, että kaikki merkittävät filosofiset ongelmat ovat todellisuudessa kielen ongelmia. Puuttumatta tässä tarkemmin siihen, mitä Wittgenstein edellisellä tarkoitti, olen itse sitä mieltä, merkittävä osa niistä suurista nykyajan ongelmista, joiden perusteissa ihmiset itse ovat mukana, ovat todellisuudessa myöskin kielen ongelmia. Täällä tarkoitan kahta toisiinsa liittyvää asiaa:
1.Luonnollisten kielten resurssit eivät enään riitä yhä monimutkaistuvan maailman mallintamiseen yksittäisten ihmisten subjektiivisen ajattelun välineinä.
2.Luonnollisten kielten kyky välittää monimutkaisia ajatusrakennelmia yksiselitteisesti ihmisten ja ihmisjoukkojen välillä on vakavasti ylitetty.

Useimmat aktiivisesti tiedoitusvälineitä seuraavat ovat täysin selvillä suuresta joukosta koko maailmaa joko suoraan tai välillisesti uhkaavista ongelmista, jotka kärjistyessään tai lauetessaan saattavat tuhota maailmanjärjestyksen, hyvinvoinnin perustan, taloudellisen ja teknologisen globaalisen infratruktuurin, sivilisaatiomme, biosfäärin ja mahdollisesti koko ihmiskunnan. Näitä ovat esimerkiksi jatkuva ydinsodan uhka, ylikansoittuminen, pandemioiden uhka, ilmastonmuutoksen uhka, globaalin taloudellinen romahduksen uhka, globaalin teknologisen infrastruktuurin romahdus, globaalit poliittiset kriisit ynnä monet muut. Näiden uhkien todellisuuden ja mekanismien mallintaminen ja arvioiminen sijoittuu parhaimpien käytettävissä olevien asiantuntijoiden hallintakyvyn rajoilla tai on jo ylittänyt sen monissa tapauksissa.

Eritysesti globaalit ongelmat ovat sen laatuisia, että niissä on paljon epävarmoja parametreja ja ongelmien asiantunteva käsittely edellyttää useampien eri osa-alueiden hallintaa, kuin on yhdelle ihmiselle mahdollista. Siten niiden ratkaisu on väistämättä kansainvälistä asiantuntijoiden ryhmätyötä. Tällainen työskentely edellyttää sitä, että kaikilla on yhteinen ja yksiselitteinen kuva kaikista asiaan vaikuttavista käsitteistä sekä yhteiset mallit kuvaamaan monimutkaisten järjestelmien sisäisiä vuorovaikutuksia, riippuvaisuuksia, vapausasteita ja epälineaarisia kynnystilanteita. Todellisuus on osoittanut, että hyvin monissa tapuksissa jo aivan peruskäsitteistä on suuria erimielisyyksiä varsinaisista ratkaisumalleista puhumattakaan.

Pohjimmaisena syynä tähän tilanteeseen minä näen sen, että luonnolliset kielet, joiden syvämekanismit ovat evoluution myötä vuosituhansien kuluessa sopeutuneet arkieleämän rajoittuneiden ongelmien mallintamiseen ja ongelmien rakennetta ja ratkaisumalleja käsittelevien ajatusrakennelmien vaihtoon. Nämä kielet saattavat siten olla täysin riittämättömiä nykyajan vaikeimpien ongelmien ja uhkien käsittelyyn. Mitkään pienet korjaukset ja kapulakielen käyttöönotto eivät voi ratkaista tilannetta. Rajoitettuna apuna toimivat kyllä esim. tietokoneistetut visualisointimenetelmät, mutta niilläkin on rajoituksensa, jos jo perusasioiden määritelmistä ollaan eri mieltä.

Ongelmien hallinta ja ratkaisu suuren asiantuntijajoukon saumattomalla yhteistyöllä edellyttää tapaa, jolla voidaan määritellä yksiselitteisesti, aivan perustoista alkaen, kaikki ongelma-alueen käsitteet ja prosessit, todelliset tilanteet ja vuorovaikutusmekanismit siten, että niistä voidaan keskustella ilman väärinymmäryksen vaaraa. On osoittautunut, että luonnollisilla kielillä tämä ei ole käytännössä mahdollista tai on hyvin vaikeaa. Tämä tilanne valkenee jokaiselle, joka avoimin silmin seuraa väittelyä globaaleista ongelmista. Väittelijät, usein korkeasti koulutetut ja hyvin älykkät, eivät ymmärrä toisiaan riittävällä tarkkuudella ja puhuvat pahasti ristiin!

Tässä on väitteeni heikkous. Sapir-Whorf hypotesiä ei ole aukottomasti todistettu paikkansa pitäväksi, vaikka siinä oletetaankin olevan ainakin totuuden siemen. Kukaan ei ole tutkinut, eikä tule tutkimaankaan, huippuammattilaisten työtapojen pullonkauloja. Väitteestäni lievempi onkin se, että Sapir-Whorf hypotesin mukaisesti parempi kieli merkittävästi auttaisi yksilön omaa sisäistä älyllistä työskentelyä ja ongelmanratkaisua. Ehkä auttaisi, mutta ei välttämättä ratkaisevasti.

Sen sijaan oma kokemukseni suurten organisaatioden työskentelystä on sopusoinnussa sen kanssa, että ryhmätyöskentelyssä merkittävä heikko tekijä on asiantuntemuksen siirtäminen organisaatiolta ja henkilöiltä toisille ja osa-asiantuntemuksien integrointi yhteiseksi saumattomaksi ymmärrykseksi. Merkittävä osatekijä tässä, työskentelykäytäntöjen lisäksi, on kielen (minun kokemuksessani joko suomen- tai englanninkieli) rajoittunut kyky määritellä yksiselitteisesti monimutkaisia ontologioita eli käsiteverkkoja. Tuntemassani insinöörikulttuurissa luotetaankin luonnollisen kielen rinnalla merkittävästi muihin apuvälineisiin, kuten vain yhtenä esimerkkinä mainitakseni graafisen UML-kielen. Mutta UML-kielen mahdollisuudet ovat kuitenkin hyvin kapeita ja rajallisia verrattuna luonnollisen kielen joustavuuteen. Se ei sujuvasti taivu mihin tahansa käyttöön ja UML-dokumenttien luominen on työlästä verrattuna verbaaliseen ilmaisuun. Siis parempi, loogisempi, monimutkaista todellisuutta tarkemmin kuvaava kieli, joka toimii sekä ihmisten puhekielenä, että myös ongelmien eksaktina määrittelykielenä, on maailman ongelmien ratkaisemiseksi välttämätön.

Lojban-kielen osuus merkittävänä osana ongelmien kokonaisratkaisua

Onko lojban-kielellä siis käytännön mahdollisuuksia realisoitua ratkaisumalliksi vakavien globaalien ongelmien ratkaisutyökaluksi? Mahdollisuudet ovat melko pienet, mutta eivät suinkaan olemattomat. Uudet menetelmät ovat ennenkin murtautuneet käytöön hyvin lyhyessä ajassa, jos niiden tehosta on vahva näyttö, alun vaikeuksista huolimatta. Paras esimerkki, eikä mitenkään kaukaa haettu, on WWW, World Wide Web, joka alle kymmenessä vuodessa mullisti globaalin informaatioinfrastruktuurin. Se ei tullut tyhjästä: internet ja IP, Internet Protokolla, olivat olleet käytössä jo vuosia, mutta vasta WWW:n HTTP-protokolla muutti kaiken. Vastaavasti myös lojbanilla on potentiaalia liittyä läheisesti internetin seuraavaan vaiheeseen, Semanttiseen Webiin.

Mitä siis pitäisi tapahtua, jotta lojbanista todella olisi apua? Ajattelen, että tarvittaisiin seuraavat askeleet:

  1. Jo olemassa olevien lojban-harrastajien lisäksi uusi ydinjoukko, mielellään eri alojen erikoisosaajia, opiskelee lojban-kielen käyttäen yhteistyötä ja olemassaolevia resulsseja, joita opiskelun ohessa parannetaan.
  2. Lojban-osaajista osa keskittyy opetusmenetelmien ja materiaalin kehittämiseen, toinen osa omien alojensa ontologioiden sekä uuden sanaston kehittämiseen ja kolmas osa tietokoneavusteisten tekstianalyysi- ja tietämyskantatyökalujen kehittämiseen.
  3. Edellisen vaiheen kehitystyön tuloksia käyttäen käynnistetään uusien lojban-osajien tehokoulutus sekä perustetaan muutama ”proof on concept” -projekti, jotka soveltavat lojban-osaamista, koko ongelma-alueen mallintamista lojban-ontologisisilla käsiteverkolla, joiden konsistenttisuus on tarkastettu tietokoneavusteisesti.

Kun tämä kolmas taso on toteutettu, en usko enään löytyvän suurempia esteitä lojbanin käytön eksponentiaaliselle leviämiselle.

Oleellista on, että lojbanille voi löytää laajaa hyötykäyttöä kaikesta tutkimuksesta, tuotekehityksestä ja yhteiskunnallisista hankkeista, äärimmäisen tärkeiden globaalisten ongelmien ratkaisujen rinnalla. Näen lojbanin ennenkaikkea asiantuntijoiden työkaluna, en minään maailmanlaajuisena kaikkien yhteisenä apukielenä. Pelkään sitä, että jos lojbanista tulisi joidenkin ihmisryhmien arkipäiväinen puhekieli, se pian rappeutuisi luonnollisten puhekielten tasolle, jolloin tehokkaan, eksaktin lojbanin ja puhekielen ero ja kynnys hämärtyisi. Hyväksyn lojbanin tulevaisuuden kouluaineeksi sanotaan nyt vaikka yläasteelle, koska olisihan oikein, että kaikilla ihmisillä olisi kyky ymmärtää esim. lojbaniksi koottuja lakeja.

Lojbanin mahdollinen käyttö semanttisen webin ontologioiden syöttö- ja hallintatyökaluna liittyy läheisesti lojbanin soveltuvuuteen yleiskäyttöisenä ihmisen ja tietokoneen ilmaisuvoimaisena ja äärimmäisen joustavan yhteisenä kielenä, tulevaisuuden AGI-tasoisten tietokonejärjestelmien ”äidinkielenä”. (AGI = Yleinen, erikoistumaton Tekoäly) AGI-tasoiset tietokonejärjestelmät hallitsevat lojbanin jälkeen nopeasti myös luonnolliset kielet, mutta tämän tason saavuttamisen arvoa himmentää sen, että haastavien, monimutkaisten tietämysrakenteiden hallinta sujuu joka tapauksessa helpommin ja vähemmän virhealttiisti lojbania käyttäen.