sunnuntai 23. maaliskuuta 2008

Ehdotus: lojban aiheeksi pro gradu-työhön

Mielestäni lojban ja siihen liittyen semanttiset verkot ja tietämyshallinnan käyttöliittymät olisivat loistava aihe pro gradu- tai diplomityöksi. Aihe sopisi IT-lähestymistavan lisäksi myös tarkasteltavaksi esim filosofian näkökulmasta tai yleisen lingvistiikan kannalta. On myös mielestäni etu, että aihe on suhteellisen neitseellinen, vähän käsitelty. Mutta kaikenlaista taustatietoa niin filosofiselta- lingvistiikan alueellata löytyy runsaasti heti, kun vain jätetään termi "lojban". Siispä olisi mahdollista päästä kohtuu vaivalla uranuurtajaksi!

Tarvitaan vain motivaatio ja ymmärrys siitä, että semanttisella tietämyksenkäsittelyllä on merkittävä tulevaisuus ihan lähellä, jo alkamassa. Lisäksi on ymmärrettävä ne merkittävät ongelmat, jotka tällä IT-alueella hidastavat kehitystä ja kuinka lojban on oleellinen ratkaisu. Tarvitaan tutkimusta oikeiden kysymysten asettamiseksi, ongelmien tarkan luonteen formuloimiseksi ja "prof of concept" demonstraatioratkaisua, jossa lojbania käyttäen pystytään tehokkaasti, interaktiivisesti syöttämään ja hallitsemaan tietämyskantoja.

Paljon on jo tehty. SUMO-ontologia on tyylikäs ylä-ontologia, jonka KIF-kieliset määrittelyt kääntyvät lähes sellaisenaan sujuvasti lojban-kielisiksi. Niiden luominen on ollut valtava työ ja kaikki on ilmaiseksi käytettävissä täällä:
http://ckip.iis.sinica.edu.tw/kifb/en/toc/0.html

6 kommenttia:

Anonyymi kirjoitti...

Miten SUMOA käytetään sitten omissa ohjelmissa? Tuosta Sourceforgesta voi ladata sekalaisia KIF-tiedostoja, jotka ovat ilmeisesti tuollaisia aksiomilähdekoodia joista KOKO kanta kootaan...

http://sigmakee.cvs.sourceforge.net/sigmakee/KBs/?pathrev=MAIN

-K$-

JuSa kirjoitti...

KIF-muotoisiin tiedostoihin löytyy joitakin työkaluja. Ainakin tällaisen löysin:
http://www.cs.umbc.edu/kif/jkp/
ja tällaisen:
http://www-ksl.stanford.edu/knowledge-sharing/lib/kifparser/
Mutta oleellista on, mitä haluaa KIF-tiedostolla tehdä. Minun tavoittenani on kääntää SUMO:n huippu KIF:stä lojbaniksi. Sen jälkeen pitää päättää sisäinen esitystapa, jonka avulla lojban-tietämyskantaa ohjelmassa käytetään tietorakenteena ja myös tallennetaan levylle.

KIF-parserilla SUMO-kannan voi lukea tietorakenteeksi ohjelmalleen. Sitten on iso kysymys, mitä sitten, muutetaanko se edelleen esim. OWL-muotoon vai käytetäänkö sitä sellaisenaan.

Tässä on keskustelua asiasta:
http://lists.owldl.com/pipermail/pellet-users/2006-August/000818.html
ja lisää tietoa:
http://www.webkb.org/doc/model/comparisons.html

JuSa kirjoitti...

Ai niin vielä: kahlaa läpi nuo jo aikaisemmin luoettelemani kolme projektipaperia:


Meeting the Computer Halfway: Language Processing in the Artificial Language Lojban
http://www.cs.brandeis.edu/~havasi/jimpe_sow.pdf

Jorne -project
http://jorne.sourceforge.net/

LOJBAN AS ATOOL FOR ENCODING PROSE ON THE SEMANTICWEB
http://users.csc.calpoly.edu/~gfisher/clas...rick_thesis.pdf

Niiden pitäisi kertoa aika tarkasti, mitä on mahdollista ja mitä kannattaa tavoitella.

Anonyymi kirjoitti...

"Mutta oleellista on, mitä haluaa KIF-tiedostolla tehdä."

Kovalevyn hakemistopuiden rationalisointiin, eli koska on paljon levyhakemistoja, tarvitsisin kielen jolla kansioita luodaan, niiden rakenteellinen oikeellisuus tarkastetaan, ja pikakuvakkeita sekä html-dokumenttejä tuotetaan jotta saadaan tiedostot semanttiseen järjestykseen.
-K$-

JuSa kirjoitti...

Aika hieno idea. Siis tallentaessasi tiedoston annat kuvauksen sen sisällöstä ja järjestelmä tallentaa sen oikeaan paikkaan hakemistorakenteessa, lueden tarvittaessa uuden hakemistopuun. Jotain tällaista? Sitten kai vielä pitäisi voida vapaamuotoisesti kysellä sisällön perusteella tiedostoja, noiden HTML-dokumenttien vaihtoehtona?

Anonyymi kirjoitti...

"Sitten kai vielä pitäisi voida vapaamuotoisesti kysellä sisällön perusteella tiedostoja, noiden HTML-dokumenttien vaihtoehtona?"

Niin. Ohjelmistot monimutkaistuu ja miksi käyttää erilaista formaattia pikamuistissa(RAM) ja levymuistissa. Mieluummin olemassa olevia formaatteja. Esim ajanjaksot voisivat olla aina iCal-tiedostoja. Ohjelmoinnissa yleensä lähdetään siitä että luodaan olio ja tehdään siitä levylle tallennettava serialisointi. Kun edetään toisinpäin, tiedostoformaateista pikamuistiolioihin, on helpompaa tehdä standardeja ohjelmia. Jos kysellään mitä kalenterimerkintöjä on tälle päivälle, oikeat iCal-tiedostot löytyvät hakemistojärjestelmän perusteella ja ehkä ohjelma osaisi nopeaa välimuistia automaattisesti.
-K$-