Mielestäni lojban ja siihen liittyen semanttiset verkot ja tietämyshallinnan käyttöliittymät olisivat loistava aihe pro gradu- tai diplomityöksi. Aihe sopisi IT-lähestymistavan lisäksi myös tarkasteltavaksi esim filosofian näkökulmasta tai yleisen lingvistiikan kannalta. On myös mielestäni etu, että aihe on suhteellisen neitseellinen, vähän käsitelty. Mutta kaikenlaista taustatietoa niin filosofiselta- lingvistiikan alueellata löytyy runsaasti heti, kun vain jätetään termi "lojban". Siispä olisi mahdollista päästä kohtuu vaivalla uranuurtajaksi!
Tarvitaan vain motivaatio ja ymmärrys siitä, että semanttisella tietämyksenkäsittelyllä on merkittävä tulevaisuus ihan lähellä, jo alkamassa. Lisäksi on ymmärrettävä ne merkittävät ongelmat, jotka tällä IT-alueella hidastavat kehitystä ja kuinka lojban on oleellinen ratkaisu. Tarvitaan tutkimusta oikeiden kysymysten asettamiseksi, ongelmien tarkan luonteen formuloimiseksi ja "prof of concept" demonstraatioratkaisua, jossa lojbania käyttäen pystytään tehokkaasti, interaktiivisesti syöttämään ja hallitsemaan tietämyskantoja.
Paljon on jo tehty. SUMO-ontologia on tyylikäs ylä-ontologia, jonka KIF-kieliset määrittelyt kääntyvät lähes sellaisenaan sujuvasti lojban-kielisiksi. Niiden luominen on ollut valtava työ ja kaikki on ilmaiseksi käytettävissä täällä:
http://ckip.iis.sinica.edu.tw/kifb/en/toc/0.html
sunnuntai 23. maaliskuuta 2008
Tilaa:
Lähetä kommentteja (Atom)
6 kommenttia:
Miten SUMOA käytetään sitten omissa ohjelmissa? Tuosta Sourceforgesta voi ladata sekalaisia KIF-tiedostoja, jotka ovat ilmeisesti tuollaisia aksiomilähdekoodia joista KOKO kanta kootaan...
http://sigmakee.cvs.sourceforge.net/sigmakee/KBs/?pathrev=MAIN
-K$-
KIF-muotoisiin tiedostoihin löytyy joitakin työkaluja. Ainakin tällaisen löysin:
http://www.cs.umbc.edu/kif/jkp/
ja tällaisen:
http://www-ksl.stanford.edu/knowledge-sharing/lib/kifparser/
Mutta oleellista on, mitä haluaa KIF-tiedostolla tehdä. Minun tavoittenani on kääntää SUMO:n huippu KIF:stä lojbaniksi. Sen jälkeen pitää päättää sisäinen esitystapa, jonka avulla lojban-tietämyskantaa ohjelmassa käytetään tietorakenteena ja myös tallennetaan levylle.
KIF-parserilla SUMO-kannan voi lukea tietorakenteeksi ohjelmalleen. Sitten on iso kysymys, mitä sitten, muutetaanko se edelleen esim. OWL-muotoon vai käytetäänkö sitä sellaisenaan.
Tässä on keskustelua asiasta:
http://lists.owldl.com/pipermail/pellet-users/2006-August/000818.html
ja lisää tietoa:
http://www.webkb.org/doc/model/comparisons.html
Ai niin vielä: kahlaa läpi nuo jo aikaisemmin luoettelemani kolme projektipaperia:
Meeting the Computer Halfway: Language Processing in the Artificial Language Lojban
http://www.cs.brandeis.edu/~havasi/jimpe_sow.pdf
Jorne -project
http://jorne.sourceforge.net/
LOJBAN AS ATOOL FOR ENCODING PROSE ON THE SEMANTICWEB
http://users.csc.calpoly.edu/~gfisher/clas...rick_thesis.pdf
Niiden pitäisi kertoa aika tarkasti, mitä on mahdollista ja mitä kannattaa tavoitella.
"Mutta oleellista on, mitä haluaa KIF-tiedostolla tehdä."
Kovalevyn hakemistopuiden rationalisointiin, eli koska on paljon levyhakemistoja, tarvitsisin kielen jolla kansioita luodaan, niiden rakenteellinen oikeellisuus tarkastetaan, ja pikakuvakkeita sekä html-dokumenttejä tuotetaan jotta saadaan tiedostot semanttiseen järjestykseen.
-K$-
Aika hieno idea. Siis tallentaessasi tiedoston annat kuvauksen sen sisällöstä ja järjestelmä tallentaa sen oikeaan paikkaan hakemistorakenteessa, lueden tarvittaessa uuden hakemistopuun. Jotain tällaista? Sitten kai vielä pitäisi voida vapaamuotoisesti kysellä sisällön perusteella tiedostoja, noiden HTML-dokumenttien vaihtoehtona?
"Sitten kai vielä pitäisi voida vapaamuotoisesti kysellä sisällön perusteella tiedostoja, noiden HTML-dokumenttien vaihtoehtona?"
Niin. Ohjelmistot monimutkaistuu ja miksi käyttää erilaista formaattia pikamuistissa(RAM) ja levymuistissa. Mieluummin olemassa olevia formaatteja. Esim ajanjaksot voisivat olla aina iCal-tiedostoja. Ohjelmoinnissa yleensä lähdetään siitä että luodaan olio ja tehdään siitä levylle tallennettava serialisointi. Kun edetään toisinpäin, tiedostoformaateista pikamuistiolioihin, on helpompaa tehdä standardeja ohjelmia. Jos kysellään mitä kalenterimerkintöjä on tälle päivälle, oikeat iCal-tiedostot löytyvät hakemistojärjestelmän perusteella ja ehkä ohjelma osaisi nopeaa välimuistia automaattisesti.
-K$-
Lähetä kommentti