Mįlvinnsluverkefni ķ Hįskólanum ķ Reykjavķk

Ašal verkefniš um žessar mundir er žróun į mįlvinnslutólinu IceNLP sem er ętlaš til aš greina ķslenskan texta. IceNLP samanstendur af tilreišara (e. tokeniser), beyginga- og oršmyndunargreininum (e. morphological analyser) IceMorphy, markaranum (e. part-of-speech tagger) IceTagger og hlutažįttaranum (e. shallow parser) IceParser. IceNLP er skrifaš ķ Java.

IceTagger notar markamengiš sem bśiš var til ķ tengslum viš gerš Ķslenskrar orštķšnibókar.

IceParser setningagreinir texta m.t.t. tiltekins žįttunarskema.

Hęgt er aš prófa IceNLP hér.lol

Vinsamlegast hafiš samband viš hrafn@ru.is vegna notkunar į IceNLP ķ rannsóknarskyni.

IceNLP er skref ķ įtt aš žvķ markmiši aš žróa Basic Language Resource Kit (BLARK) fyrir ķslensku. BLARK fyrir tiltekiš tungumįl er mengi af žeim aušlindum (hugbśnašareiningum, mįlheildum, oršabókum, o.s.frv.) sem taldar eru naušsynlegar til aš frekari rannsóknir og žróun geti įtt sér staš į sviši mįltękni.


Dęmi um yfirstandandi rannsóknarverkefni.