Mįlvinnsluverkefni ķ Hįskólanum ķ Reykjavķk

Ašal verkefniš um žessar mundir er žróun į mįlvinnslutólinu IceNLP sem er ętlaš til aš greina ķslenskan texta. IceNLP samanstendur af tilreišara (e. tokeniser), beyginga- og oršmyndunargreininum (e. morphological analyser) IceMorphy, markaranum (e. part-of-speech tagger) IceTagger og hlutažįttaranum (e. shallow parser) IceParser. IceNLP er skrifaš ķ Java.

Markararnir nota markamengiš sem bśiš var til ķ tengslum viš gerš Ķslenskrar orštķšnibókar.

IceParser setningagreinir texta m.t.t. tiltekins žįttunarskema.

Hęgt er aš prófa IceNLP hér.

Frumkóša og keyrsluskrįr IceNLP er hęgt aš sękja af Github.

IceNLP er skref ķ įtt aš žvķ markmiši aš žróa Basic Language Resource Kit (BLARK) fyrir ķslensku. BLARK fyrir tiltekiš tungumįl er mengi af žeim aušlindum (hugbśnašareiningum, mįlheildum, oršabókum, o.s.frv.) sem taldar eru naušsynlegar til aš frekari rannsóknir og žróun geti įtt sér staš į sviši mįltękni.