Euskal morfologiaren tratamendu automatikorako tresnak

  1. ALEGRIA LOINAZ, IÑAKI
Dirigida por:
  1. Xabier Artola Zubillaga Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Año de defensa: 1995

Tribunal:
  1. Patxi Goenaga Zubizarreta Presidente/a
  2. M. Aranzazu Diaz de Ilarraza Sanchez Vocal
  3. Horacio Rodríguez Hontoria Vocal
  4. María Antonia Martí Antonín Vocal
Departamento:
  1. Lenguajes y Sistemas Informáticos

Tipo: Tesis

Teseo: 49614 DIALNET

Resumen

EN ESTE TRABAJO SE HAN DISEÑADO Y CONSTRUIDO DOS HERRAMIENTAS LINGUISTICAS: UN PROCESADOR MORFOLOGICO ROBUSTO Y DE AMPLIA COBERTURA PARA EL EUSKARA, Y UN CORRECTOR ORTOGRAFICO QUE UTILIZA LOS PROCESOS DE ANALISIS Y SINTESIS DEL ANTERIOR. ESTAS HERRAMIENTAS HAY QUE ENMARCARLAS DENTRO DE UN AMPLIO PROYECTO PARA EL PROCESAMIENTO AUTOMATICO DEL EUSKARA. CON ESE OBJETIVO, Y COMO BASE DE ESE PROYECTO, SE HA DISEÑADO Y COMPLETADO UNA BASE DE DATOS LEXICA DEL EUSKARA Y SE HA RECOGIDO UN AMPLIO CORPUS. EL PROCESADOR MORFOLOGICO SE BASA EN EL MODELO COMPUTACIONAL DE MORFOLOGIA DE DOS NIVELES DEFINIDO POR KOSKENNIEMI. LA IDONEIDAD DE ESTE FORMALISMO PARA SU APLICACION A LENGUAS COMO EL EUSKARA HA QUEDADO DEMOSTRADA YA QUE PERMITE UNA DESCRIPCION MORFOLOGICA COMODA, ELEGANTE Y FLEXIBLE; MUY APROPIADA PARA UNA DEFINICION A ESCALA REAL. PARA RESOLVER LA DESCRIPCION DE LAS DEPENDENCIAS A DISTANCIA ENTRE MORFEMAS, DENTRO DEL FORMALISMO DE DOS NIVELES SE HA AMPLIADO EL PODER DESCRIPTIVO DE LAS CLASES DE CONTINUACION. PARA AUMENTAR LA COBERTURA DEL PROCESADOR MORFOLOGICO, ESTE SE DIVIDE EN CUATRO MODULOS; EL CORRESPONDIENTE AL EUSKARA ESTANDAR, EL DE MANEJO DEL LEXICO DE USUARIO, EL DE TRATAMIENTO DE VARIANTES LINGUISTICAS Y EL DE ANALISIS SIN LEXICO. EL USO DEL MODELO DE DOS NIVELES PARA TODOS LOS MODULOS, Y NO SOLO PARA EL ANALISIS ESTANDAR, ES UNA PROPUESTA INNOVADORA. Y LO MAS INNOVADOR ES QUE ASI SE CONSIGUE UN CONJUNTO HOMOGENEO Y COMPACTO. BASADO EN EL PROCESADOR MORFOLOGICO SE HA DESARROLLADO UN PRIMER PRODUCTO COMERCIAL: EL CORRECTOR ORTOGRAFICO DE NOMBRE XUXEN. LA MAYORIA DE LOS MODULOS RESEÑADOS ANTERIORMENTE SON REUTILIZADOS EN SU CONSTRUCCION, CONSIGUIENDOSE ASI UN CORRECTOR "LINGUISTICO" BASADO EN LA MORFOLOGIA DE DOS NIVELES. LA NECESIDAD DE UN TRATAMIENTO ESPECIFICO PARA LOS ERRORES DE COMPETENCIA HA SIDO LA CONCLUSION FUNDAMENTAL. PARA LA DETECCION DE DICHOS ERRORES SE USA EL MECANISMO PROPUESTO PARA EL TRATAMIENTO DE VAR