Reentrenamientoaprendizaje semisupervisado de los sentidos de las palabras

  1. Palomar Sanz, Manuel
  2. Rigau Claramunt, Germán
  3. Suárez Cueto, Armando
Aldizkaria:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2005

Zenbakia: 34

Orrialdeak: 49-66

Mota: Artikulua

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.