Reentrenamientoaprendizaje semisupervisado de los sentidos de las palabras

  1. Palomar Sanz, Manuel
  2. Rigau Claramunt, Germán
  3. Suárez Cueto, Armando
Zeitschrift:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Datum der Publikation: 2005

Nummer: 34

Seiten: 49-66

Art: Artikel

Andere Publikationen in: Procesamiento del lenguaje natural

Zusammenfassung

Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.