Reentrenamiento: aprendizaje semisupervisado de los sentidos de las palabras

Palomar Sanz, Manuel; Rigau Claramunt, Germán; Suárez Cueto, Armando

Reentrenamientoaprendizaje semisupervisado de los sentidos de las palabras

Palomar Sanz, Manuel
Rigau Claramunt, Germán
Suárez Cueto, Armando

Aldizkaria:

Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2005

Zenbakia: 34

Orrialdeak: 49-66

Mota: Artikulua

DIALNET GOOGLE SCHOLAR RUA editor

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.

Datuen iturria: Dialnet