Ezagutza baseen aberasketa urruneko gainbegiraketaren bidezanalisiak eta hobekuntzak

  1. INTXAURRONDO GONZALEZ DE LANGARIKA, ANDER
Dirigée par:
  1. Oier López de Lacalle Lecuona Directeur/trice
  2. Eneko Agirre Bengoa Directeur/trice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 13 mai 2015

Jury:
  1. Arantza Díaz de Ilarraza Sánchez President
  2. Basilio Sierra Araujo Secrétaire
  3. Arkaitz Zubiaga Rapporteur
  4. Jordi Turmo Rapporteur
  5. Igor Leturia Azkarate Rapporteur
Département:
  1. Lenguajes y Sistemas Informáticos

Type: Thèses

Teseo: 119294 DIALNET

Résumé

Informazio erauzketa testuetatik informazio egituratua eskuratzean datza. Informazio erauzketasistemak corpusetatik informazio garrantzitsua eskuratzen saiatzen dira, informazioa gizaki etakonputagailuentzat intuitiboa den eran itzuliz. Tesi honetan honen bi azpiatazatan jartzen duguarreta: erlazio erauzketan, entitateen arteko erlazioak antzemateko, eta gertaera erauzketan,testuetan gertaerak antzeman eta hauei buruzko informazio zehatz eta egituratua lortzeko.Urruneko gainbegiraketaren arabera, ezagutza base batek bi entitateren artean erlazio bat dagoelazehazten badu, eta bi entitate hauek esaldi berean agertzen badira, esaldi horrek erlazio horiadieraziko du nola edo hala. Urruneko gainbegiraketan oinarritutako teknika desberdinek benetakotuplen beharra dute aipamen zaratatsuak zuzentzeko, eta geroago teknika gainbegiratu tradizionalakentrenatzeko. Tesi honetan, aipamenetako zarataren iturburuak aztertu ditugu, eta aipamenzaratatsuak filtratzeko metodo desberdinak aztertu. Emaitzek erakusten dute gure heuristikoenkonbinaketak bi oinarri lerro trinko garaitzeko gai dela.Gainera, Twitterretik gertaera konplexuak erauzten dituen gertaera erauzketa sistema bat aurkeztendugu, urruneko gainbegiraketan oinarritutakoa. Ia denbora errealeko datu iturburu honek informaziozehatzgabea eta anbiguoa dakar, ebaluazioan eta erauzketa metodoetan eragina izanik. Ebaluazioerlaxatu bat diseinatu dugu, zeinek ezagutza baseko balioekiko antzekoak diren erauzitako balioeikreditu partziala ematen dien. Printzipio hau ere etiketatze prozesura eraman dugu, antzekoak direnbalioak ere aipamen positibotzat hartuz. Gure ekarpenak positiboki ebaluatzen ditugu lurrikarendomeinu konplexuan, 20 argumentu dituzten gertaerekin. Ezagutza basea, txio garrantzitsuak etaeskuz etiketatutako txioak publikoki eskuragarri daude.