Ezagutza baseen aberasketa urruneko gainbegiraketaren bidezanalisiak eta hobekuntzak
- INTXAURRONDO GONZALEZ DE LANGARIKA, ANDER
- Oier López de Lacalle Lecuona Doktorvater/Doktormutter
- Eneko Agirre Bengoa Doktorvater/Doktormutter
Universität der Verteidigung: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 13 von Mai von 2015
- Arantza Díaz de Ilarraza Sánchez Präsident/in
- Basilio Sierra Araujo Sekretär/in
- Arkaitz Zubiaga Vocal
- Jordi Turmo Vocal
- Igor Leturia Azkarate Vocal
Art: Dissertation
Zusammenfassung
Informazio erauzketa testuetatik informazio egituratua eskuratzean datza. Informazio erauzketasistemak corpusetatik informazio garrantzitsua eskuratzen saiatzen dira, informazioa gizaki etakonputagailuentzat intuitiboa den eran itzuliz. Tesi honetan honen bi azpiatazatan jartzen duguarreta: erlazio erauzketan, entitateen arteko erlazioak antzemateko, eta gertaera erauzketan,testuetan gertaerak antzeman eta hauei buruzko informazio zehatz eta egituratua lortzeko.Urruneko gainbegiraketaren arabera, ezagutza base batek bi entitateren artean erlazio bat dagoelazehazten badu, eta bi entitate hauek esaldi berean agertzen badira, esaldi horrek erlazio horiadieraziko du nola edo hala. Urruneko gainbegiraketan oinarritutako teknika desberdinek benetakotuplen beharra dute aipamen zaratatsuak zuzentzeko, eta geroago teknika gainbegiratu tradizionalakentrenatzeko. Tesi honetan, aipamenetako zarataren iturburuak aztertu ditugu, eta aipamenzaratatsuak filtratzeko metodo desberdinak aztertu. Emaitzek erakusten dute gure heuristikoenkonbinaketak bi oinarri lerro trinko garaitzeko gai dela.Gainera, Twitterretik gertaera konplexuak erauzten dituen gertaera erauzketa sistema bat aurkeztendugu, urruneko gainbegiraketan oinarritutakoa. Ia denbora errealeko datu iturburu honek informaziozehatzgabea eta anbiguoa dakar, ebaluazioan eta erauzketa metodoetan eragina izanik. Ebaluazioerlaxatu bat diseinatu dugu, zeinek ezagutza baseko balioekiko antzekoak diren erauzitako balioeikreditu partziala ematen dien. Printzipio hau ere etiketatze prozesura eraman dugu, antzekoak direnbalioak ere aipamen positibotzat hartuz. Gure ekarpenak positiboki ebaluatzen ditugu lurrikarendomeinu konplexuan, 20 argumentu dituzten gertaerekin. Ezagutza basea, txio garrantzitsuak etaeskuz etiketatutako txioak publikoki eskuragarri daude.