Ezagutza baseen aberasketa urruneko gainbegiraketaren bidezanalisiak eta hobekuntzak
- INTXAURRONDO GONZALEZ DE LANGARIKA, ANDER
- Oier López de Lacalle Lecuona Zuzendaria
- Eneko Agirre Bengoa Zuzendaria
Defentsa unibertsitatea: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 2015(e)ko maiatza-(a)k 13
- Arantza Díaz de Ilarraza Sánchez Presidentea
- Basilio Sierra Araujo Idazkaria
- Arkaitz Zubiaga Kidea
- Jordi Turmo Kidea
- Igor Leturia Azkarate Kidea
Mota: Tesia
Laburpena
Informazio erauzketa testuetatik informazio egituratua eskuratzean datza. Informazio erauzketasistemak corpusetatik informazio garrantzitsua eskuratzen saiatzen dira, informazioa gizaki etakonputagailuentzat intuitiboa den eran itzuliz. Tesi honetan honen bi azpiatazatan jartzen duguarreta: erlazio erauzketan, entitateen arteko erlazioak antzemateko, eta gertaera erauzketan,testuetan gertaerak antzeman eta hauei buruzko informazio zehatz eta egituratua lortzeko.Urruneko gainbegiraketaren arabera, ezagutza base batek bi entitateren artean erlazio bat dagoelazehazten badu, eta bi entitate hauek esaldi berean agertzen badira, esaldi horrek erlazio horiadieraziko du nola edo hala. Urruneko gainbegiraketan oinarritutako teknika desberdinek benetakotuplen beharra dute aipamen zaratatsuak zuzentzeko, eta geroago teknika gainbegiratu tradizionalakentrenatzeko. Tesi honetan, aipamenetako zarataren iturburuak aztertu ditugu, eta aipamenzaratatsuak filtratzeko metodo desberdinak aztertu. Emaitzek erakusten dute gure heuristikoenkonbinaketak bi oinarri lerro trinko garaitzeko gai dela.Gainera, Twitterretik gertaera konplexuak erauzten dituen gertaera erauzketa sistema bat aurkeztendugu, urruneko gainbegiraketan oinarritutakoa. Ia denbora errealeko datu iturburu honek informaziozehatzgabea eta anbiguoa dakar, ebaluazioan eta erauzketa metodoetan eragina izanik. Ebaluazioerlaxatu bat diseinatu dugu, zeinek ezagutza baseko balioekiko antzekoak diren erauzitako balioeikreditu partziala ematen dien. Printzipio hau ere etiketatze prozesura eraman dugu, antzekoak direnbalioak ere aipamen positibotzat hartuz. Gure ekarpenak positiboki ebaluatzen ditugu lurrikarendomeinu konplexuan, 20 argumentu dituzten gertaerekin. Ezagutza basea, txio garrantzitsuak etaeskuz etiketatutako txioak publikoki eskuragarri daude.