Lexikoaren Behatokialeiho bat XXI. mendeko hedabideetako euskarari

  1. Xabier Artola 1
  2. Nerea Ezeiza 2
  3. Antton Gurrutxaga 2
  4. Andoni Sagarna 3
  5. Miriam Urkia 4
  1. 1 Ixa Taldea
  2. 2 Elhuyar Fundazioa
  3. 3 Euskaltzaindia
  4. 4 Institute of Agricultural Economics and Information
    info

    Institute of Agricultural Economics and Information

    Praga, República Checa

    ROR https://ror.org/042jnea65

Revista:
Senez: itzulpen aldizkaria

ISSN: 1132-2152

Año de publicación: 2017

Número: 48

Tipo: Artículo

Otras publicaciones en: Senez: itzulpen aldizkaria

Resumen

Euskaltzaindiak bere zereginen artean ditu hizkuntza lantzea eta aztertzea, eta erabilerari dagozkion arauak ematea. Bestalde, ez dago zalantzarik corpusak behar-beharrezkoak direla egun hizkuntza baten erabilera erreala monitorizatzeko. Lexikoaren Behatokia (LB) proiektua Euskaltzaindiaren ekimenez abiatu zen, 2007an, Hiztegi Batuko Lantaldeak egindako proposamen bati erantzunez. Proiektuaren emaitza da izen bera duen corpusa, zeina web bidez kontsultatu baitaiteke. Proiektua indarrean dago oraindik ere, eta, azken hamar urteotan, ia 60 milioi hitzeko testu-corpus bat eratu da. Corpusa automatikoki prozesatuta dago, eta linguistikoki etiketatuta, eta hizkuntza-corpusek ohikoa duten kontsulta-funtzionalitatea eskaintzen dio erabiltzaileari. Artikuluan, corpusa sortzeko arrazoiak aipatzen dira, eta proiektuaren helburu nagusiak eta corpusaren ezaugarriak zein diren azaltzen. Halaber, corpusa eratzeko lan-prozedura xehatzen da: testuen eskuratzea eta katalogazioa egiteko modua, corpuseratzearen nondik norakoak, eta zertan datzan prozesamendu linguistikoa. Bukatzeko, Euskaltzaindiak corpusa nola eta zertarako baliatzen duen, eta etorkizunerako asmoak zertan diren azaltzen da.