Opredelitev dvoumnosti v jezikovnih študijah

V jezikoslovje, razjasnitev je postopek ugotavljanja, kateri smisel a beseda se uporablja v določenem kontekst. Znano tudi kot leksikalno razjasnitev.

V računalniški lingvistiki se ta diskriminatorni proces imenuje razločevanje po pomenu besede (WSD).

Primeri in opažanja

»Zgodi se, da je naš komunikacijo, enak jezikov enako omogoča, da se ista besedna oblika uporablja za različne stvari v posameznih komunikacijskih transakcijah. Posledica tega je, da je treba v določeni transakciji ugotoviti predvideni pomen dane besede med njenimi potencialno povezanimi pomeni. Medtem ko je nejasnosti ki izhajajo iz takih več oblik-pomenskih asociacij so pri leksikalni na ravni, jih je treba pogosto razrešiti s pomočjo širšega konteksta iz diskurz vgradnjo besede. Zato bi lahko različne pomene besede "storitev" ločili le, če bi lahko pogledali dlje od same besede, kot je nasprotje " igralčev servis v Wimbledonu" s "strežba natakarja v Sheratonu." Ta proces identifikacije pomenov besed v diskurzu je na splošno poznan kot

instagram viewer

smisel besede nedvoumnost (WSD)." (Oi Yee Kwong, Novi pogledi na računalniške in kognitivne strategije za razjasnitev besed. Springer, 2013)

Leksikalna razjasnitev in razjasnitev besednega smisla (WSD)

"Leksikalna nedvoumnost v svoji najširši definiciji ni nič manj kot določanje pomena vsake besede v kontekstu, kar se zdi, da je pri ljudeh v veliki meri nezaveden proces. Kot računski problem ga pogosto opisujejo kot "umetno inteligenco dokončan", to je problem, katerega rešitev predpostavlja rešitev za dokončanje naravni jezik razumevanje ali zdravorazumsko sklepanje (Ide in Véronis 1998).

"Na področju računalniške lingvistike se problem na splošno imenuje razločevanje pomena besed (WSD) in je opredeljen kot problem računalniškega določanja, kateri 'smisel' besede se aktivira z uporabo besede v določenem kontekst. WSD je v bistvu naloga klasifikacije: besedni pomen so razredi, kontekst zagotavlja dokaz, in vsak pojav besede je dodeljen enemu ali več možnim razredom na podlagi dokazov. To je tradicionalna in pogosta karakterizacija WSD, ki jo vidi kot eksplicitni proces razjasnitve glede na fiksni inventar besednih čutov. Predpostavlja se, da imajo besede končen in ločen niz čutov iz a slovar, leksikalno zbirko znanja ali ontologijo (v slednji pomenijo pomenijo pojmi, ki jih beseda leksikalizira). Uporabite lahko tudi zaloge za posamezne aplikacije. Na primer, v nastavitvah strojnega prevajanja (MT) lahko prevode besed obravnavamo kot pomen besed, pristop, ki postaja vse bolj izvedljiv zaradi razpoložljivosti velikih večjezičnih vzporedno korpusi ki lahko služijo kot podatki o usposabljanju. Fiksni inventar tradicionalnega WSD zmanjša kompleksnost problema, vendar obstajajo alternativna polja.. .." (Eneko Agirre in Philip Edmonds, "Uvod." Razen dvoumnosti s čutom besed: algoritmi in aplikacije. Springer, 2007)

Homonimija in razločevanje

"Leksikalna nedvoumnost je zelo primeren predvsem za primere homonimija, na primer, pojav bas mora biti preslikan na enega od leksikalnih elementov bas₁ ali bas₂, odvisno od predvidenega pomena.

"Leksikalna razjasnitev pomeni kognitivno izbiro in je naloga, ki zavira procese razumevanja. Ločiti ga je treba od procesov, ki vodijo v diferenciacijo besednih čutov. Prva naloga je opravljena dokaj zanesljivo tudi brez veliko kontekstualnih informacij, druga pa ne (prim. Veronis 1998, 2001). Pokazalo se je tudi, da homonimne besede, ki zahtevajo razjasnitev, upočasnijo leksikalni dostop, medtem ko večpomenske besede, ki aktivirajo množico besednih čutov, pospešujejo leksikalni dostop (Rodd e.a. 2002).

"Vendar sta tako produktivna modifikacija semantičnih vrednosti kot neposredna izbira med leksično različnimi elementi skupno pa zahtevajo dodatne neleksikalne informacije." (Peter Bosch, "Produktivnost, polisemija in indeksnost predikata." Logika, jezik in računalništvo: 6. mednarodni simpozij v Tbilisiju o logiki, jeziku in računanju, ur. avtorja Balder D. deset Cate in Henk W. Zeevat. Springer, 2007)

Razločevanje leksikalnih kategorij in načelo verjetnosti

"Corley in Crocker (2000) predstavljata široko pokrit model leksikalna kategorijanedvoumnost temelji na Načelo verjetnosti. Natančneje, to predlagajo za stavek, sestavljen iz besed w₀... w_n, predelovalec stavkov sprejme najverjetneje del govora zaporedje t₀... t_n. Natančneje, njihov model izkorišča dve preprosti verjetnosti: (jaz) pogojna verjetnost besede w_jaz glede na določen del govora t_jaz, in (ii) verjetnost t_jaz glede na prejšnji del govora t_i-1. Ko se sreča vsaka beseda v stavku, ji sistem dodeli ta del govora t_jaz, kar poveča produkt teh dveh verjetnosti. Ta model izkorišča vpogled toliko skladenjski dvoumnosti imajo leksikalno osnovo (MacDonald et al., 1994), kot v (3):

(3) Cene/make v skladišču so cenejše od ostalih.

"Ti stavki so začasno dvoumni med branjem, v katerem cene oz naredi ali je glavni glagol ali del a sestavljeni samostalnik. Po usposabljanju na velikem korpusu model predvideva najverjetnejši del govora za cene, pravilno upoštevajoč dejstvo, da ljudje razumejo cena kot samostalnik vendar naredi kot glagol (glej Crocker & Corley, 2002 in tam citirane reference). Ne samo, da model upošteva vrsto nastavitev razločevanja, ki so zakoreninjene v leksikalni kategoriji dvoumnosti, pojasnjuje tudi, zakaj so ljudje na splošno zelo natančni pri reševanju takšnih nejasnosti." (Matthew W. Crocker, "Racionalni modeli razumevanja: obravnavanje paradoksa uspešnosti." Psiholingvistika enaindvajsetega stoletja: štirje temeljni kamni, ur. avtorja Anne Cutler. Lawrence Erlbaum, 2005)