Šta je semantika jednostavnim riječima? Krylova M.N. Funkcionalno-semantička analiza kao osnova za sistematsko proučavanje jezičkih jedinica

Pretplatite se na
Pridružite se koon.ru zajednici!
U kontaktu sa:

Semantika je riječ koja je u naš jezik došla iz grčkog, gdje je njeno značenje bilo “značajan”. U filologiji ga je u Francuskoj prvi primijenio M. Breal, koji se bavio ne samo razvojem jezika, već i istorijom. Mnogi lingvisti mogu reći šta je semantika. Pod pojmom se obično podrazumijeva nauka koja je posvećena značenju riječi, mnoštvu slova i rečenica.

A ako je jasnije?

Najopćenitije značenje pojma (na to se obično misli) može se specificirati kao "leksička semantika". Ona se bavi značenjskim opterećenjem pojedinačnih riječi. Ali lingvisti koji proučavaju pisma koja su preživjela od antike znaju kakvo je semantičko opterećenje pojedinih slova. Neki stručnjaci se bave tekstovima, frazama, potpunim rečenicama. Ovo područje je još jedno od područja primjene semantičkog naučnog pristupa.

Analizirajući šta je semantika, imperativ je spomenuti odnos sa drugim disciplinama. Konkretno, postoje bliske veze sa:

  • logika;
  • lingvistička filozofija;
  • komunikacijske teorije;
  • antropologija (jezik, simboli);
  • semiologija.

Razmatrajući nauku detaljnije, potrebno je odmah formulisati objekat koji proučava: semantičko polje. To je takav kompleks pojmova za koji je karakterističan određeni zajednički faktor.

Predmet proučavanja

Ako pitate filologa što je semantika, stručnjak će vam reći: termin je uobičajen da označava nauku koja se bavi ne samo smislenim opterećenjem riječi, već i filozofskim lingvističkim aspektima. Osim toga, disciplina se proteže i na jezike koje koriste programeri, na formalnu logiku i semiotiku. Pomoću alata razvijenih u semantici moguće je izvršiti efikasnu analizu teksta. Zahvaljujući ovoj nauci, moguće je izolovati odnos fraza, reči, simbola, odnos sa značenjima.

Međutim, opisano značenje je samo opća ideja o tome što je semantika. Zapravo, trenutno je koncept mnogo širi. Koristi se za neke specijalizovane filozofske trendove pa čak i u okviru jednog od pristupa koji pozivaju ljude da promene svoj stav prema svetu, da se udalje od „kulture potrošnje“. Ovaj problem je posljednjih godina postao zaista urgentan, a jedno od njegovih rješenja dobilo je naziv "opšta semantika". Doduše, ona ima mnogo obožavatelja.

Razumijevanje suštine

Tako se dogodilo da je semantika jezika nauka za koju je problem razumijevanja vrlo relevantan. Jednostavno rečeno, laik može lako reći čime se bavi matematika ili fizika, ali neće se svi brzo snaći u polju istraživanja semantike. Iznenađujuće, ne toliko lingvisti koliko psiholozi su sebi postavili zadatak da formulišu razumijevanje suštine semantike. Istovremeno, tumačenje simbola i znakova je pitanje karakteristično za striktno lingvistiku i nijednu drugu nauku. Značenje se traži uzimajući u obzir okruženje u kojem su predmeti korišteni: specifičnosti zajednice, kontekst, okolnosti.

Jezička semantika posebnu pažnju posvećuje izrazima lica, pokretima tijela, zvukovima, kao načinima prenošenja informacija. Sve ovo formira smisleni kontekst. Za pisani jezik, paragrafi i znaci interpunkcije igraju ulogu takvih strukturalnih faktora. Opšti termin za ovu oblast informacija je semantički kontekst. Analitička djelatnost u oblasti semantike usko je povezana sa nizom srodnih disciplina koje se bave vokabularom, etimologijom simbola i riječi, pravilima pravopisa i izgovora. Nauka je takođe povezana sa pragmatikom.

Karakteristike nauke

Semantika jezika bavi se strogo određenim pitanjima, karakterizira je specifično područje znanja. Svojstva ove discipline često omogućavaju da je okarakterišemo kao sintetičku. Područje koje se razmatra usko je isprepleteno s lingvističkom filozofijom, ima vezu sa filologijom, semiotikom. Istovremeno, postoji oštar kontrast sa sintaksičkim pravilima, kombinatorikom koja ne obraća pažnju na semantičko opterećenje upotrijebljenih simbola i znakova.

Posebnost semantike je u prisustvu značajnih veza sa reprezentativnim semantičkim teorijama, uključujući i one koje razmatraju odnos, korespondenciju i istinitost značenja. Ovo više nije samo lingvistička nauka, već filozofska disciplina koja se fokusira na stvarnost i njenu refleksiju kroz mogućnosti jezika.

Lingvistika

Ova nauka je jedna od dodatnih oblasti uključenih u opšte semantičko stablo kao istraživačka disciplina. Fokus ove sfere semantike je vokabular. Lingvistika se bavi semantičkim opterećenjem karakterističnim za nivoe vokabulara, rečenice i fraze. Jednako tako, lingvistika analizira veće objekte – tekstove, proširene narative.

Proučavajući lingvistiku i semantiku, potrebno je jasno razumjeti bliske međusobne veze predmeta. Za lingvistiku, unakrsne reference i primijenjene oznake postaju važne. Karakteristika ovog smjera je proučavanje odnosa svojstvenih jezičkim jedinicama. Kao i semantiku rečenice, lingvistika posebnu pažnju posvećuje kombinacijama riječi, ali na malo drugačiji način. Ovdje se istraživači fokusiraju na homonime, anonime, sinonime, paronime, metronome. Pred njima je zadatak da shvate prilično velike elemente teksta, kombinujući ih od malih, i da prošire semantičko opterećenje što je više moguće.

Montag gramatika

Autor ove strukture semantike bio je Richard Montague. Svoje teorije prvi put je iznio 1960. godine. Ideja je bila da se definicije organizuju na takav način da koriste terminologiju lambda računa. Materijali koje je demonstrirao jasno su dokazali da se značenje inherentno tekstu može rastaviti na dijelove, elemente, koristeći pravila kombinacije. Također je skrenuta pažnja na činjenicu da je takvih pravila relativno malo.

Tada se prvi put čuo izraz „semantički atom“. Njegovo razumijevanje, kao i rad s primitivcima, činili su osnovu semantike pitanja sedamdesetih. Tako se počela razvijati mentalna hipoteza. I danas mnogi priznaju da je Montagueova gramatika bila izuzetno vitak, logičan izum. Nažalost, njegova razlika od semantike govora bila je izražena varijabilnost određena kontekstom. Jezik, kako je Montague vjerovao, nije samo sistem oznaka dodijeljenih predmetima i pojavama, već instrumentalni skup. On je skrenuo pažnju da značaj svakog od ovih alata nije vezan za određene objekte, već za specifičnosti njihovog funkcionisanja.

Šta je sa primjerima?

Semantika koju čita Montague dobro je ilustrovana na sljedeći način. Filolozima je poznat koncept "semantičke nesigurnosti". Ovo je situacija kada je u nedostatku određenog broja dijelova konteksta nemoguće odrediti točno značenje nekog objekta (riječi, fraze). Štaviše, ne postoje riječi čija bi identifikacija bila stopostotno moguća i ispravna u odsustvu okruženja.

Formalna semantika

Ova ideja je formulisana kao poboljšanje Montaguovih postulata. Pripada teorijskim visoko formalizovanim pristupima i radi sa prirodnim jezicima. Ova metoda se također može koristiti za analizu ruske semantike. Posebnost je u dodjeljivanju vrijednosti različitim jedinicama: istina, funkcionalna ovisnost, individualnost. Za svaku jedinicu tada se otkriva istina, odnos u aspektima logike u odnosu na druge rečenice. Sve to omogućava da se dobije dovoljna količina informacija za analizu teksta u cjelini.

Istinsko-uslovna semantika

Autor ove teorije bio je Donald Davidson. Teorija pripada formalizovanoj. Glavna ideja je u definiranju veza između rečenica. Pristup uključuje rad sa prirodnim jezicima. Semantika riječi, rečenice, teksta obavezuje da se traže i opisuju takvi uvjeti pod kojima neki predmet istraživanja postaje istinit.

Na primjer, samo u situaciji kada je snijeg bijeli bit će istinit izraz "snježno bijel". To jest, u stvari, zadatak filologa je da utvrdi pod kojim uslovima značenje fraze postaje istinito. U semantici riječi, skup značenja je unaprijed određen, odabran na osnovu određenog objekta i postavljen je skup pravila koji omogućava njihovo kombiniranje. Praktična primjena ove metode je formiranje apstraktnih modela, pri čemu je suština pristupa utvrđivanje korespondencije između izraza i stvarnih stvari i događaja, a ne apstraktnih rezultata modeliranja.

Umjetna semantika

Pod ovim pojmom se obično podrazumijevaju takve fraze, riječi, na osnovu kojih se formira koristan sadržaj. Zadatak lingviste je da sastavi semantičko jezgro koje će privući pažnju čitaoca. Ovaj termin je najrelevantniji u današnje vrijeme kada se primjenjuje na moderne tehnologije, posebno na Internet. Da bi se povećala posjećenost virtuelne stranice, važno je formirati njen tekstualni sadržaj na ovaj način tako da postoje ključevi koji mogu zanimati korisnika. Umjetna semantika danas se široko koristi u reklamne svrhe.

Informatika predlaže da se semantiku tretira kao dio koji se bavi smislenošću konstrukcija svojstvenih jeziku. Ovo je u određenoj mjeri suprotno sintaksi, čija je oblast odgovornosti oblik izražavanja konstrukcija. Semantika je skup pravila koja vam omogućavaju tumačenje sintakse. Pritom se značenja postavljaju posredno, samo su mogućnosti razumijevanja deklariranih riječi i simbola ograničene. Uobičajeno je da se o semantici govori kao o odnosima, svojstvima koja daju formalnu reprezentaciju objekta. Primjenjuje se logički pristup na osnovu kojeg se grade modeli i teorije, a na osnovu interpretacije dobijenih informacija.

Semantika kao metoda promocije projekta

Primjenjujući osnovna pravila semantike, stručnjak može razviti takvo jezgro, koje će potom biti osnova za formiranje SEO programa. Semantičko jezgro je lista upita koje publika može unijeti u virtuelni sistem pretraživanja kako bi se upoznala sa uslugama i robom koja im je potrebna. Da biste pravilno formirali takvo jezgro, morate zamisliti šta klijentu treba, s kojim ciljevima se suočava.

Utvrđivanje potreba ciljne publike najčešće uključuje intervju ili kratku anketu. Ispravnim pristupom ovom problemu moguće je sa visokim stepenom preciznosti formulisati ono što korisniku treba.

Semantičko jezgro: karakteristike

Da biste pravilno formirali ovaj osnovni objekt za promociju projekta, prvo morate razumjeti prirodu zahtjeva korisnika. Oni spadaju u četiri široke kategorije:

  • informacije;
  • transakcije;
  • navigacija;
  • opšti upiti.

Informativni upiti za pretraživanje

Ovi ljudi pitaju pretraživač da li su suočeni s pitanjem koje treba riješiti. Sistem generiše listu sajtova koji manje-više odgovaraju datoj, nakon čega klijent počinje naizmenično da se kreće po stranicama sa liste top izdanja, ispitujući rezultate na relevantnost. Osoba staje kada uspije pronaći potrebne podatke.

Zahtjevi za informacijama najčešće počinju upitnom riječju, iako se često pribjegavaju relativno neočiglednom izražavanju misli za mašinski jezik - traže pomoć ili savjet, povratnu informaciju ili pravila (uputstva). Ako vlasnik resursa zna koji zahtjevi najčešće dovode korisnika do njega (ili bi mogli dovesti), potrebno je formirati semantičko jezgro za svaku stranicu, uzimajući u obzir ove informacije. Ako je projekat nekomercijalan, onda su zahtjevi za informacijama ti koji donose gotovo cjelokupni obim prometa. Da biste unovčili svoju web stranicu, možete koristiti kontekstualno oglašavanje ili druge slične opcije.

Navigacija i transakcije

Navigacijski upiti su oni koji daju jasan opis virtuelne stranice. Zahvaljujući njima u budućnosti će se vršiti tranzicije.

Transakcije su, prema mnogim izvršnim direktorima, najzanimljivija kategorija svih mogućih upita. Preko njih možete dobiti ideju za koje svrhe klijent traži stranicu. Nekima je potreban materijal za pregled, drugi preuzimaju fajlove, a treći kupuju. Poznavajući karakteristike transakcijskih upita, možete izgraditi vlastiti posao na Internetu. Inače, prije nekog vremena upravo su se kroz njih razvile gotovo sve stranice koje nude usluge, kao i virtuelne trgovine.

Karakteristika pitanja

Nije sve tako lako i jednostavno. Upite koje SEO stručnjak može identificirati, čineći semantičko jezgro, koriste svi konkurenti. S jedne strane, njihovo korištenje ne može biti garancija uspjeha promotivnog programa – previše je konkurenata. Istovremeno, njihov nedostatak čini program razvoja sajta gotovo nemogućim. Koristeći konkurentske upite, možete uspješno privući publiku na promoviranu stranicu. Ako bi promocija trebala biti bazirana upravo na takvim zahtjevima, potrebno je osigurati da korisnik, jednom na stranici, može izvršiti odgovarajuću transakciju.

Nisu svi sigurni da li se isplati koristiti ovu vrstu upita ako se stranica ne promovira komercijalne, već informativne prirode. Stručnjaci uvjeravaju da je ovo apsolutno ispravna odluka. U tom slučaju potrebno je predvidjeti mogućnost da korisnik vrši radnje na stranici. Najjednostavnija opcija je kontekstualno oglašavanje koje odgovara sadržaju, affiliate program.

Opći upiti

To su formulacije koje otežavaju razumijevanje onoga što korisnik traži. Na primjer, to može biti "auto motor" ili "četka za rumenilo". Iz kojeg razloga korisnik traži informaciju, iz samog zahtjeva uopće nije jasno. Nekoga zanima kako je objekat uređen i od čega je napravljen, drugog traži mogućnost kupovine, a trećeg istražuje ponudu na tržištu. Možda korisnik želi pronaći upute kako sam napraviti neki predmet ili obaviti posao, ali je druga osoba zainteresirana da naruči uslugu - na primjer, lijepljenje tapeta u prostoriji. Prilikom formiranja kontekstualnog kernela potrebno je uzeti u obzir opće zahtjeve, ali na njih ne treba stavljati poseban naglasak ako projekt nije posvećen, na primjer, svim mogućim vrstama četkica za rumenilo ili pozadinu i svemu što je povezano s tim, od pitanja proizvodnje do pravila bojenja.

Učestalost: konkurencija na svakom koraku!

Frekvencijska karakteristika je jedna od ključnih pri odabiru odgovarajućeg sadržaja za semantičko jezgro. Općenito, svi upiti su podijeljeni u tri velike grupe, dok niska učestalost uključuje one koji u pretraživač uđu manje od dvije stotine puta mjesečno, visoka frekvencija rangirana su pitanja postavljena više od hiljadu puta, a prosječan nivo je sve što je između navedenih granica.

Navedene vrijednosti su općenite, za svako određeno područje bit će jedinstvene, brojevi se značajno razlikuju. Da biste pravilno formirali semantičko jezgro, potrebno je ne samo da poznajete indikatore pretraživača za upite koji bi trebalo da budu uključeni, već i da predstavite hijerarhijsku strukturu sajta koji se razvija, da razradite internu optimizaciju. Stručnjaci prepoznaju Yandex Wordstat kao jedan od najkorisnijih modernih alata za formiranje semantičkog jezgra. Pomaže u identifikaciji učestalosti zahtjeva, na osnovu koje možete sastaviti proširenu listu i riješiti se nepotrebnih, praznih zahtjeva. Da biste kreirali strukturu, preporučuje se da uradite najmanje tri ciklusa rada sa listom zahteva kada koristite mogućnosti Yandex.Wordstat.

Riječ - glavna strukturna i semantička jedinica jezika, koja služi za imenovanje predmeta i njihovih svojstava, pojava, odnosa stvarnosti, koja ima skup semantičkih, fonetskih i gramatičkih karakteristika specifičnih za svaki jezik. U riječi se razlikuju sljedeće strukture: fonetska (organizirani skup zvučnih pojava koje čine zvučnu ljusku riječi), morfološka (skup morfema), semantička (skup značenja riječi).

Semantička (semantička) struktura riječi - uređeni skup međusobno povezanih elemenata, koji tvore određeni generalizirani model, u kojem se leksičke i semantičke varijante međusobno suprotstavljaju i karakterišu jedna prema drugoj.

Leksičko-semantička varijanta (LSV) - dvostrana jedinica čija je formalna strana zvučni oblik riječi, a sadržajna jedno od značenja date riječi.

Riječi koje imaju samo jedno značenje predstavljene su u jeziku jednom leksičko-semantičkom varijantom, polisemantičke riječi - brojem leksičko-semantičkih varijanti koje odgovaraju broju njegovih različitih značenja.

Analiza značenja riječi pokazuje da riječi obično imaju više značenja. Riječi koje imaju jedno značenje, tj. monosemantic , relativno malo. Oni obično uključuju naučne termine kao što su: vodonik, molekula. Većina engleskih riječi su dvosmislene riječi. Što se neka riječ češće koristi, ona ima više značenja. Na primjer, riječ sto ima najmanje 9 značenja u modernom engleskom: 1) a komad of namještaj; 2) the osobe sjedi at the sto; 3) sing. Hrana stavljena na sto, obroci; 4) tanak ravan komad kamena, metala, drveta itd.; 5) pl. kamene ploče; 6) riječi urezane u njih ili ispisane na njima (deset tablicadeset zapovesti); 7) uredan raspored činjenica, brojki i sl.; 8) deo mašine alatke na kojoj se rad stavlja na rad; 9) ravan prostor, plato. Zovu se riječi koje imaju više značenja polisemantički . Iz toga slijedi da je koncept semantičke strukture primjenjiv samo na polisemantičke riječi, budući da je semantička struktura, u stvari, struktura LSV-a, a ako riječ ima samo jedan LSV, ne može imati LSV strukturu.

Semantička struktura riječi uključuje skup leksičko-semantičkih varijanti, organiziranih na određeni način i formirajući uređen skup, hijerarhiju. Postoje različite klasifikacije koje odražavaju razliku u pristupima semantičkoj strukturi riječi i hijerarhijskim odnosima njenih elemenata.

Prijavom sinhroni pristup U proučavanju semantičke strukture riječi mogu se razlikovati sljedeće glavne vrste značenja:

    glavno značenje te riječi , pokazujući najveću paradigmatsku fiksaciju i relativnu nezavisnost od konteksta;

    privatne (sekundarne, izvedene) vrijednosti , koji, naprotiv, pokazuju najveću sintagmatsku fiksaciju i nisu u značajnoj mjeri uzrokovani paradigmatskim odnosima;

    nominativna vrijednost koja je direktno usmjerena na predmete, pojave, radnje i kvalitete stvarnosti;

    nominalno izvedena vrijednost sekundarno u odnosu na to. Na primjer, u riječi ruku vrijednost 'terminalni dio ljudske ruke izvan ručnog zgloba' (daj mi svoju ruku) je nominativna, a vrijednosti 'stvar kao ruka' (kazalka sata, minuta), 'zaposlenik koji radi sa svojim ruke' (fabrika je preuzela dvije stotine dodatnih ruku) su nominativni derivati;

    direktna (svojstvena) vrijednost direktno vezano za predmete i pojave materijalne stvarnosti, može se otkriti prilikom upoznavanja sa samim stvarnostima, a potonje u tom pogledu djeluju kao neizostavan uvjet i objektivni kriterij za određivanje semantičkog volumena riječi;

    figurativno (metaforično, figurativno, figurativno) , koju riječ stječe kao rezultat njezine svjesne upotrebe u govoru za označavanje predmeta koji nije njen uobičajeni ili prirodni referent. Prenosive vrijednosti formiraju se od direktnog značenja prema određenim modelima semantičke derivacije i ostvaruju se samo u određenim kontekstualnim uslovima. Oni ne samo da imenuju predmet ili pojavu, već ga karakteriziraju na osnovu sličnosti s bilo kojim drugim predmetom ili pojavom. Semantička struktura glagola umrijeti uključuje sljedeće lijekove: 1. prestati živjeti, isteći (direktna vrijednost); 2.izgubiti vitalnu snagu, oslabiti, onesvijestiti se (nada/interes umire; buka/razgovor je zamro); 3. biti zaboravljen, izgubljen (Njegova slava nikada neće umrijeti); 4. propadanje (cvijeće / biljke umiru). Vrijednosti 2, 3, 4 su prenosive.

Značenje je figurativno 'vrijeme' riječi 'pijesak': Ponestaje pijeska; značenje 'pobjeda' jednom riječju 'zemlja': Dobila je bogatog muža; Dobio je prvu nagradu.

    Prema subjektu imenovanja i društvenoj namjeni, značenja se dijele na pojmovna i stilska. Konceptualno takva leksička značenja se nazivaju , u kojima je predmetno-konceptualna orijentacija vodeća i odlučujuća; stilski (kulturna i istorijska) su ona značenja u kojima je funkcija imenovanja i označavanja predmeta i pojmova spojena sa funkcijom karakterizacije samih riječi.

    Među pojmovnim leksičkim značenjima postoje apstraktno značenje npr. svjedok - 1. dokaz, svjedočenje; i specifično , na primjer svjedok - 2. osoba koja ima saznanja iz prve ruke o nekom događaju i spremna ga opisati; 3. lice koje svjedoči pod zakletvom pred sudom; 4. lice koje stavlja svoj potpis na dokument; česte imenice i vlastiti nominativ i pronominativni (pronominalna značenja). Istaknite poseban značenja svojstvena terminima i profesijama.

    Stilska značenja prepoznaju se značenja riječi koje pripadaju različitim stilskim slojevima vokabular jezik i sfere upotrebe. Stilsko značenje imaju i arhaizmi i neologizmi, dijalektizmi i egzotizmi, a ne samo riječi, već i pojedinačni LSV mogu biti arhaični, neološki, dijalektički i egzotični.

    Kada se analizira odnos riječi u jeziku i govoru, koriste se pojmovi intenzivno značenje (značenje riječi kao jedinice jezika) i ekstenzijski značenje (stečeno rečju u datom kontekstu njene govorne upotrebe). Pojam značenje rječnika .

S druge strane, "govorna" značenja su podijeljena na konvencionalno (ustanovljena značenja prihvaćena u jeziku u kojem se riječ obično i prirodno koristi, tj. odražavaju sintagmatske veze koje karakteriziraju vlastitu semantiku riječi) i povremeno značenja (dodijeljena datoj riječi u ovom kontekstu govorne upotrebe i predstavlja određeno odstupanje od uobičajenog i opštepriznatog, odnosno značenja koja su, budući da nisu rezultat pravilne kombinacije riječi, isključivo kontekstualna). Na primjer, značenje glagola sjediti u klauzuli „Gdje da smjestim sve ove ljude?“ je konvencionalno, u rečenici „Ona je otišla u dnevnu sobu i sjela na rub stolice da ne sjedi njeno dobro odelo od grosgrana' (J. i E. Bonett) je povremeno.

Upotreba dijahronijski pristup označava klasifikaciju značenja prema njihovim genetskim karakteristikama iu skladu sa njihovom rastućom ili opadajućom ulogom u jeziku i omogućava odabir sljedećih tipova značenja:

    početni (početni) vrijednosti i derivati izvedeno iz njih. Na primjer, u semantici riječi cijev početna vrijednost je ‘muzički puhački instrument koji se sastoji od jedne cijevi’, a derivati ​​su ‘cijev od drveta, metala itd., posebno za prijenos vode, plina itd.’; „Uska cijev od gline, drveta itd. sa posudom na jednom kraju za uvlačenje duhanskog dima itd. Štoviše, kod takve klasifikacije često je potrebno istaknuti srednje značenje, koje je, dijahrono, jedna od karika u semantičkom razvoju riječi između izvornog i već utvrđenog izvedenog značenja. Na primjer, u semantičkoj strukturi imenice board vrijednost 'stol', budući da je metonimijski prijenos, djeluje kao srednja veza između vrijednosti 'proširene površine drveta' (koja je zauzvrat posredna između 'stola' i početne vrijednosti - 'dugački tanak obično uski komad piljene drvo") i vrijednost 'komitet', također povezana s metonimijskim prijenosom. Dakle, dijahronijskim pristupom, značenje riječi board može se predstaviti na sljedeći način:

dugačak tanak obično uski komad rezane građe

produžena površina drveta

(metonimijski prijenos)

(metonimijski prijenos)

    etimološko značenje - vrijednost koja je istorijski najranija;

    arhaično značenje - značenje, istisnuto iz upotrebe novijom riječi, ali sačuvano u nizu stabilnih kombinacija, na primjer: značenje "pogled" na reč rumenilo: at the prvo rumenilo"na prvi pogled"; značenje "duha" u riječi duh: to dati gore the duh"Odustani od duha"; značenje "čestica" na reč parcela: dio i parcela"sastavni dio"; dok riječ postoji sa drugačijim značenjem (značenjima) kao aktivni element modernog vokabulara.

    zastarjelo - vrijednosti van upotrebe;

    savremeno značenje - značenje koje je najčešće u savremenom jeziku.

anotacija

Članak je posvećen problemima semantičke analize tekstova. Razmatraju se različite metode: konceptualni dijagrami zavisnosti i semantičke mreže; pristupi zasnovani na leksičkim funkcijama i tematskim časovima; okvir i ontološki modeli; logičke modele predstavljanja znanja. Svaki od njih ima svoje prednosti i nedostatke.

Stvaranje novih metoda semantičke analize tekstova relevantno je u rješavanju mnogih problema računarske lingvistike, kao što su strojno prevođenje, autoapstrakcija, klasifikacija tekstova i dr. Jednako je važno razviti nove alate za automatizaciju semantičke analize.

Metode i sistemi semantičke analize tekstova

Semantika je grana lingvistike koja proučava semantičko značenje jezičkih jedinica. Osim znanja o strukturi jezika, semantika je usko povezana sa filozofijom, psihologijom i drugim naukama, jer neminovno postavlja pitanja o porijeklu značenja riječi, njihovom odnosu prema biću i mišljenju. U semantičkoj analizi potrebno je uzeti u obzir društvene i kulturne karakteristike izvornog govornika. Proces ljudskog mišljenja, kao i jezik, koji je sredstvo za izražavanje misli, vrlo je fleksibilan i teško ga je formalizirati. Stoga se semantička analiza s pravom smatra najtežom fazom automatske obrade teksta.

Kreiranje novih metoda semantičke analize tekstova otvoriće nove mogućnosti i omogućiti
čine značajan napredak u rješavanju mnogih problema računarske lingvistike, kao što su strojno prevođenje, autoapstrakcija, klasifikacija tekstova i dr. Razvoj novih alata za automatizaciju semantičke analize nije ništa manje hitan.

Trenutno postoji nekoliko metoda za predstavljanje značenja iskaza, ali nijedan od njih nije univerzalan. Mnogi istraživači su radili na povezivanju značenja sa tekstom. Dakle, I.A. Melchuk je uveo koncept leksičke funkcije, razvio koncepte sintaktičkih i semantičkih valencija i razmatrao ih u kontekstu eksplanatorno-kombinatornog rječnika, koji je jezični model. Pokazao je da značenja riječi nisu u direktnoj korelaciji
sa okolnom stvarnošću, ali sa idejama izvornog govornika o ovoj stvarnosti.

Većina istraživača sklona je mišljenju da semantičku analizu treba izvršiti nakon sintaktičke analize. V.Sh. Rubaškin i D.G. Lahuti je uveo hijerarhiju sintaksičkih veza za efikasniji rad semantičkog analizatora. Najvažnije su obavezne veze zasnovane na ulogama, zatim koreferentne veze, zatim fakultativne veze zasnovane na ulozima, pa tek onda subjekt-asocijativne veze.

Poznati lingvista E.V. Paducheva predlaže razmatranje tematskih klasa riječi, posebno glagola, jer oni nose glavno semantičko opterećenje: glagoli percepcije, glagoli znanja, glagoli emocija, glagoli odlučivanja, govorne radnje, pokreti, glasovni glagoli, egzistencijalni glagoli, itd. Bitna je u ovom pristupu ideja da se pojmovi jezika podijele u neke semantičke grupe, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih grupa imaju tendenciju da imaju isti skup zavisnih koncepata. Međutim, glavni problem ovakvog pristupa je što je odabir tematskih časova i kompilacija semantičkih rječnika izuzetno naporan proces koji u velikoj mjeri ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Univerzalni jezik za predstavljanje znanja trebao bi biti zgodan alat za izvlačenje novih znanja iz postojećih, što znači da je potrebno kreirati aparat za provjeru ispravnosti iskaza. Logički modeli predstavljanja znanja su ovde samo korisni. Na primjer, semantički jezik koji je predložio V.A. Tuzova, sadrži formalizme logike predikata, sadrži "atomske" koncepte, "funkcije" nad tim konceptima i pravila zaključivanja, uz pomoć kojih se mogu opisati novi koncepti. Moguće je da će se naučna misao u budućnosti razvijati u pravcu stvaranja takvih semantičkih jezika.

Unatoč činjenici da se neke naučne i tehničke ideje u oblasti obrade teksta razvijaju prilično brzo, mnogi problemi semantičke analize ostaju neriješeni. Većina istraživača je došla do zaključka da vokabular koji podržava semantičku analizu mora raditi sa značenjima i, prema tome, opisivati ​​svojstva i odnose pojmova, a ne riječi. Ali postavlja se pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima, tako da pretraživanje po njima bude zgodno i brzo, a osim toga, bilo bi moguće uzeti u obzir promjene u prirodnom jeziku (nestanak starih i pojava novi koncepti). Ovaj članak je pokušaj da se sistematizuju poznata dostignuća u oblasti semantičke analize i da se donekle nađe odgovor na ovo i druga pitanja.

Istraživanje semantike u okviru teorije "Značenje ↔ Tekst"

Prilikom stvaranja teorije "Značenje ↔ Tekst" I.A. Melchuk je uveo koncept leksičke funkcije.
Sa formalne tačke gledišta, leksička funkcija je funkcija čiji su argumenti neke riječi ili fraze datog jezika, a vrijednosti su skupovi riječi i fraza istog jezika. Pritom se razmatraju samo one leksičke funkcije koje imaju frazeološki povezana značenja - vrijednosti koje su moguće s nekim argumentima, a nemoguće s drugima.

Drugim riječima, leksička funkcija je određeni semantički odnos, na primjer, "jednakost u značenju" (Syn), "suprotno u značenju" (Anti), itd. Neka postoji određeni broj leksičkih jedinica - riječi i fraze; tada ova leksička funkcija pridružuje svaku od ovih jedinica skupu leksičkih jedinica koje su s izvornom jedinicom u odgovarajućem semantičkom odnosu.

Vrijednosti jedne leksičke funkcije iz različitih argumenata mogu se potpuno ili djelomično podudarati; vrijednosti različitih funkcija iz jednog argumenta također mogu biti iste. Alternativni korelati uključeni u vrijednost date leksičke funkcije iz datog argumenta ne moraju uvijek biti zamjenjivi iu bilo kojem kontekstu. Mogu se razlikovati po stilskim karakteristikama, u svim vrstama kompatibilnosti, u gramatičkim uvjetima upotrebe i, konačno, čak i po značenju. Ovo posljednje je posebno važno naglasiti: različiti korelati ne moraju uvijek biti potpuno sinonimi; dovoljno je da njihova značenja imaju zajednički dio koji odgovara datoj leksičkoj funkciji, a razlike ne izlaze iz nekog okvira, odnosno nisu „previše značajne“.

Općenito, leksička funkcija nije definirana za sve riječi i izraze. Prvo, neke funkcije su definirane samo za jedan ili drugi dio govora: na primjer, Orer, Func i Labor su zamislivi samo za imenice. Drugo, ova ili ona funkcija može se definirati samo za riječi određene semantike: Magn - za riječi čije značenje dozvoljava gradaciju ("više - manje"); Orer, Func i Labor definirani su samo za nazive situacija.

Treba imati na umu da čak i uz potpuno prikladan (u smislu njegovih sintaktičkih i semantičkih svojstava) argument, leksička funkcija možda neće imati značenje (na datom jeziku). Na primjer, sinonimi su u principu mogući za bilo koju riječ, ali samo za neke od njih. To je zbog frazeološke prirode leksičkih funkcija.

Treba još jednom naglasiti da su leksičke funkcije prvobitno uvedene posebno da opisuju leksičku kompatibilnost, a ne da predstavljaju značenje u opštem smislu, stoga ih ne treba sve tumačiti kao semantičke jedinice. Odnosi između leksičkih funkcija i značenja su daleko od jednoznačne. Neke leksičke funkcije mogu tražiti status semantičkih elemenata, druge mogu imati nikakvo značenje, a treće mogu pokriti vrlo složeno značenje.

S naše tačke gledišta, nije sasvim ispravno i zgodno govoriti o leksičkim funkcijama kao o „viševrijednim“ funkcijama. Pogodnije je govoriti o leksičkim predikatima. Slijedi lista jednostavnih standardnih leksičkih "funkcija" (ovdje će biti predstavljene kao predikati).

1. Syn (x, y), x, y su sinonimi.

2. Conv (x, y), x, y - konverzije.

3. Anti (x, y), x, y su antonimi.

4. Der (x, y), y je sintaktički derivat od x, odnosno y se poklapa sa x po značenju, ali pripada drugom dijelu govora:

S0 (x, y), y je imenica izvedena od x (x nije imenica);

A0 (x, y), y je pridjev izveden od x (x nije pridjev);

Adv0 (x, y), y - prilog nastao od x (x nije prilog);

V0 (x, y), y je glagol izveden od x (x nije glagol).

Drugim riječima, "x" y (Der (x, y) "S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Gener (x, y), y je generalizirajući koncept u odnosu na koncept označen sa x (x = jagoda, y = bobica). Ovaj predikat ovisi o leksičkoj kompatibilnosti riječi u datom jeziku: ako su x i m riječi dva različita jezika koje se podudaraju u značenju, tada za Gener (x, y) i Gener (m, n), respektivno, y i n se možda ne podudara u značenju...

Situacija je određena leksička refleksija (na datom jeziku) nekog dijela stvarnosti. Situacije označene pojedinačnim leksičkim jedinicama prirodnih jezika (leksemama), po pravilu, imaju od jedne do četiri semantičke komponente, odnosno semantičke aktante, označene velikim latiničnim slovima A, B, C, D. Istovremeno, svaki takva leksema je povezana sa dubokim sintaksičkim aktantima - svojim zavisnim, odgovarajućim subjektu i jakim dodacima (ako je data leksema ostvarena predikatskim glagolom). Duboki sintaktički aktanti numerisani su arapskim brojevima: 1, 2, 3, 4.

6. Si (x, y), i = 1,…, 4, y - tipično ime i-tog aktanta za x.

7. Sc (x, y), y - sirkonstanta, odnosno tipično ime sekundarne komponente ove situacije x:

Sloc (x, y), y - tipično ime mjesta gdje se ova situacija dešava x; "Gdje..." (x = bitka, y = polje (bitka));

Sinstr (x, y), y - tipično ime instrumenta koji se koristi u ovoj situaciji x; "Šta / pomoću čega..." (x = borba, x = instrument (borbe));

Smod (x, y), y - tipično ime načina (načina, karaktera) implementacije ove situacije x; "Put..." (x = život, y = način (života));

Sres (x, y), y - tipično ime rezultata ove situacije; "Šta se događa" (x = kopija, y = kopija).

Drugim riječima, "x" y (Sc (x, y) "Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Relativni predikati Znak (x, y), y - tipično ime jednog “komada”, jednog “kvanta” nekog x; Mult (x, y), y - tipično ime kolekcije, skupa.

9. Sigur (x, y), y je metafora za x (x = spavanje, y = zagrljaj (spavanje)).

10. Centr (x, y), y - tipična oznaka “centralnog” dijela objekta ili procesa.

11. Ai (x, y), i = 1,…, 4, y - tipična definicija i-tog aktanta prema njegovoj stvarnoj ulozi; "Jedan koji..."; "Takav da ...".

12. Ablei (x, y), i = 1,…, 4, y - tipična definicija i-tog aktanta prema njegovoj potencijalnoj ulozi u situaciji; "Onaj koji može..."; "Takav da možeš...".

13. Magn0 (x, y) i Magni (x, y), i = 1, ..., 4, y označava “visok stepen”, “intenzitet” situacije x (Magn0) ili njen i-ti aktant ( Magni).

14. Ver (x, y), y - "ispravno", "prikladno za svrhu", "što slijedi" u odnosu na x.

15. Bon (x, y), y - "dobro" u odnosu na x.

16. Advix (z, y), i = 1, ..., 4, x = A, B, C, D, y - naziv situacije u ulozi definicije u glagolu koji naziva drugu situaciju:

AdviA (z, y), i = 1, ..., 4, y je riječ izvedena iz z, koja, zamjenjujući z u tekstu, zahtijeva da se prvi aktant ovog z pretvori u vrh (umjesto z ) (x = prati, y = zajedno sa).

AdviB (z, y), i = 1,…, 4, y zahtijeva da drugi aktant z postane vrh (x = pogrešno, y = pogrešno).

17. Loc (x, y), y - prijedlog tipične lokalizacije (prostorne, vremenske ili apstraktne):

Locin (x, y), y - "statična" lokalizacija (x = Moskva, y = in);

Locad (x, y), y - prijedlog smjera (x = Moskva, y = in);

Locab (x, y), y - prijedlog uklanjanja (x = Moskva, zatim y = iz).

Drugim riječima, "x" y (Loc (x, y) "Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Ponekad se Loc (x, y) ne može jednoznačno odrediti (x = snijeg, y = on i y = in).

18. Copul (x, y), y - vezni glagol “biti”, “pojaviti se” (x = napadnut, y = napadnut).

19. Oper1 (x, y), Oper2 (x, y), y - glagol koji povezuje ime prvog (odnosno drugog) aktanta u ulozi subjekta sa nazivom situacije u ulozi prvog komplement (ako je x = podrška, onda y = obezbedi za Oper1 (x, y) i y = pronađi ili zadovolji za Oper2 (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y je glagol koji ima naziv situacije u ulozi subjekta x sa imenima aktanata (ako ih ima) u ulozi objekta (x = kiša, y = ići).

21. Rad12 (x, y), y - glagol koji povezuje ime prvog aktanta u ulozi subjekta, sa imenom drugog aktanta u ulozi prvog objekta i sa nazivom situacije u ulozi subjekta. uloga drugog objekta (x = nalog, y = nagrada; x = kazna, y = razotkriti).

22. Causij (x, y), y - radnja aktanata “učiniti tako da…”, “uzročiti”. U slučaju bez aktivnih indeksa Caus (x, y), x je ime neučesnika u situaciji (x = zločin, y = guranje). Pojavljuje se zasebno samo uz glagole, u drugim slučajevima je dio složenih parametara.

23. Incep (x, y), y - "za početak". Svojstva su ista kao i za Causij (x, y).

24. Perf (x, y), y - "savršeno", y nosi kompletnost radnje, njeno dostizanje prirodne granice. Perf (x, y) nema poseban nezavisni izraz na ruskom; tipično, ovaj predikat se procjenjuje na istinito ako je y u savršenom obliku (x = čitanje, y = čitanje).

25. Rezultat (x, y), y - "rezultant", odnosno y - "stanje kao rezultat..."; koristi se za nesavršene oblike (x = leći, y = leći za Perf (x, y), y = ležati za Rezultat (x, y)).

26. Činjenica j (x, y), y - "ostvariti", "ispuniti". Gornji indeks (rimski brojevi) predstavlja, ako je prikladno, stepen do kojeg je implicitni zahtjev ispunjen, s nižim indeksom koji je dodijeljen nižem stepenu (ako je x = zamka i j = I, onda y = vatra; ako je j = II, onda y = uhvatiti).

27. Real j1,2 (x, y), y - "implementirati", "ispuniti zahtjev" sadržan u x. Indeks j ima isto značenje kao i gore - stepen ispunjenosti; subscript označava aktant sintaktičke dubine koji ispunjava zahtjev (x = dug (monetarni), y = priznati za Real I1,2 (x, y), y = otplatiti za Real II1,2 (x, y)).

28. Destr (x, y), y - tipičan naziv “agresivne” akcije (x = osa, y = ubod).

29. Kapa (x, y), y - "šef" (x = fakultet, y = dekan).

30. Oprema (x, y), y - "osoblje" (x = stanovništvo, y = države).

31. Dokument (x, y), y - "dokument":

Docres (x, y), y - "dokument koji je rezultat"; "Utjelovljenje" (x = izvještaj, y = izvještaj);

Docperm (x, y), y - "dokument za pravo ..." (x = voz, y = (putna) karta za Docperm Oper2 (x, y));

Doccert (x, y), y - "dokument koji potvrđuje ..." (x = više obrazovanje, y = diploma).

Drugim riječima, "x" y (Doc (x, y) "Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

Pored gore navedenih jednostavnih leksičkih predikata, njihove kombinacije se mogu koristiti i za opisivanje leksičke kompatibilnosti - složeni predikati:

AntiReal2 (x, y): pali na ispitu / pali na ispitu;

IncepOper2 (x, y): sticanje popularnosti, očaj;

IncepOper2 (x, y): pustiti u prodaju, biti pod vatrom;

CausOper2 (x, y): stavljen pod kontrolu, stavljen u promet.

Kao što je ranije navedeno, u općem slučaju, leksička funkcija nije definirana za sve riječi i izraze. Funkcija se može definirati samo za riječi određene semantike. Na primjer, Cap and Equip - za riječi čije značenje podrazumijeva prisustvo "šefa" i "osoblja", odnosno za nazive institucija i organizacija u najširem smislu; Stvarno - za riječi čije značenje uključuje komponentu "zahtevati" ("potreba") itd.

Ako su leksičke funkcije predstavljene kao predikati, nema problema.
U slučajevima kada leksičke funkcije nisu definirane, odgovarajući predikati će biti lažni.

Posebna uloga u proučavanju semantike u pristupu I.A. Melchuka igraju valencije riječi, odnosno sposobnost riječi da stupaju u veze s drugim riječima. Riječi koje definiraju situaciju imaju valencije. To su sve glagoli, neke imenice (glagoli), pridjevi (koji označavaju poređenje: više, manje, više, niže), neki prijedlozi i prilozi.

Postoje dvije vrste valencija riječi: sintaktičke i semantičke. Iako je ova podjela ponekad prilično proizvoljna. Semantičke valencije određuju se leksičkom analizom situacije koju daje određena riječ. Uzmimo primjer s riječju rent ili rent. A daje u zakup C znači da za određenu naknadu D osoba A stiče od drugog lica B pravo upravljanja imovinom C na određeno vrijeme T. Dakle, značajno za situaciju zakupa
su sljedeći "učesnici" ili semantički aktanti: subjekt zakupa (onaj koji iznajmljuje), prvi objekt zakupa (onaj koji je iznajmljen), suprotna strana (onaj od koga je zakup), drugi predmet ( plaćanje) i rok.

Ovi aktanti su neophodni, jer eliminacija bilo kojeg od njih mijenja smisao situacije. Na primjer, ako uklonite termin, situacija zakupa se pretvara u situaciju kupovine i prodaje. S druge strane, ovi akti su dovoljni, jer u situaciji zakupa nije potrebno naznačiti iz kog razloga, gdje, kada i u koju svrhu je izvršeno. Iako su odgovarajući oblici riječi gramatički vezani uz glagol rent.

Drugim riječima, semantička valencija je određena brojem semantičkih aktanata. Dakle, glagol rent ima semantičku valenciju 5, budući da ima 5 semantičkih aktanata. Formalno, ova situacija se može napisati kao predikat P (x1, x2, x3, x4, x5), gdje je x1 "ko", x2 je "šta", x3 je "ko ima", x4 je "plaćanje", x5 je "termin".

Ne mogu se svi semantički aktanti definirati u rečenici, neki se jednostavno ne pominju ili uopće nemaju sintaktički izraz. Sintaktičke valencije određene su brojem sintaksičkih aktanata koji su direktno predstavljeni u tekstu (odnosno subjekata i dodataka koji su pridodati glagolu) i zavise od konteksta.

Na primjer, semantička valencija glagola propustiti je 4, budući da ima 4 aktanta: tko (agent), što / za šta (meta), od čega (oružje - opciono) i što (organ, znači). Ali u većini konteksta samo je jedna valentnost sintaksički izražena, na primjer, u rečenici "Dugo je ciljao, ali je promašio." Ipak, fraza "Promašio je bocu sa prozorom" nije sasvim tačna.

Sa formalne tačke gledišta, imamo konstrukciju opisanu u nastavku. Da ne bismo povezali poseban predikat sa svakim glagolom (i drugim riječima), razmotrit ćemo predikat čija je dimenzija veća za 1: P val (y, x1, x2, ..., xn), pri čemu je y sama riječ, a x1, x2, …, Xn su njene valencije. Da biste napravili razliku između sintaktičkih i semantičkih aktanata, možete koristiti više indeksa da naznačite aktante navedene u tekstu. Zapis znači da su dati aktanti i1, i2,…, ik.
Konkretno, ako su dati svi aktanti, onda dobijamo. Neke varijante (skupova sa više indeksa) možda neće biti važeće na jeziku. Ako je skup i1, i2,…, ik dopustiv, onda dolazi do implikacije

Štaviše, ako postoje dva skupa važećih multi-indeksa i tako da (i1, i2,…, ik) Ê (i1 ", i2",..., je "), onda postoji slična implikacija

Eksplanatorno-kombinatorni rečnik jedan je od glavnih teorijskih izuma I.A. Melchuk.
U određenom smislu, jezički model koji je predložio I.A. Melchuk, predstavlja jezik kao zbirku rječničkih natuknica sa ogromnom količinom raznolikih informacija; gramatička pravila u takvom rječniku igraju prilično sporednu ulogu. Eksplanatorno-kombinatorni rječnik odražava, prije svega, netrivijalnu kompatibilnost leksema. O jeziku možemo razmišljati kao o veoma velikom modelu u kojem su definirani leksički predikati koji djeluju na gore opisan način.

Članak eksplanatorno-kombinatornog rječnika nosi informaciju o valencijama određene riječi, koja je tačna ne samo u njenim okvirima, već iu okviru cijelog jezika u cjelini. Predikat odgovara valentnosti, gdje su semantički aktanti riječi cx, n je valencija riječi cx. Na primjer, u rečenici Petya čita knjigu, to će biti cx = pročitano, n = 2: y1 = Petya, y2 = knjiga, odnosno možete uslovno napisati P val (cx, y1, y2) = 1.

Skup članaka u eksplanatorno-kombinatornom rječniku može se smatrati podmodelom originalnog modela, a to je jezik. Leksički predikati, sada definirani na užem skupu, djelovat će slično.

Neka F označava skup pravilno konstruisanih fraza prirodnog jezika L i j Î F je fraza iz ovog skupa; - riječ cx je uključena u frazu j, a cx Î L. Neka je cx imenica ili pridjev. Sa Predikatom označavamo skup predikata definisanih na L. Jedan od elemenata ovog skupa je prethodno uvedeni predikat valencije P val (cx, y1,…, yn).

Slično, može se pretpostaviti da postoje i drugi predikati:

- predikat roda riječi Rod, gdje je Î (g1, g2, g3), g1 = ženski; g2 = muško; g3 = cf.;

- predikat prijedloga prijedloga, gdje je Î (pr1,…, prk) skup prijedloga u kombinaciji sa datom riječju;

- padežni predikat Padeži, gdje je padež riječi cx; za različite jezike, broj padeža je različit: na primjer, u ruskom ima šest padeža, dakle Î (case1, case2, case3, case4, case5, case6), case1 = im.p .; slučaj2 = rod; case3 = datum.p .; case4 = vin.p .; case5 = kreativni predmet; padež 6 = rečenična klauzula; postoje četiri slučaja u njemačkom, tako da Î (slučaj1, slučaj2, slučaj 3, case4), gdje je slučaj1 = Nom; case2 = Gen; case3 = Dat; case4 = Akk.

Rječnički unos eksplanatorno-kombinatornog rječnika sadrži glavnu riječ, leksičke predikate koji su s njom povezani i informacije o valentnosti date riječi. Informacija o valenciji uključuje broj koji označava broj aktanata, a za svaki aktant - naznaku u kojim padežima i sa kojim predlozima se koriste riječi koje odgovaraju datom aktantu. U nekim slučajevima može se naznačiti i rod riječi.

Gore navedeno može biti predstavljeno skupom predikata u obliku

gdje je xi slobodna varijabla koja odgovara i-tom aktantu.

Teorija "Značenje Û teksta" je od samog početka kreirana za primenu u primenjenim problemima automatskog prevođenja. Prema I.A. Melchuk je uz njegovu pomoć, za razliku od tradicionalnih labavih teorija, bilo potrebno osigurati izgradnju „operativnog“ modela jezika. Teorija „značenja Û teksta“ je zaista korišćena u nekim sistemima mašinskog prevođenja razvijenim u Rusiji, prvenstveno u englesko-ruskom sistemu automatskog prevođenja ETAP, koji je kreirala grupa koju je predvodio Yu.D. Apresyan. Svi ovi sistemi su eksperimentalni, odnosno njihova industrijska upotreba nije moguća. Unatoč činjenici da sadrže mnogo jezično korisnih informacija, općenito, nijedna od njih još nije napravila iskorak u kvaliteti prijevoda.

Po mišljenju autora, glavna vrijedna ideja ove teorije je da se značenja riječi ne odnose direktno na okolnu stvarnost, već na ideje izvornog govornika o ovoj stvarnosti (ponekad se nazivaju konceptima). Priroda koncepata zavisi od specifične kulture; sistem pojmova svakog jezika formira takozvanu "naivnu sliku svijeta", koja se u mnogim detaljima može razlikovati od "naučne" slike svijeta, koja je univerzalna. Zadatak semantičke analize vokabulara u teoriji "Značenje Û teksta" je upravo otkrivanje "naivne slike svijeta" i opis njezinih glavnih kategorija. Drugim riječima, važna uloga ove teorije je da opiše ne samo objektivnu, već i subjektivnu sliku svijeta.

Uprkos činjenici da je interesovanje za teoriju I.A. Melčuk nestaje, označavanje sintaksičkog korpusa "Nacionalni korpus ruskog jezika" vrši ETAP-3 jezički procesor, zasnovan na principima teorije "Značenje Û teksta".

Kao što je gore pomenuto, Yu.D. Apresyan. Njegove ideje se donekle razlikuju od ideja I.A. Melchuk. Centralno mjesto u istraživanju Yu.D. Apresyan uzima novu vrstu sinonimnog vokabulara. Za ovaj rečnik razvijena je detaljna šema za opisivanje sinonimnih serija, gde je svaki element serije okarakterisan u smislu semantike, sintakse, kompatibilnosti i drugih svojstava. Rječnik sadrži i sažima maksimalnu količinu informacija o jezičkom ponašanju ruskih sinonima.

Konceptualni dijagrami zavisnosti

Konceptualna i studija slučaja

U fazi morfološke i semantičko-sintaksičke analize tekstova glavne jedinice koje označavaju pojmove su riječi. U pravilu se vjeruje da se značenje fraza i fraza može izraziti kroz značenja riječi koje su u njima sastavljene. Samo ograničen broj stabilnih fraza - idioma - smatra se izuzecima. Ovaj pristup se zasniva na pretpostavci da se kombinacije riječi koje se nalaze u jeziku mogu podijeliti na "slobodne" i "neslobodne".

Drugi pristup zasniva se na činjenici da su najstabilnije (nedjeljive) jedinice značenja kategorije i pojmovi koji se ne sastoje od nezavisnih riječi, već od fraza. Takve kategorije i koncepti nazivaju se konceptima. Ovakvim pristupom, ne samo idiomatski izrazi, već i sve stabilne frazeološke jedinice jezika i govora (u razvijenim jezicima ima ih na stotine miliona) su „neslobodne“ fraze.

Ideja konceptualne analize kao sastavnog dijela semantičke analize nalazi se iu studijama V.Sh. Rubaškin i D.G. Lahuti. Ovaj dio sumira stavove o pitanju koje zadatke treba rješavati pomoću konceptualne semantičke analize.

Sintaksički označeni tekst treba primiti na ulazu semantičke komponente. U označenom tekstu treba navesti različite informacije: identifikatore pojmova koji odgovaraju riječi (terminu); indikacija sintaksičkog hosta (svi alternativni hostovi) i tipa sintaksičke veze, itd.

Prije prelaska na semantičku komponentu moraju se identificirati i pojmovi-fraze, objediniti reprezentacija brojčanih informacija, prepoznati vlastita imena itd. U stvarnim projektima, svi ovi zadaci se rješavaju s različitim stupnjevima aproksimacije. Može se smatrati da se stručna zajednica složila barem oko sljedećih pitanja.

Semantička analiza, sa stanovišta korištenih metoda i sredstava, treba da obuhvati dvije faze: a) fazu tumačenja gramatički izraženih (sintaksičkih i anaforičnih) veza i b) fazu prepoznavanja veza koje nemaju gramatički izraz.

Dvosmislenosti treba rješavati samim procesom analize – prema kriteriju stepena semantičkog zadovoljstva dobivenog rezultata u svakoj varijanti.

Ključna tačka sistema semantičke analize je efikasna podrška vokabulara.
U tom smislu, svaki sistem semantičke analize je orijentisan na tezaurus. Postupci semantičke analize u svim slučajevima, bez izuzetka, oslanjaju se na funkcionalnost konceptualnog rječnika. Rječnik koji podržava semantičku analizu mora operirati značenjima i, prema tome, opisivati ​​svojstva i odnose pojmova, a ne riječi. Ovo je konceptualni vokabular. U određenom smislu, ulogu konceptualnog rječnika mogu odigrati semantičke mreže, koje su opisane u sljedećem odjeljku.

U semantičkom interpretatoru, prije svega, potrebno je precizirati tipove semantičkih odnosa koji se razlikuju u tekstu: uloga (veze po valentnosti predikata), subjekt-asocijativni (odnosi između objekata, procesa koji su značajni u subjektu). oblast - biti dio, imati mjesto, biti namijenjen, biti glavni grad itd.) itd.

Prihvaćaju se sljedeći osnovni postulati interpretacije sintaktičkih veza.

1. Tip uspostavljenog semantičkog odnosa određen je semantičkim klasama i
u određenim slučajevima detaljnije semantičke karakteristike sintaktičkih "gospodar" i "sluga".

2. Prijedlozi se ne smatraju nezavisnim objektom tumačenja, već dodatnom (semantičkom i gramatičkom) karakteristikom veze između sintaksičkog "gospodara" prijedloga i značajne riječi koju on kontrolira.

3. Da bi razriješio leksičku i sintaksičku homonimiju koju je fiksirao sintaksički analizator, semantički tumač koristi sistem empirijski utvrđenih preferencija. Radi praktičnosti u poređenju preferencija opcija tumačenja, dodijeljeni su im numerički rangovi. Na nivou tipova semantičkih odnosa uspostavlja se sledeći redosled preferencija (redosled nabrajanja odgovara smanjenju prioriteta odnosa):

- funkcionalne veze i veze koje utvrđuju činjenicu semantičke redundancije;

- veze uloga, definisane kao obavezne, u prisustvu semantički konzistentnog aktanta;

- veze koreferenci;

- veze uloga, definisane kao opcione;

- specificiraju se predmetno-asocijacijske veze;

- subjekt-asocijativne veze nisu specificirane.

Specificirane sintaktičke veze su one koje tumač može leksikalizirati sa specifičnom relacijom u predmetnom području (lučki objekti ® objekti smješteni u luci); shodno tome, nespecificirane veze su one za koje tumač ne uspijeva predložiti takvu konkretizaciju i koje se tumače općim konceptom povezanog.

Ako se pronađe sintaktička homonimija kompozicionih veza, preferencije se određuju stepenom konzistentnosti semantičkih karakteristika učesnika u sintaksičkoj vezi.

Leksičke i lokalne sintaktičke nejasnoće (prisustvo alternativnih domaćina za riječ) obrađuju se u jednom mehanizmu nabrajanja. Globalne opcije za raščlanjivanje rečenice razmatraju se u mehanizmu nabrajanja sljedećeg nivoa. U ovom slučaju se upoređuju ukupne težine tumačenja svih veza prijedloga.

Prilikom uspostavljanja različitih vrsta odnosa, tumačenje je određeno sljedećim odredbama.

Prilikom uspostavljanja odnosa uloga značajne su sljedeće gramatičke karakteristike učesnika u sintaksičkoj vezi i moraju se uzeti u obzir (u odnosu na ruski jezik):

- semantičko-sintaktički tip predikata (karakteristika vokabulara);

- gramatički oblik predikata;

- padež aktanta, mogućnost pridjevskog oblika za aktant za datu valenciju;

- mogućnost predloške kontrole aktanta i sposobnost predloga koji čini sintaksičku vezu da izrazi odnos prema datoj valentnosti; informacije o sposobnosti prijedloga da posluži kao indikator uloge za datu valentnost pohranjene su u rječniku opisa prijedloga.

Operativno, postupak određivanja moguće uloge aktanta određen je gramatikom veza uloga, čime se uspostavlja korespondencija oblika

(Rf, GFP, TSEMU) ® VAL,

gdje je Rf naziv sintaksičke veze; GFP je gramatički oblik predikata; TSEMU - semantičko-sintaktički tip predikata; VAL je naziv moguće valencije ili referenca na funkciju uloge prijedloga.

Zatim se provjerava korespondencija semantičkih karakteristika aktanta sa semantičkim uvjetom za popunjavanje valencije predikata (provjerava se volumetrijska kompatibilnost odgovarajućeg para koncepata).

Sljedeći uslovi su neophodni i dovoljni da se uspostavi odnos korelacije:

- "gospodar" i "sluga" pripadaju semantičkoj kategoriji Objekt;

- koncepti koji odgovaraju pojmovima "gospodar" i "sluga" su u vezi sa volumetrijskom kompatibilnošću;

- u slučaju predloške veze, provjerava se sposobnost ovog prijedloga da izrazi odnos koreferencije.

Za uspostavljanje navedenih subjekt-asocijativnih odnosa neophodni su i dovoljni sledeći uslovi:

- pojmovi koji odgovaraju pojmovima “gospodar” i “sluga” su u vezi sa volumetrijskom nekompatibilnošću, ili (ako su kompatibilni) ovi pojmovi su sintaktički povezani preko predloga koji nije u stanju da izrazi odnos koreferencije;

- uz par pojmova "gospodar - sluga" leksikon je povezan sa određenim predmetnim odnosom
(<автомобиль, кузов>® imaju dio) i/ili (ako je veza predloška) odnos subjekta je povezan s prijedlogom i padežom.

Za uspostavljanje nespecificiranih subjekt-asocijativnih odnosa neophodna je i dovoljna istinitost prvog i neistinitost drugog uslova.

Analiza "po modelu" (analiza slučaja), zasnovana na korišćenju korpusa unapred obeleženih tekstova, dobija na značaju. Razumno konstruisan sistem analize treba da obezbedi ne samo izvlačenje znanja iz konkretnog teksta, već i akumulaciju rezultata na sintaksičkom i semantičkom nivou – za dalju upotrebu kao presedan.

Jedan od najambicioznijih i najznačajnijih projekata koji se trenutno realizuje je stvaranje Nacionalnog korpusa ruskog jezika. Na njemu učestvuje velika grupa lingvista iz Moskve, Sankt Peterburga, Kazanja, Voronježa, Saratova i drugih naučnih centara Rusije.

Nacionalni korpus ruskog jezika je zbirka elektronskih tekstova sa opsežnim lingvističkim i metatekstualnim informacijama. Korpus predstavlja svu raznolikost stilova, žanrova i varijanti ruskog jezika 19. – 20. veka. Nacionalni korpus ruskog jezika trenutno koristi pet tipova označavanja: metatekst, morfološki (flektivni), sintaktički, akcenatski i semantički. Nećemo detaljno razmatrati sve dostupne tipove označavanja, fokusiraćemo se samo na semantičko označavanje.

Uz semantičko označavanje, većini riječi u tekstu je dodijeljena jedna ili nekoliko semantičkih i derivacijskih karakteristika, na primjer, "lice", "supstancija", "prostor", "brzina", "kretnja" itd. Označavanje teksta se vrši automatski korištenjem programa Semmarkup (autora A.E. Polyakova) u skladu sa semantičkim rječnikom korpusa. Budući da je ručna obrada semantički označenih tekstova vrlo mukotrpna, semantička homonimija nije uklonjena u korpusu: polisemantičkim riječima se dodjeljuje nekoliko alternativnih skupova semantičkih karakteristika.

Semantička oznaka se zasniva na klasifikacionom sistemu ruskog rečnika usvojenom u bazi podataka Leksikograf, koja se razvija od 1992. godine na Odeljenju za lingvistička istraživanja VINITI RAS pod rukovodstvom E.V. Paducheva i E.V. Rakhilina. Za korpus je značajno povećan vokabular, proširen sastav i struktura semantičkih klasa, dodani su znakovi za građenje riječi.

Rečnik semantičkog rečnika zasnovan je na morfološkom rečniku sistema biranja (ukupnog obima od oko 120 hiljada reči), koji je proširenje gramatičkog rečnika ruskog jezika A.A. Zaliznyak. Trenutna verzija semantičkog rječnika uključuje riječi značajnih dijelova govora: imenice, pridjeve, brojeve, zamjenice, glagole i priloge.

Leksiko-semantička informacija koja se pripisuje proizvoljnoj riječi u tekstu sastoji se od tri grupe oznaka:

- kategorija (na primjer, vlastita imenica, povratna zamjenica);

- same leksičke i semantičke karakteristike (npr. tematska klasa lekseme, znaci uzročnosti, ocjene);

- derivacijske (tvorbene) karakteristike (na primjer, "deminutiv", "subjektivni prilog").

Leksičko-semantičke informacije imaju različitu strukturu za različite dijelove govora. Osim toga, svaka od kategorija imenica - subjekt, neobjektivna i vlastita - ima svoju strukturu oznaka.

Zapravo, leksiko-semantičke oznake su grupisane prema sljedećim poljima:

- taksonomija (tematski razred leksema) - za imenice, prideve, glagole i priloge;

- mereologija (indikacija odnosa "dio - cjelina", "element - skup") - za objektivne i neobjektivne nazive;

- topologija (topološki status označenog objekta) - za nazive subjekata;

- uzročnost - za glagole;

- status usluge - za glagole;

- ocjenjivanje - za nazive subjekata i vansubjekata, prideve i priloge.

Tematske klase glagola

Istraživanja E.V. Paducheva. Najzanimljiviji su radovi na tematskim časovima ruskih glagola. Tematska klasa kombinuje riječi sa zajedničkom semantičkom komponentom koja je centralna za njihovu semantičku strukturu. Tu su, na primjer, fazni glagoli, glagoli percepcije, glagoli znanja, glagoli emocija, glagoli odlučivanja, govornih radnji, pokreta, glagoli zvuka, egzistencijalni glagoli itd.

Riječi iste tematske klase imaju neku netrivijalnu zajedničku komponentu u tumačenju. Tematski čas je važan iz nekoliko razloga. Prvo, tematska klasa često ima karakteristične manifestacije sintakse - na primjer, klasa obično ima karakterističnog člana.
Drugo, članovi iste tematske klase imaju tendenciju da imaju isti skup semantičkih derivata, odnosno pojmova zavisnih od toga.

Članak sadrži najpotpuniju listu značenja pojedinih vrsta nesvršenih glagola. Postoje sljedeća specifična značenja: stvarno-dugo (proces ili stanje traje u vrijeme posmatranja); proces (odnosno samo trajan); konstantno-kontinuirano (vrijednost konstantnog svojstva ili omjera); uobičajeno (značenje uobičajene, odnosno opšte prihvaćene radnje ili događaja koji se ponavlja); potencijal; višestruki (ali ne konvencionalni i ne potencijalni); generalno činjenično nezadovoljavajuće (vrijednost zaustavljenog stanja ili nezasićenog procesa); opšte delotvoran (radnja je dostigla granicu); općenito činjenično dvosmjerno (rezultat je postignut, ali poništen suprotno usmjerenom akcijom); opšta činjenična neefikasna (nije poznato da li je radnja dostigla svoj limit).

Rad analizira od predikatskih imena, odnosno imenica nastalih od glagola i prideva, kao što su borba, dolazak, očaj, škrtost. Kao rezultat, moguće je razlikovati procese, događaje, stanja i svojstva.

Na primjer, nazivi procesa su dozvoljeni u kontekstu glagola sa značenjem "nastaviti", "ići", odnosno "odviti se" (postoji razgovor, postoji štrajk, ažuriranje). Posebna vrsta procesa su radnje koje se odvijaju, odnosno svrsishodni procesi sa aktivnim subjektom, kao što su tuča, provjeravanje, ali ne kao što su kupanje, bijeg, pobuna, hodanje, spavanje, pušenje. Nazivi radnji su dozvoljeni u kontekstu glagola sa značenjem "proizvesti", "voditi": grupa agenata vršila je nadzor; vrše prijem (zamjena, odabir); mi istražujemo.

Sva imena procesa koriste se u kontekstu faznih glagola sa značenjem "početi", "završiti", "nastaviti": borba je počela (kiša, bitka); okončan progon neistomišljenika; iskrcavanje (opsada) se nastavlja. Nazivi radnji su dozvoljeni u kontekstu faznih glagola sa značenjem "početi", "završi", "nastavi": ušao u pregovore; završila provjeru bilježnica; prekinuto čitanje; pokrenut, pokrenut, zaustavljen (izdavanje). Kontekst faznog glagola je dijagnostički za imena procesa, za razliku od imena događaja.

Nazivi događaja se koriste u kontekstu glagola sa značenjem "dogodilo", "dogodilo": dogodio se potres. Događaji se razlikuju od procesa po tome što imaju retrospektivnog posmatrača. Posmatrač procesa je sinhroni, dakle, ako imamo proces, onda je glagol nesvršen, a ako je događaj, onda je perfekt.

Izostavićemo mnoge druge detalje u vezi sa razlikama između procesa, događaja, stanja i svojstava, uz napomenu da primenjeni potencijal ovih studija tek treba da bude otkriven.

Ispod je lista perceptivnih glagola, koje je označio E.V. Padučeva kao jedan od najtemeljnije proučavanih tematskih časova. Čini se da je za utvrđivanje pripadnosti glagola tematskoj klasi percepcija dovoljno osigurati da njegova semantička formula uključuje komponentu "percepcija". Međutim, stvari nisu tako jednostavne. Činjenica je da perceptivna komponenta lako ulazi u semantiku glagola različitih klasa. Prava percepcija se uliva u mentalnu percepciju.

1. Glagoli kretanja i stanja koji sugeriraju posmatrača:

a) glagoli uočenog kretanja: treperiti, treperiti, stršiti, skliznuti;

b) glagoli posmatranog stanja: pobijeliti, stršiti, razboj; raširiti se, stršiti, isticati se, ispružiti se, otvoriti, govoriti;

c) glagoli emisije svjetlosti, mirisa, zvuka: sjaj, treperenje, sjaj, miris, smrad, zvuk.

2. Pretpostavlja se da posmatrač čuje glagol (kao u zvonu), ali i sljedeći glagoli imaju perceptivnu komponentu: izblijediti, utopiti se, potamniti, povući se, povući se, povući se, spojiti se (kao tunika i sive hlače skoro spojena sa zemljom).

3. Subjekt percepcije (ili posmatrač) je obavezan učesnik u situacijama izraženim uzročnim glagolima: izraziti, pokazati (pokazao mi je svoje raspoloženje); istaknuti, otkriti, zasjeniti, istaknuti, uhvatiti, nejasno, izložiti, označiti (granice), otvoriti, označiti, prikazati; i njihovi dekauzativi (izraziti, isplivati, istaći se, utisnuti se, biti gol, biti identificiran, otkriti).

4. Postoji mnogo glagola koji opisuju identifikaciju, što zahtijeva učešće osjetila: prepoznati, razlikovati, prepoznati, razlikovati, identificirati, razlikovati (ocrtati), prepoznati, rastaviti (jer ne mogu razaznati drugo slovo).

5. Mnogi glagoli uključuju perceptivnu komponentu, ali označavaju vrlo specifičnu radnju ili aktivnost kojoj je glavni cilj, a ne učešće percepcije u njenom postizanju: pregledati ("pregledati"), registrirati, pretražiti, pretražiti, pronaći, tražiti, istražiti, prikazati, ocrtati, pratiti, pratiti, pratiti, čuvati, paziti, vidjeti kroz, sakriti (Xia), sakriti, špijunirati.

6. Svaki glagol prenošenja i primanja informacija, na primjer, pisati ili čitati, pretpostavlja prisustvo signala koji se mora osjetiti osjetilima.

7. Glagoli pokazati i sakriti, budući da njihova interpretacija uključuje perceptivnu komponentu, mogu se pripisati i glagolima percepcije.

8. Glagoli percepcije, između ostalog, uključuju slijepi – slijepi (i slijepi u jednom od značenja). Oni opisuju gubitak organa vida, zbog čega se sposobnost gledanja zauvijek gubi. Međutim, to ne uključuje glagol probuditi se, što znači privremeni gubitak sposobnosti percepcije s njegovim kasnijim vraćanjem.

9. Neki stilski obojeni perceptivni glagoli: buljiti, gledati, izleći, buljiti, buljiti, vidjeti, uhvatiti, zasvijetliti.

10. Tematska klasifikacija se fokusira na izvorna značenja riječi. U međuvremenu, mnogi glagoli imaju perceptivno značenje kao derivat; posebno, gledati, suočiti se (problem), prodrijeti (u tajnu), govoriti. Na primjer, bijele zgrade su iznenada izašle iz mraka.

11. Druge slične riječi u kojima je značenje percepcije izvedeno ili kontekstualno uvjetovano, poput baciti (pogledati, pogledati), baciti (u oko), okrenuti (pogled, pažnja), bježati (očima), blještati (pogled), slajd (pogledaj) ).

12. Glagoli označenih načina radnje:

a) početnici: preskočiti, pobijeliti, zvuk;

b) konačni: gledati, slušati i špijunirati, čuti;

c) saturativ: dovoljno vidjeti, diviti se, dovoljno slušati;

d) glagoli potpune apsorpcije u radnji: piskati - piskati, viriti - viriti;

e) posebno djelotvorno: pazi - pazi, uđi u trag - uđi u trag, prati - prati;

f) povremeno omekšavanje: pogled, praćenje; samoaktivan: pogledajte.

Perceptualni glagoli, kao i drugi tematski razredi, imaju svoje, karakteristične za ovu klasu, modele semantičke derivacije.

13. Karakteristična je semantička tranzicija - od percepcije do mentalnog značenja. Izvedeno mentalno značenje razvija se, na primjer, u glagolima vidjeti, pogledati, primijetiti, razmotriti (kao nagovještaj; a mi razmatramo vaš prijedlog), osjetiti, činiti se, otkriti, čuti, zamisliti, sudarati se, pratiti, činiti se; da se predstavim, da se vidimo (ista dvosmislenost u imenici look):

a) Sa pulta je mogao jasno da vidi trem kluba (vizuelni značaj);

b) Ja to vidim ovako (mentalno značenje).

14. Glagol svjedočiti etimološki pretpostavlja viziju, ali u kontekstu Ono svjedoči o njegovom izvanrednom talentu ima mentalno značenje; baciti svjetlo znači "učiniti ga razumljivijim", iako je svjetlost potrebna da bi se vidjelo. Glagol anticipirati je potpuno izgubio komponentu ukusa i postao je mentalni.

15. Izvedeno mentalno značenje javlja se i u kauzativnim glagolima. Dakle, pokazati je glagol percepcije, ali može imati i mentalno značenje „dokazati“. Zanimljivo je da među izvedenicama od see postoje glagoli znanja i glagoli mišljenja:

a) Vidim da ćutiš (znanje);

b) on to vidi kao prepreku (mišljenje).

16. Glagol biti kombinuje perceptivno značenje (Nije bio tamo) sa mentalnim (Ispostavilo se da je zdrav).

17. Izvedeno značenje govora razvija glagol primijetiti; ispoljava se u kombinaciji s prilozima: pravilno si primijetio ("točno si rekao").

18. Glagole slušati, slušati, poslušati, paziti karakteriše višeznačnost „perceive“ – „obey“.

19. Pravilan, odnosno repetitivan, je i semantički prijelaz look ® relate: gledam jednostavno (odnosim jednostavno); zažmiriti (prepustiti se); uprkos (šta god).

20. Dvosmislenost look ® relate karakteristična je za glagol gledati postrance: a) (pogledati iskosa, sa strane); b) (pogledajte iskosa, budite sumnjičavi, izgledajte sumnjivo).

21. Prijelaz na vidjeti ® imati predstavljen je primjerima naći, izgubiti.

22. Prelaz iz percepcije u međuljudski kontakt bilježi se u glagolima sresti, pogledati (na svjetlo), vidjeti.

23. Značenje viđenja može narušiti ideju jednostavnog kontakta sa objektom, odnosno ostanka na istom mestu (Ovi zidovi su videli mnogo; Krimu će uvek biti drago da vas vidi).

24. Glagole pojaviti i nestati karakteriše višeznačnost biti vidljiv – postojati. Označena je slična nejasnoća - biti naznačen; izgubiti se: na primjer, Put se izgubio u žbunju (prestao je da se vidi) i živost pokreta se postepeno gubila (prestala je); savršena forma ima ponor (iako nesavršen oblik nestati znači samo ne biti vidljiv: gdje si nestao?). Matematičkim jezikom, postoji X znači da postoji X.

25. Semantički koncept percepcije često koegzistira sa pomjeranjem: sudariti se, spotaknuti, naletjeti, naletjeti; biti uhvaćen (imam belu pečurku).

Posljedica selidbe može biti, naprotiv, izlazak iz vidokruga, poput skrivanja, bijega, dodirivanja.

Zanimljivo je da je za glagole koji izražavaju glavne tipove percepcije - vid, sluh, miris, dodir, ukus - moguće identificirati jednu paradigmu semantičkih izvedenica izvorne lekseme, a ona će biti suštinski ista za mnoge jezike, što ukazuje na drevnost ovog vokabulara i dizajna podataka.

Bitna u ovom pristupu je ideja podjele pojmova jezika u neke semantičke grupe, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih grupa imaju tendenciju da imaju isti skup zavisnih koncepata. Rječnik koji podržava semantičku analizu mora operirati značenjima i, prema tome, opisivati ​​svojstva i odnose pojmova, a ne riječi. Ostaje pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima, tako da pretraživanje po njima bude zgodno i brzo, a osim toga, pokazalo se da uzima u obzir promjene u prirodnom jeziku (nestanak starih i nastanak novih koncepti).

Kada se raspravlja o problemima semantike, često se pominje princip kompozicije. On tvrdi da je značenje složenog izraza određeno značenjima njegovih sastavnih dijelova i pravilima koja se koriste za njihovo kombiniranje. Budući da se rečenica sastoji od riječi, ispada da se njeno značenje može predstaviti skupom značenja riječi uključenih u nju. Ali nije sve tako jednostavno. Rečenica se takođe oslanja na red reči, frazu i odnos između reči u rečenici, odnosno uzima u obzir sintaksu.

Kao što vidite, konceptualni dijagrami zavisnosti omogućavaju da se tvrdi da je u nekim slučajevima narušen princip kompozicije. Pogrešno je reći da se značenje fraza i fraza može izraziti kroz značenja njihovih konstitutivnih riječi. To nije uvijek tačno. Međutim, glavni problem ovakvog pristupa je što je odabir tematskih časova i kompilacija semantičkih rječnika izuzetno naporan proces koji u velikoj mjeri ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Mrežni modeli predstavljanja znanja

Tezauri, semantičke mreže, okvirni i ontološki modeli

Tezaurus je svojevrsni rječnik opšteg ili specijalnog vokabulara, u kojem su naznačeni semantički odnosi između leksičkih jedinica. Za razliku od eksplanatornog rječnika, tezaurus vam omogućava da identificirate značenje ne samo po definiciji, već i korelacijom riječi s drugim konceptima i njihovim grupama, zbog čega se može koristiti za popunjavanje baza znanja sistema umjetne inteligencije.

Sljedeći osnovni semantički odnosi se obično koriste u tezaurusima: sinonimi, antonimi, hiponimi, hiperonimi, meronimi, holonimi i paronimi.

Sinonimi su riječi istog dijela govora, različite po zvuku i pravopisu, ali imaju slično leksičko značenje (podebljano - hrabro, neustrašivo).

Antonimi su riječi istog dijela govora, različitog zvuka i pisanja, direktno suprotnih leksičkih značenja (dobro - zlo).

Hiponim je pojam koji izražava određeni entitet u odnosu na drugi, opštiji pojam (životinja - pas - buldog).

Hiperonim je riječ sa širim značenjem, koja izražava opći, generički pojam, naziv klase predmeta, svojstava ili karakteristika (buldog – pas – životinja).

Hiperonim je rezultat operacije logičke generalizacije, dok je hiponim ograničenje.

Meronim je koncept koji je sastavni dio drugog (automobil - motor, točak, hauba).

Holonim je koncept koji je u cjelini nad drugim konceptima (motor, točak, hauba - automobil).

Meronimija i holonimija kao semantičke relacije su međusobno inverzne jedna prema drugoj, baš kao i hiponimija i hiperonimija.

Paronimi su riječi koje su slične po obliku, ali se razlikuju po značenju (indijski - indijski).

Primjer tezaurusa je WordNet. Osnovna jedinica vokabulara WordNet-a je sinonimni niz (synset) koji kombinuje riječi sa sličnim značenjem. Sinsetovi se sastoje od riječi koje pripadaju istom dijelu govora kao izvorna riječ. Svaki sinset prati mala formulacija (definicija) koja objašnjava njegovo značenje. Sinsetovi su međusobno povezani raznim semantičkim odnosima, na primjer hiponimija, hiperonimija itd. Primjer sa riječju pero (olovka) prikazan je na slici 1. Vidi se da rječnik za ovu riječ ima pet različitih značenja, pripada kategorija pribora za pisanje i ima sedam povezanih riječi: olovka, marker, kreda za ploču, voštana bojica itd.

WordNet sadrži približno 155 hiljada različitih leksema i fraza, organizovanih u 117 hiljada sinsetova. Cijela baza podataka podijeljena je na tri dijela: imenice, glagoli i pridjevi/prilozi. Riječ ili fraza može biti u više od jednog sinseta i pripadati više od jedne kategorije dijela govora. Detaljnije informacije o broju jedinstvenih riječi, sinsetova i parova riječ-sinset u bazi podataka WordNet date su u tabeli 1.

Prednosti WordNeta u odnosu na druge slične resurse su njegova otvorenost, pristupačnost, dostupnost veliki broj razne semantičke veze između sinsetova. Pristup WordNetu se vrši direktno preko pretraživača (lokalno ili preko Interneta) ili C biblioteka.

Postoje WordNet implementacije za druge jezike (oko 16). Na primjer, za evropske jezike kreiran je EuroWordNet u kojem se veza između različitih jezičkih verzija vrši preko posebnog međujezičkog indeksa. WordNet se takođe razvija za ruski jezik. Treba napomenuti da postoje metode za predmetnu klasifikaciju WordNet sinsetova, odnosno definisanje oblasti znanja u kojima se oni koriste. Takve informacije mogu naknadno poslužiti za smanjenje broja moguće vrijednosti riječi, ako je poznat predmet dokumenta koji se obrađuje, čime se omogućava smanjenje vrijednosti greške kada se prihvati pogrešno značenje riječi.

Semantička mreža je model domene, koji ima oblik usmjerenog grafa, čiji vrhovi odgovaraju objektima domene, a lukovi (ivice) definiraju odnos između njih. Objekti mogu biti koncepti, događaji, svojstva, procesi. Dakle, semantička mreža odražava semantiku predmetnog područja u obliku pojmova i odnosa. Štaviše, kao koncepti mogu biti i instance objekata i njihov skup.

Semantičke mreže nastale su kao pokušaj vizualizacije matematičkih formula. Iza vizuelnog prikaza semantičke mreže u obliku grafa nalazi se matematički model, u kojem svaki vrh odgovara elementu predmetnog skupa, a luk odgovara predikatu. Slika 2 prikazuje primjer semantičkog weba, preuzet sa Wikipedije.

Terminologija koja se koristi u ovoj oblasti je raznolika. Da bi se postigla neka homogenost, čvorovi povezani lukovima obično se nazivaju grafovi, a struktura u kojoj postoji čitavo gnijezdo čvorova ili gdje postoje odnosi različitih redova između grafova naziva se mreža. Pored terminologije koja se koristi za objašnjenje, postoje i različiti načini prikaza. Neki ljudi koriste krugove umjesto pravokutnika; neki pišu tipove odnosa iznad ili ispod lukova, zatvarajući ih ili ne zatvarajući ih u ovale; neki koriste skraćenice poput O ili A za označavanje agenta ili objekta; neki koriste različite vrste strelica.

Najranije semantičke mreže razvijene su kao posrednički jezik za sisteme mašinskog prevođenja. Nedavne verzije semantičkih mreža postaju moćnije i fleksibilnije i takmiče se sa sistemima za uokvirivanje, logičkim programiranjem i drugim jezicima za predstavljanje znanja.

Unatoč različitoj terminologiji, različitim metodama za predstavljanje kvantifikatora općenitosti i postojanja i logičkih operatora, različitim načinima manipuliranja mrežama i pravilima zaključivanja, moguće je istaknuti značajne sličnosti svojstvene gotovo svim semantičkim mrežama:

- čvorovi semantičkih mreža su koncepti objekata, događaja, stanja;

- različiti čvorovi istog pojma odnose se na različita značenja, osim ako je za njih označeno da se odnose na isti pojam;

- lukovi semantičkih mreža stvaraju odnose između konceptnih čvorova, oznake iznad lukova označavaju tip odnosa;

- neki odnosi između pojmova predstavljaju semantičke uloge kao što su "agent", "objekat", "primalac" i "instrument"; drugi označavaju vremenske, prostorne, logičke odnose i odnose između pojedinačnih rečenica;

- koncepti su organizovani po nivoima u skladu sa stepenom opštosti, slično hijerarhiji hiperonima u WordNetu, na primer, entitet ® živo biće ® životinja ® mesožder.

Imajte na umu da među semantičkim odnosima koji se koriste za opisivanje mreža mogu postojati ne samo semantičke relacije koje se koriste u tezaurusima, već i drugi tipovi relacija: funkcionalni (obično definirani glagolima proizvodi, utiče, ...), kvantitativni (više, manje , jednako, ... ), prostorno (daleko od, blizu, ispod, iznad, ...), vremensko (ranije, kasnije, tokom, ...), atributivno (imati svojstvo, imati vrijednost) , logički (I, ILI, NE) itd.

Na primjer, semantika rečenice Ivanov ima crni BMW može se predstaviti u obliku semantičke mreže prikazane na slici 3.

Uprkos nekim razlikama, mreže su pogodne za čitanje i obradu pomoću računara, one su vizuelno i prilično univerzalno sredstvo za predstavljanje semantike prirodnog jezika. Međutim, njihova formalizacija u specifičnim modelima predstavljanja, upotrebe i modifikacije znanja pokazuje se prilično mukotrpnom, posebno u prisustvu višestrukih odnosa između njegovih elemenata.

Zamislite, na primjer, neku mrežu koja opisuje izjavu Nastja je tražila knjigu od Daše. Na primjer, sljedeća svojstva mogu se pripisati datim objektima: Nastya - "marljiva", Dasha - "radoznala". Postoji veza između ovih objekata (kroz knjigu). Ali, osim nje, postoje mnoge druge veze koje postoje u stvarnom svijetu: društveni status (studenti, djevojke - ne nužno među sobom), porodični odnosi (svako ima roditelje i/ili druge rođake) itd. Ispada da čak i za tako jednostavan primjer mreža može narasti do velike veličine i, kao rezultat, potraga za izlazom u njoj bit će preteška.

U složenim semantičkim mrežama, koje uključuju mnoge koncepte, proces ažuriranja čvorova i kontrola veza između njih, kao što vidimo, komplikuje proceduru obrade informacija. Želja za rješavanjem ovih nedostataka dovela je do pojave posebnih tipova semantičkih mreža, kao što su modeli okvira.

Okvirne modele predstavljanja znanja predložio je M. Minsky.

Okvir je struktura za opisivanje pojma ili situacije, koja se sastoji od karakteristika ove situacije i njihovog značenja. Okvir se može posmatrati kao fragment semantičke mreže, dizajniran da opiše koncepte sa čitavim skupom njihovih svojstava. Karakteristika okvirnih modela predstavljanja znanja je da su svi koncepti opisani u svakom od čvorova modela određeni skupom atributa i njihovih vrijednosti, koje se nalaze u slotovima okvira.< имя фрейма, слот 1, слот 2, …, слот N >... Grafički, ovo izgleda slično semantičkom webu, ali fundamentalna razlika je u tome što svaki čvor u modelu okvira ima generaliziranu strukturu koja se sastoji od mnogo slotova, od kojih svaki ima ime, pokazivač nasljeđivanja, pokazivač tipa podataka i vrijednost .

Slot je atribut povezan s čvorom u modelu zasnovanom na okviru i sastavni je okvir okvira. Ime slota mora biti jedinstveno unutar okvira. Pokazivač nasljeđivanja pokazuje koje informacije o atributima slotova u okviru najviše razine nasljeđuju slotovi s istim imenima u okviru nižeg nivoa. Pokazivač tipa podataka sadrži informacije o tipu podataka koji će biti uključen u slot. Sljedeći tipovi podataka se obično koriste: pokazivač na naziv okvira najviše razine, realni broj, cijeli broj, tekst, lista, tabela, priložena procedura, itd. Vrijednost slota može biti instanca atributa, drugi okvir ili faset, mora odgovarati specificiranom tipu podataka i nasljeđivanju uslova. Pored određene vrijednosti, slot može pohraniti procedure i pravila koja se pozivaju kada ovu vrijednost treba izračunati. Dakle, slot može sadržavati ne samo određenu vrijednost, već i naziv procedure koja omogućava da se on izračuna prema datom algoritmu, kao i jednu ili više produkcija pomoću kojih se ta vrijednost određuje. Slot može sadržavati više od jedne vrijednosti. Ponekad ovaj slot uključuje komponentu koja se zove faseta koja definira raspon ili listu njegovih mogućih vrijednosti. Faset također specificira granične vrijednosti čuvara mjesta utora. Najčešće su procedure za dodavanje i uklanjanje informacija povezane sa slotovima; oni mogu nadgledati dodeljivanje informacija datom čvoru i proveriti da li se kada se vrednost promeni, poduzimaju odgovarajuće akcije.

Pravi se razlika između referentnih okvira (prototipova) pohranjenih u bazi znanja i okvira instance koji su kreirani za prikaz stvarnih situacija na osnovu dolaznih podataka. Modeli okvira su prilično univerzalni, jer vam omogućavaju da odražavate svu raznolikost znanja o svijetu kroz strukture okvira (za označavanje objekata i pojmova: zajam, zalog, mjenicu), uloge okvira (menadžer, blagajnik, klijent) , okvirni scenariji (stečaj, sastanak dioničara, proslava imendana), okvirne situacije (alarm, nezgoda, način rada uređaja) itd. Za predstavljanje znanja u obliku mreže okvira postoje posebni jezici i softverski alati: FRL (Frame Representation Language), KRL (Knowledge Representation Language), frame shell Kappa, PILOT / 2 i drugi.

Najvažnije svojstvo teorije okvira je nasljeđivanje svojstava pozajmljenih iz teorije semantičkih mreža. U okvirima i semantičkim mrežama, nasljeđivanje se događa preko ISA. ISA slot ukazuje na okvir na višoj razini u hijerarhiji, iz kojeg se vrijednosti sličnih slotova implicitno nasljeđuju, odnosno prenose.

Glavna prednost okvira kao modela za predstavljanje znanja je usklađenost sa savremenim idejama o organizaciji dugoročne memorije osobe, kao i njena fleksibilnost i jasnoća. Prednosti okvirnih modela predstavljanja znanja manifestuju se u slučaju da se generički odnosi retko menjaju i da predmetna oblast ima nekoliko izuzetaka.

Nedostaci okvirnih modela uključuju njihovu relativno visoku složenost, koja se očituje u smanjenju brzine izlaznog mehanizma i povećanju složenosti unošenja promjena u formiranu hijerarhiju. Stoga se pri razvoju sistema okvira velika pažnja poklanja metodama vizuelnog prikaza i efikasnim alatima za uređivanje struktura okvira.

Možete vidjeti da je objektno orijentirani pristup evolucija pogleda okvira. U ovom slučaju, predložak okvira se može posmatrati kao klasa, a instanca okvira kao objekat. Objektno orijentirani programski jezici pružaju alate za kreiranje klasa i objekata, kao i alate za opisivanje procedura za obradu objekata (metoda). Međutim, okvirni modeli ne dozvoljavaju organizovanje fleksibilnog mehanizma zaključivanja; stoga su sistemi okvira ili objektno orijentisane baze podataka, ili zahtevaju integraciju sa drugim alatima za obradu znanja, na primer, logičkim modelima.

U inženjerstvu znanja, ontološki model se shvata kao detaljan opis određenog predmeta ili problematike, koji se koristi za formulisanje iskaza opšte prirode. Ontologije vam omogućavaju da predstavite koncepte u obliku pogodnom za mašinsku obradu.

U središtu većine ontologija su klase koje opisuju koncepte domena. Atributi opisuju svojstva klasa i instanci. Ovdje postoje analogije sa okvirnim pristupom formalizaciji znanja. Mnogi koncepti i principi implementacije, kao i grafički oblik prezentacije u početnoj fazi strukturiranja, slični su ontologijama semantičkim mrežama. Glavna razlika je u orijentaciji ontologija koje će direktno koristiti kompjuter, odnosno strukture podataka nisu opisane prirodnim jezikom (kao što je uobičajeno u semantičkim mrežama i tezaurusima), već posebnim formalnim jezikom. Ontologije takođe imaju mnogo zajedničkog sa tezaurusima. Ali za razliku od njih, za ontološke modele neophodne zahtjeve su unutrašnja potpunost, logički odnos i konzistentnost korištenih koncepata. Ovi zahtjevi možda neće biti ispunjeni u tezaurusima. Formalni jezici kao što su RDF, OWL, KIF, CycL, OCML i drugi se koriste za opisivanje ontologija.

Obično se razlikuju sljedeći glavni elementi ontologija:

- kopije;

- klase objekata (pojmova);

- atributi (opisuju svojstva klasa i instanci);

- funkcije (opisuju zavisnosti između klasa i instanci);

- aksiomi (dodatna ograničenja).

Specijalizovane (predmetno orijentisane) ontologije su reprezentacije polja znanja ili dela stvarnog sveta. Takva ontologija sadrži značenja termina posebnih za ovu oblast. Na primjer, riječ polje u poljoprivredi označava komad zemlje, u fizici - jednu od vrsta materije, u matematici - klasu algebarskih sistema.

Uobičajene ontologije se koriste za predstavljanje koncepata koji su zajednički u velikom broju polja. Takve ontologije sadrže osnovni skup pojmova, glosar ili tezaurus koji se koristi za opisivanje pojmova u domenima.

Savremeni ontološki modeli su modularni, odnosno sastoje se od skupa međusobno povezanih ontologija, od kojih svaka opisuje zasebno predmetno područje ili zadatak. Ontološki modeli nisu statični, oni se stalno mijenjaju.

Ako se razvija sistem koji koristi specijalizirane ontologije, tada može biti potrebna unifikacija ontologija. Glavni nedostatak ontoloških modela je složenost njihove integracije. Ontologije čak i bliskih područja mogu biti nekompatibilne jedna s drugom. Razlika se može pojaviti zbog posebnosti lokalne kulture, ideologije ili zbog upotrebe drugog jezika opisa. Unifikacija ontologija se vrši i ručno i u poluautomatskom režimu. Općenito, ovo je naporan, spor i skup proces.

Ontološki modeli se široko koriste u sistemima zasnovanim na znanju: ekspertnim sistemima i sistemima za podršku odlučivanju. Zanimljiv način predstavljanja znanja o vremenu, uzimajući u obzir nesigurnost u ontologijama, opisan je u radu A.F. Tuzovski.

Trenutno su tehnologije semantičkog weba prilično obećavajuće i široko se koriste u praksi za predstavljanje znanja. Centralni koncept semantičkog weba je ontologija – model predmetnog područja, koji se sastoji od skupa koncepata, skupa instanci koncepata i skupa relacija (osobina). Skup koncepata i odnosi između njih određuju opću shemu skladištenja podataka, predstavljenu kao skup iskaza o instancama koncepata, ili aksiomima ontologije. Takve jednostavne izjave, nazvane trojke, imaju oblik subjekt-predikat-objekat. Skup pravila koje odredi korisnik učitava se u sistem zaključivanja, koji, na osnovu iskaza sadržanih u ontologiji, kreira, prema tim pravilima, nove instance koncepata i odnosa ontologije.

Jedan od najznačajnijih problema kako za predstavljanje znanja u kontekstu vremena tako i za predstavljanje znanja uopšte je reprezentacija znanja o vremenu i o promenama znanja tokom njegovog toka. Međutim, većina jezika za opis znanja koji se koriste u praksi temelji se na logici predikata prvog reda i koristi unarne ili binarne relacije. Takvi jezici, na primjer, uključuju OWL i RDF. U ovom slučaju, za opisivanje binarnih relacija uzimajući u obzir vrijeme, potrebno je u relacije uvesti dodatni parametar koji odgovara vremenu. U ovom slučaju, binarni odnosi postaju ternarni i prevazilaze deskriptivne mogućnosti jezika.

Drugi važan zadatak je opis znanja o vremenu, uzimajući u obzir moguću nepotpunost tog znanja. Na primjer, opis iskaza u obliku: "događaj A će se dogoditi negdje u budućnosti." Ovaj problem se obično rješava u okviru modalne temporalne logike, na primjer LTL, koristeći određene modalne operatore. Ali, pošto je jezik opisa znanja OWL zasnovan na deskriptivnoj logici, postaje nemoguće koristiti takvo rešenje za OWL ontologije.

U svom radu A.F. Tuzovski predlaže da se model za opisivanje znanja o vremenu predstavi u sljedećem obliku:

< TU, VU, TP, F, Rul >, gdje

1) TU je skup vremenskih trenutaka TU = (T È (tØ)), gdje je T linearno uređen skup s kardinalnošću kontinuuma, na kojem je specificirana binarna operacija oduzimanja T ´ T ® R +, a tØ je poseban element koji odgovara "neograničenom vremenu";

2) VU je skup varijabli koje označavaju elemente skupa TU, kao i posebna varijabla tN koja odgovara trenutnom trenutku vremena; vrijednost varijable tN se stalno mijenja, odražavajući tok vremena u određenom sistemu, a predloženi pristup se koristi za opisivanje vremenskog konteksta kojeg;

3) TP - skup vremenskih intervala; vremenski interval odgovara uređenom paru t =< ti1, ti2 >, gdje su ti1 i ti2 elementi skupa VU takvi da je ((ti1 £ ti2) Ù (ti1 ¹ tt) Ù (ti2 ¹ tt)) Ú (ti1 = tt) Ú
(ti2 = tØ); dakle, vremenski interval odgovara određenom segmentu na vremenskoj skali, a njegova granica može biti određeni trenutak u vremenu, trenutni trenutak u vremenu (varijabla tN) ili neodređeni trenutak u vremenu tØ, dok vremenski interval sa podudarnim granice (ti1 = ti2) odgovaraju određenom trenutku u vremenu;

4) F je skup predikata koji opisuju svojstva vremenskih intervala, kao i kvalitativne odnose među njima;

5) Rul je skup pravila oblika (G ® H) i (G «H), koji opisuju osnovne mehanizme logičkog zaključivanja, uključujući ograničenja na vrijednosti predikata F, kao i određenost granica vremenskih intervala.

Koncept vremenskog intervala je neophodan za opisivanje nekih vremenskih intervala, čije su tačne granice nepoznate sve dok se ne pojavi određeno stanje modela. Možemo reći da svaki vremenski interval opisuje određeni vremenski interval čije su tačne granice još uvijek nepoznate. U tom slučaju mogu biti dostupne informacije o granicama unutar kojih se garantuje da se ovaj interval nalazi na vremenskoj skali, a tačne granice intervala opisanog vremenskim intervalom mogu postati poznate u budućnosti. Stoga se uvode dvije vrste granica vremenskih intervala: tačne i garantirane. Za definiranje dvije vrste granica koriste se predikati EL (exactleft), ER (exactright), GL (garanteedleft) i GR (garanteedright) koji definiraju točne lijeve/desne i zajamčene lijeve/desne granice vremenskog intervala, respektivno. . Na primjer, predikat EL (ti, ti1) odgovara izjavi “tačna lijeva granica intervala ti je trenutak u vremenu ti1”. Radi jednostavnosti, oblik granice vremenskog intervala može se označiti različitim zagradama: interval je potpuno definisan (obe granice su tačne); interval.

Agent je pokretač animiranja i kontrolor akcije.

Adresar - primalac poruke (može se kombinovati sa Benefactive).

Benefakt (Primalac, Posjednik) - učesnik na čiji interesi su indirektno pogođeni u procesu situacije (primi korist ili štetu).

Instrument je emocionalni stimulans ili učesnik sa kojim se neka radnja izvodi.

Izvor - mjesto sa kojeg se vrši kretanje.

Suprotna strana je sila ili otporna sredina protiv koje se vrši akcija.

Objekt je učesnik koji se kreće ili mijenja tokom događaja.

Pacijent je učesnik koji prolazi kroz značajne promjene.

Rezultat - učesnik koji se pojavljuje kao rezultat događaja.

Stimulus - spoljni uzrok ili objekt koji uzrokuje ovo stanje.

Meta je mjesto do kojeg se vrši pokret.

Eksperimentator je sudionik koji doživljava unutrašnje stanje koje ne dovodi do vanjskih promjena (nosilac osjećaja i percepcija).

Efektor je neživi učesnik, često prirodna sila, koja uzrokuje promjenu stanja pacijenta.

U skladu sa brojem argumenata i njihovim semantičkim svojstvima, skup verbalnih leksema može se podijeliti na klase. Na primjer, uzmite u obzir sljedeće vrste uloga glagola: glagoli fizičkog utjecaja (hack, saw, cut); glagoli percepcije (vidjeti, čuti, osjetiti); glagoli načina govora (vikati, šaputati, mrmljati). Unutar svakog razreda postoji preciznija podjela. Među glagolima fizičkog udara, glagoli oblika glagola (Agent, Instrument, Objekat) imaju sličnu semantičku strukturu predikata-argumenata: break - slomiti, saviti - savijati, fold - savijati, razbiti - razbiti u komadiće, crack - rascijepiti, itd. Ostala struktura predikata-argumenata tipična za glagole glagolskog tipa (Agent, Instrument, Target): hit - pogoditi, pljusnuti - udariti, udariti - udariti, udariti - pogoditi (o nečemu) , stroke - do stroke, itd.

Vidite da postoje korelacije između morfoloških padeža, prijedloga, sintaktičkih uloga, s jedne strane, i semantičkih uloga, s druge strane, na primjer, rezati nožem, raditi s Ivanom, prskati bojom. Osim toga, treba imati na umu da jedna predikatska riječ ne može imati dva aktanta s istom semantičkom ulogom. Razlike u skupovima uloga uglavnom utiču na periferne semantičke uloge (Counterparty, Stimulus, Source) ili se svode na objedinjavanje / fragmentaciju nuklearnih uloga (Agent vs. Agent i Effector; Addressee vs. Addressee, Recipient i Beefact; Pacijent / Subjekt / Objekt naspram pacijenta, subjekt i rezultat).

C. Fillmore je u svom radu čak predložio pravilo za indirektno preslikavanje semantičkih uloga u sintaksičke: ako među argumentima postoji Agens, on postaje subjekt; u odsustvu agenta, ako postoji instrument, on postaje subjekt; u odsustvu agenta i alata, objekat postaje subjekt. Otuda prirodno nastaje hijerarhija semantičkih uloga. Najpoznatije hijerarhije semantičkih uloga su: Agent> Instrument> Pacijent; Agent> Izvor> Cilj> Alat> Tema> Lokacija; Agent> Benefactive> Experienzer> Tool> Topic> Place i neke druge Hijerarhija semantičkih uloga izgrađena je na način da je moguće odraziti stepen tematske pripadnosti argumenata (aktualnost) tako da pragmatički najvažnija semantička uloge se nalaze na lijevom kraju hijerarhije, a na desnom - semantičke uloge, koje ne karakteriše visoka aktuelnost.

U početku, semantičke uloge trebale su se smatrati primitivnim, nepodložnim daljoj analizi koja bi mogla otkriti njihovu unutrašnju strukturu. Međutim, u ovom slučaju se javlja niz problema. Prvo, kao rezultat sve pažljivije semantičke i raščlanjivanja, dolazi do neograničenog povećanja liste uloga. Drugo, nestrukturirane liste uloga ne dozvoljavaju predviđanje mogućih tipova uloga glagola i objašnjavanje odsustva neprovjerenih tipova. Stoga je u teoriji semantičkih uloga predloženo da se uloge definiraju u smislu distinktivnih karakteristika ili protorola. Na primjer, D. Doughty predlaže da se izdvoji sljedeća svojstva protorole Agensa: dobrovoljno uključen u događaj ili stanje; je savjestan i/ili promišljen učesnik; pokreće događaj ili promjene u stanju drugog učesnika; kreće (u odnosu na tačku u prostoru ili drugog učesnika); postoji nezavisno od događaja naznačenog glagolom.

Nažalost, trenutno nije moguće uspostaviti korespondenciju jedan-na-jedan između semantičkih uloga i padeža, odnosno, sa funkcionalne tačke gledišta, kategorija padeža je heterogena. Situaciju dodatno komplikuje činjenica da su same uloge netrivijalno međusobno povezane, a u prirodnim jezicima su raširene generativne tehnike poput metafore i metonimije, koje daju mnoga nova značenja i, u principu, ne mogu se odraziti u statičnosti. leksikon.

Logički modeli predstavljanja znanja

Osnovna ideja pristupa u izgradnji logičkih modela predstavljanja znanja je da se sve informacije potrebne za rješavanje primijenjenih problema smatraju skupom činjenica i iskaza, koji se u nekoj logici predstavljaju u obliku formula. Znanje se prikazuje skupom ovakvih formula, a sticanje novih znanja svodi se na implementaciju postupaka zaključivanja. Logički modeli predstavljanja znanja zasnovani su na konceptu formalne teorije, definisane torkom S =< B, F, A, R>, gdje je B prebrojiv skup osnovnih simbola (abeceda); F - skup koji se zove formule; A - odabrani podskup a priori istinitih formula (aksioma); R je konačan skup odnosa između formula, koji se nazivaju pravila zaključivanja.

Osnovni pristup predstavljanju značenja u računarskoj lingvistici uključuje stvaranje formalne reprezentacije značenja. Takva reprezentacija se može nazvati jezikom predstavljanja značenja. Jezik reprezentacije je neophodan kako bi se premostio jaz između prirodnog jezika i opšteg znanja o svijetu. A budući da bi se ovaj jezik trebao koristiti za automatsku obradu teksta i prilikom kreiranja sistema umjetne inteligencije, potrebno je uzeti u obzir računske zahtjeve semantičke obrade, kao što je potreba za utvrđivanjem istinitosti iskaza, održavanjem nedvosmislene reprezentacije, predstavljanjem izjave u kanonskom obliku, daju logički zaključak i da budu izražajne.

U prirodnim jezicima postoji širok spektar tehnika koje se koriste za prenošenje značenja. Među najvažnijim je sposobnost prenošenja strukture predikat-argument. Uzimajući u obzir gore navedeno, nalazimo da je logika predikata prvog reda dobro prikladna kao alat za predstavljanje značenja iskaza. S jedne strane, ljudima ga je relativno lako razumjeti, s druge strane, dobro je podložan (računarski) obradi. Važne semantičke klase, uključujući događaje, vrijeme i druge kategorije, mogu se opisati korištenjem logike prvog reda. Imajte na umu, međutim, da izjave koje odgovaraju konceptima kao što su vjerovanja i želje zahtijevaju izraze koji uključuju modalne operatore.

Semantičke mreže i okviri o kojima se raspravljalo u prethodnom odeljku mogu se posmatrati u smislu predikatske logike prvog reda. Na primjer, značenje rečenice Imam knjigu može se napisati na četiri različita načina, koristeći četiri različita jezika za predstavljanje značenja (vidi sliku 4, numeracija odgovara redoslijedu na slici): 1) konceptualni dijagram zavisnosti; 2) prezentacija zasnovana na okvirima; 3) semantička mreža; 4) predikatski račun prvog reda.

Iako su sva ova četiri pristupa različita, na apstraktnom nivou oni predstavljaju opšteprihvaćenu fundamentalnu notaciju da je reprezentacija značenja sastavljena od struktura sastavljenih od mnogih simbola. Ove simboličke strukture odgovaraju objektima i odnosima između objekata. Sva četiri prikaza sastavljena su od simbola koji odgovaraju „govorniku“, „knjigi“ i skupu odnosa koji označavaju posedovanje jednog drugog. Ovdje je bitno da sva ova četiri prikaza omogućavaju povezivanje, s jedne strane, izražajnih osobina prirodnog jezika, as druge strane stvarnog stanja stvari u svijetu.

Logički modeli predstavljanja znanja imaju niz prednosti. Prvo, ovdje se kao "temelj" koristi klasični aparat matematičke logike, čije su metode dobro proučene i formalno potkrijepljene. Drugo, postoje prilično efikasne procedure za izvođenje sintaksički ispravnih iskaza. Treće, ovaj pristup omogućava pohranjivanje samo skupa aksioma u baze znanja, a sva ostala znanja (uključujući činjenice i informacije o ljudima, objektima, događajima i procesima) mogu se dobiti iz ovih aksioma prema pravilima zaključivanja.

Jezik za predstavljanje značenja, kao i svaki jezik, ima svoju sintaksu i semantiku. Slika 5 daje opis gramatike bez konteksta za predikatski račun prvog reda koji je predložen u radu.

Razmotrite prikaz značenja kategorija, događaja, vremena, aspekata i vjerovanja u knjizi.

Zastupljenost kategorija. Pod kategorijom se podrazumijeva grupa riječi ujedinjenih zajedničkim obilježjem, slično kao što je organizirana u tezaurusima. Riječi sa semantikom nalik na predikate često sadrže ograničenja izbora, koja se obično izražavaju u obliku semantičkih kategorija, gdje svaki predstavnik kategorije ima skup odgovarajućih karakteristika.

Najjednostavniji način predstavljanja kategorija je kreiranje jednog predikata za svaku kategoriju. Međutim, tada bi bilo teško davati tvrdnje o samim kategorijama. Razmotrite sljedeći primjer. Pretpostavimo da je, koristeći jezik predikatske logike prvog reda, potrebno predstaviti značenje izjave: "Harry Potter" je najpopularnija knjiga za djecu. Odnosno, morate pronaći najčešći objekt kategorije u obliku MostPopular (HarryPotter, ChildrensBook). Ova formula nije prava formula prvog reda, jer argumenti u predikatima, po definiciji, moraju biti termini, a ne drugi predikati. Da bi se riješio ovaj problem, svi koncepti koji su uključeni u iskaz mogu se predstaviti kao punopravni objekti, odnosno kategorija ChildrensBook može biti predstavljena kao objekt zajedno sa HarryPotterom. Pripadnost takvoj kategoriji će biti označena putem ISA (HarryPotter, ChildrensBook) odnosa. ISA odnos (je a) ukazuje na odnos između objekata i kategorija kojima ti objekti pripadaju. Ovu tehniku ​​možete koristiti za kreiranje hijerarhije kategorija. Na primjer, upotrijebimo relaciju AKO (dječja knjiga, knjiga). Ovdje relacija AKO (vrsta) označava uključivanje jedne kategorije u drugu. Naravno, radi veće pouzdanosti, kategorije moraju biti okarakterisane velikim skupom činjenica, odnosno kategorije moraju biti definisane kao skupovi.

Prezentacija događaja. Da bismo predstavili značenje događaja, dovoljno ga je razmotriti u obliku predikata iz skupa argumenata koji obavljaju određene uloge i neophodni su za opisivanje situacije. Primjeri takvih predikata dati su u prvom dijelu (tamo su dobijeni iz leksičkih funkcija koje je predložio I.A.Mel'chuk). Drugi primjer: Rezervacija (Hearer, Danas, 20:00, 2). Argumenti su ovdje objekti kao što su osoba, restoran, dan, vrijeme i broj mjesta za rezervisanje u restoranu. Za glagole, takav prikaz se može dobiti ako pretpostavimo da argumenti odgovaraju sintaksičkim aktantima. Postoje četiri problema sa ovim pristupom:

- određivanje tačnog broja uloga za svaki događaj;

- predstavljanje činjenica o ulogama povezanim sa događajem;

- potreba da se osigura da se svi tačni zaključci mogu dobiti direktno iz takve prezentacije događaja;

- potreba da se osigura da se iz reprezentacije događaja ne može dobiti netačan izlaz.

Na primjer, glagol "jest" može imati od jednog do četiri aktanta, ovisno o situaciji opisanoj rečenicom. Stoga nije unaprijed jasno kakav bi trebao biti lokalitet predikata. Zaista, u predikatskom računu prvog reda, broj argumenata mora biti fiksan.

Jedno rješenje je pretpostaviti da se ovakve situacije rješavaju na sintaksičkom nivou. Možete razmotriti zasebne potkategorije za svaku od konfiguracija argumenata. Semantička analogija ove metode je stvaranje što više predikata, od kojih će svaki odgovarati različitim situacijama. Ime predikata je isto, ali je broj argumenata drugačiji:
Eating1 (w) - jeo sam; Eating2 (w, x) - Pojeo sam sendvič; Eating3 (w, x, y) - Pojeo sam sendvič za ručak; Eating4 (w, x, y, z) - Pojeo sam sendvič za ručak kod kuće. Stoga se smatraju različitim. Ovaj pristup će zaobići problem broja argumenata, ali je neefikasan. Osim predloženih naziva predikata, ništa ih ne spaja u jedan događaj, iako je njihov logički odnos očigledan. Ispada da se neke logičke veze ne mogu dobiti na osnovu predloženih predikata. Štaviše, moraćete da tražite ove logičke veze u bazi znanja.

Ovaj problem se može riješiti korištenjem semantičkih postulata. Oni eksplicitno povezuju semantiku predikata. Na primjer, "w, x, y, z Eating4 (w, x, y, z) Þ Eating3 (w, x, y).

Predikati mogu odražavati morfološke, sintaksičke i semantičke informacije. Primjeri takvih semantičkih postulata su formule koje sadrže neke od leksičkih predikata iz prvog odjeljka. Dati su semantički postulati koji sadrže morfološke i sintaktičke karakteristike građenja riječi i rečenica u ruskom jeziku. Primjeri semantičkih postulata koji nose semantičko opterećenje nalaze se u prethodnom dijelu.

Imajte na umu da semantiku iskaza prirodnog jezika ne treba miješati sa semantikom predikata koji uvodimo kako bismo odražavali semantiku iskaza. Semantički postulati odražavaju semantiku predikata, odnosno semantičke veze između predikata koje smo uveli.

Jasno je da je ovaj pristup za otkrivanje semantičkih odnosa između predikata u redu za mala područja i ima problema s skalabilnosti. Bilo bi zgodnije reći da se ovi predikati odnose na jedan predikat čiji argumenti nedostaju na nekim pozicijama. U ovom slučaju se mogu izostaviti semantičke postulate. Ali ova metoda ima i nedostatak. Na primjer, ako uzmemo u obzir predikat Eating (w, x, y, z) i pretpostavimo da jedna od riječi iz skupa (doručak, ručak, večera) mora biti prisutna kao treći argument, tada je egzistencijalni kvantifikator suspendovan na drugom varijabla će značiti postojanje specifične hrane koja je povezana sa svakim obrokom, što nije tačno.

Razmotrimo prikladan primjer. Napišimo tri tvrdnje (pojeo sam ručak, jeo sam kod kuće i pojeo sam sendvič za ručak kod kuće) koristeći logiku prvog reda:

$ w, x jelo (zvučnik, w, ručak, x)

$ w, x jelo (zvučnik, w, x, dom)

$ w Ishrana (zvučnik, w, ručak, dom).

Pretpostavimo da je iz prve dvije formule koje se odnose na jedan događaj potrebno dobiti treću formulu. Nezavisni događaji Ručao sam i jeo sam kod kuće ne dopuštaju da zaključimo da sam ručao kod kuće. Kao i sa prikazom kategorije, ovaj problem možete riješiti tretiranjem događaja uporedo s objektima tako da se oni mogu kvantifikovati i povezati s drugim objektima koristeći skupove definiranih odnosa. Sada će se prema ovom pristupu dobiti sljedeći prikaz.

Za ponudu sam ručala

$ w ISA (w, Jedenje) Ù Eater (w, zvučnik) Ù Eater (w, Ručak).

Za ponudu koju sam jeo kod kuće

$ w ISA (w, Eating) Ù Eater (w, zvučnik) Ù Mjesto (w, Dom).

Da ponudim pojeo sam sendvič za ručak kod kuće

$ w ISA (w, Eating) Ù Eater (w, zvučnik) Ù Jeo (w, sendvič) Ù ObrokEaten (w, Runch) Ù Mjesto (w, Home)

Opisani pristup eliminira potrebu za specificiranjem fiksnog broja argumenata u predikatu, bez obzira na uloge i druge aktante. Nema drugih uloga koje nisu spomenute u rečenici, dok logičke veze između semantički povezanih predikata ne zahtijevaju korištenje semantičkih postulata.

Reprezentacija vremena. Vremenska logika se koristi za opisivanje slijeda događaja i njihovog odnosa na vremenskoj liniji. U prirodnim jezicima takav alat je glagolsko vrijeme. Može se pretpostaviti da jedan događaj prethodi drugom ako tok vremena vodi od prvog do drugog događaja. Otuda nastaju poznati koncepti prošlosti, sadašnjosti i budućnosti.

Temporalna logika koristi dvije vrste operatora: logičke i modalne. Kao logički operatori koriste se uobičajeni operatori logike propozicionog računa: konjunkcija, disjunkcija, negacija i implikacija. Modalni operatori su definirani na sljedeći način.

N j - Sljedeće: j mora biti istinito u stanju neposredno nakon datog.

F j - Budućnost: j mora postati istinito u barem jednom budućem stanju.

G j - Globalno: j mora biti istinito u svim budućim stanjima.

A j - Sve: j se mora izvršiti na svim granama počevši od ove.

E j - postoji: postoji barem jedna grana na kojoj se j izvršava.

j U y - Do (jako): y se mora izvršiti u nekom stanju u budućnosti (moguće u trenutnom), svojstvo j mora biti izvršeno u svim stanjima do naznačenog (ne uključujući).

j R y - Oslobađanje: j oslobađa y ako je y istinito, sve do trenutka kada j prvi put postane istinito (ili uvijek, ako takav trenutak ne dođe). Inače, j mora postati istinito barem jednom prije nego što y bude istinito prvi put.

Reprezentacija aspekata. Glagoli se koriste za opisivanje radnji u prirodnim jezicima. Američki filozof Z. Wendler je 1957. godine predložio model za podjelu glagola po leksičkim aspektima. On je identifikovao četiri klase:

- stativi - glagoli koji opisuju statična stanja koja nemaju krajnju tačku (na primjer, "znam", "volim");

- aktivnosti - glagoli koji opisuju stanja koja su dinamična i nemaju krajnju tačku (na primjer, "trčati", "voziti");

- postignuća - glagoli koji opisuju događaje koji imaju krajnju tačku i postupni su (na primjer, "naslikati sliku", "izgraditi kuću");

- postignuća - glagoli koji opisuju događaje koji imaju krajnju tačku i događaju se trenutno (na primjer, "prepoznati", "obavijestiti").

U tabeli 2 prikazana je uporedna tabela Wendlerovih klasa za engleske glagole, preuzeta iz rada.

Kao što vidite, trajanje akcije je karakteristično za aktivnosti i postignuća i izostaje u statistici i postignućima. Možete reći da je ključalo (aktivnost) i pisao sam pismo (radio), ali ne možete reći da je postojalo (statično) i da sam pronalazio knjigu (dostignuće). Postignuća nisu srazmjerna okolnostima trajanja. Može se reći da je postojao dva sata (kabinet), ali nisam ga našao dva sata (dostignuće).

Postignuća i postignuća opisuju svrsishodne radnje, kombinuju se sa okolnostima datuma završetka, za razliku od kabineta i aktivnosti. Možete reći da sam napisao pismo za dva sata (radnja), ali ne možete reći da sam prošetao za dva sata (aktivnost).

Predstavljanje uvjerenja, želja i namjera. Za izražavanje govornikovog stava prema informacijama koje se saopštavaju u izgovorima na prirodnom jeziku koriste se riječi kao što su vjerujem, želim, vjerujem, predstavljam, itd. Takve izjave ne opisuju objektivnu sliku svijeta, već osobenosti govornikove lične percepcije, njegove "unutrašnje" ideje o svijetu. Uzmite u obzir izreku Vjerujem da je John pročitao "Harryja Pottera". Pogrešno je pokušati predstaviti njegovo značenje koristeći predikatsku logiku: Vjerovanje (govornik, čitanje (John, HarryPotter). Ovdje bi drugi argument trebao biti termin, a ne formula. Ova sintaktička greška podrazumijeva semantičku grešku. U logici prvog reda , predikati vezuju objekte, a ne odnos između njih. Standardni način za prevazilaženje ovog problema je dodavanje operatora koji nam omogućavaju da napravimo izjave koje su nam potrebne. Ako unesemo operator Believes, koji ima formule kao argumente, dobićemo sljedeće zastupanje:

Vjeruje (Speaker, $ x ISA (x, Reading) Ù Reader (x, John) Ù Read (x, HarryPotter)).

To ne znači da je takav prikaz napisan u terminima predikatskog računa prvog reda, ali je potvrda da u jeziku postoji grupa glagola koja ima posebnu ulogu u semantičkoj analizi. U sistemima automatske analize ponekad je potrebno pratiti uvjerenja i namjere korisnika. Situacija je komplikovana činjenicom da se verovanja, želje i namere mogu promeniti tokom dijaloga.

Uneseni operator naziva se modalni. Postoje različiti modalni operatori. Temporalni modalitet je već spomenut nešto ranije, kada se govorilo o reprezentaciji vremena u iskazima. Pored temporalnosti, postoji prostorni modalitet, logika znanja ("zna se da"), logika dokazivosti ("to se može dokazati") i druge. Logika proširena modalnim operatorima naziva se modalna logika. Trenutno postoji mnogo složenih neistraženih pitanja u ovoj oblasti. Kako zaključivanje funkcionira u prisustvu specifičnih modalnih operatora? Na koje se vrste formula mogu primijeniti ovi ili oni operatori? Kako modalni operatori stupaju u interakciju s kvantifikatorima i booleovim vezama? Ova i druga pitanja tek treba istražiti. Nećemo se ovdje zadržavati na njima.

Izvođenje sintaksički ispravnih iskaza u logičkim modelima predstavljanja znanja zasniva se na pravilu rezolucija koje je razvio J. Robinson 1965. godine. U njemu se navodi da ako je grupa izraza koji čine premisu istinita, onda je primjena pravila zaključivanja zagarantovana kako bi se osiguralo da se pravi izraz vrati kao zaključak. Rezultat primjene pravila rezolucije naziva se rezolucija.

Metoda rezolucija (ili pravilo eliminacije kontradikcija) omogućava vam da dokažete istinitost ili netačnost hipoteze metodom kontradikcije. U metodi rezolucija, skup rečenica se obično smatra složenim predikatom koji sadrži nekoliko predikata povezanih logičkim funkcijama i kvantifikatorima postojanja i univerzalnosti. Budući da predikati istog značenja mogu imati različite oblike, rečenice se prvo moraju svesti na jedinstveni oblik (disjunktivni ili konjunktivni normalni oblik), u kojem se uklanjaju kvantifikatori postojanja, univerzalnosti, simboli implikacije, ekvivalencije itd. Pravilo rezolucija sadrži spoj klauzula na lijevoj strani. Stoga je dovođenje premisa korištenih za dokaz u formu koja je spoj klauzula neophodan korak u gotovo svakom algoritmu koji implementira logičko zaključivanje zasnovano na metodi rezolucije.
U procesu zaključivanja pomoću pravila rezolucije izvode se sljedeći koraci.

1. Operacije ekvivalencije i implikacije su eliminirane:

A «B = (A ® B) Ù (B ® A);

A ® B = Ø A Ú B.

2. Operacija negacije se kreće unutar formula koristeći de Morganove zakone:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. Logičke formule su svedene na disjunktivni oblik:

A Ú (B Ù C) = (A Ú B) Ù (A Ú C).

U logici predikata, da bi se primijenilo pravilo rezolucija, potrebno je izvršiti složeniju transformaciju logičkih formula kako bi se one dovele do sistema klauzula. To je zbog prisutnosti dodatnih elemenata sintakse, uglavnom kvantifikatora, varijabli, predikata i funkcija.
Algoritam za objedinjavanje predikatnih logičkih formula sastoji se od sljedećih koraka.

1. Eliminacija operacija ekvivalencije.

2. Eliminacija operacija implikacije.

3. Uvođenje operacija negacije unutar formula.

4. Eliminacija egzistencijalnih kvantifikatora. Ovo se može dogoditi u trećem koraku zbog primjene de Morganovih zakona, naime, negacija $ mijenja se u ", ali može doći i do obrnute promjene. Zatim, da biste eliminirali $, postupite na sljedeći način: sve pojave neke varijable povezane sa egzistencijalnim kvantifikatorom, na primjer ($ x), zamjenjuju se u formuli novom konstantom, na primjer a. Ova konstanta predstavlja neku (nepoznatu) vrijednost varijable x za koju je tačan iskaz napisan ovom formulom. važno je da će na svim mjestima gdje je x biti zamijenjena ista vrijednost a, čak i ako je u ovom trenutku nepoznata.

5. Kvantifikatori uopštenosti se stavljaju na prva mesta u formulama. Ovo također nije uvijek jednostavna operacija, ponekad morate preimenovati varijable.

6. Otkrivanje veznika koji su zapali u disjunkcije.

Nakon završetka svih koraka opisanog algoritma objedinjavanja, može se primijeniti pravilo rezolucije.

Upravo je pravilo rezolucija poslužilo kao osnova za stvaranje programskog jezika Prolog.
U Prologu su činjenice opisane u obliku logičkih predikata sa specifičnim značenjima. Pravila zaključivanja su opisana logičkim predikatima uz definiciju pravila zaključivanja u obliku liste predikata nad bazama znanja i postupcima obrade informacija. Prologov tumač jezika nezavisno implementira izlaz sličan onom gore opisanom. Da bi se inicirali proračuni, pravi se poseban upit bazi znanja, na koji sistem logičkog programiranja generiše odgovore "tačno" i "netačno".

Metoda rezolucija je lako programibilna, to je jedna od njenih najvažnijih prednosti, ali je primenljiva samo u ograničenom broju slučajeva, jer za njenu primenu dokaz ne bi trebao imati veliku dubinu, a broj potencijalnih rezolucija ne bi trebao biti veliko.

Da bi bio fleksibilniji, alat za predikatski račun prvog reda može se proširiti lamda računom. Lambda račun je jezik višeg reda od predikatskog računa prvog reda. U njemu, lambda funkcija može raditi kao argument ne samo s varijablama, već i s predikatima. Međutim, upotreba lambda izraza formalno ne povećava izražajnu moć logike prvog reda, budući da se bilo koji konstrukt koji sadrži lambda izraz može konvertirati u njegov ekvivalentni oblik bez njega.

Nakon što je Prolog jezik stekao veliku popularnost, početkom 80-ih godina prošlog vijeka pojavio se pojam "računari pete generacije". U to vrijeme se očekivala sljedeća generacija računara fokusiranih na distribuirano računarstvo. Istovremeno se vjerovalo da će peta generacija postati osnova za stvaranje uređaja koji mogu simulirati proces ljudskog razmišljanja. Istovremeno se javila ideja o stvaranju hardverske podrške za paralelne relacijske baze podataka Grace i Delta i paralelnog logičkog zaključivanja (Parallel Inference Engine, PIE), na osnovu principa Prolog jezika. Svaki blok zaključivanja signalizirao je svoje trenutno radno opterećenje tako da se rad može prenijeti na blok zaključivanja s najmanjim opterećenjem. Ali, kao što znate, takvi pokušaji nisu dopustili stvaranje umjetne inteligencije, već su samo poslužili kao još jedna potvrda da ljudsko razmišljanje još nije dovoljno proučeno.

Logički modeli predstavljanja znanja omogućavaju vam da provjerite sintaksičku ispravnost iskaza. Međutim, uz pomoć pravila koja definišu sintaksu jezika, nemoguće je utvrditi istinitost ili netačnost ove ili one izjave. Izjava može biti sintaktički ispravna, ali se može pokazati potpuno besmislenom. Osim toga, logičke modele je teško koristiti prilikom dokazivanja obrazloženja koje odražava specifičnosti konkretnog predmetnog problema, zbog visokog stepena uniformnosti.

Sistemi sa komponentama semantičke analize

Projekat Open Cognition razvija Link Grammar Parser, koji je odgovoran za obradu prirodnog jezika. Link Grammar Parser je započeo razvoj 1990-ih. na Univerzitetu Carnegie Mellon. Ovaj pristup se razlikuje od klasične teorije sintakse. Sistem rečenici dodjeljuje sintaksičku strukturu koja se sastoji od skupa označenih veza (konektora) koji povezuju parove riječi. Parser gramatike veza koristi informacije o vrstama veza između riječi.

Analizator ima rječnike koji sadrže oko 60.000 oblika vokabulara. Omogućava vam rastavljanje veliki broj sintaktičke konstrukcije, uključujući brojne rijetke izraze i idiome. Link Grammar Parser je prilično robustan, može preskočiti dijelove rečenice koje ne razumije i definirati neku strukturu za ostatak rečenice. Analizator je sposoban da radi sa nepoznatim vokabularom i pravi razumne pretpostavke (na osnovu konteksta i pravopisa) o sintaksičkoj kategoriji nepoznatih reči. Posjeduje podatke o vlastitim imenima, brojčanim izrazima i raznim interpunkcijskim znacima.

Analiza u sistemu se odvija u dvije faze.

1. Konstrukcija skupa sintaksičkih prikaza jedne rečenice. U ovoj fazi se razmatraju sve varijante veza između riječi i među njima se biraju one koje zadovoljavaju kriterij projektivnosti (veze se ne smiju ukrštati) i kriterij minimalne povezanosti (rezultirajući graf treba da sadrži najmanji broj povezanih komponenti; povezana komponenta grafa je skup vrhova grafa tako da za bilo koja dva vrha iz ovog skupa postoji put od jednog do drugog i ne postoji put od vrha ovog skupa do vrha koji nije iz ovog skupa) .

2. Naknadna obrada. Dizajniran za rad sa već izgrađenim alternativnim rečeničnim strukturama.

Rezultirajući dijagrami su u suštini analogni stablima subordinacije. U stablima subordinacije, od glavne riječi u rečenici, možete postaviti pitanje do sporednog. Dakle, riječi su raspoređene u strukturu stabla. Parser može proizvesti dvije ili više shema raščlanjivanja za istu rečenicu. Ova pojava se naziva sintaktička sinonimija.

Glavni razlog zašto se analizator naziva semantičkim sistemom može se smatrati jedinstvenim u smislu kompletnosti skupom veza (oko 100 glavnih, a neke od njih imaju 3-4 varijante).
U nekim slučajevima, pažljiv rad na različitim kontekstima doveo je autore sistema do prelaska na gotovo semantičke klasifikacije zasnovane isključivo na sintaksičkim principima. Dakle, razlikuju se sljedeće klase engleski dijalekti: situacijski prilozi koji se odnose na cijelu rečenicu u cjelini (klauzalni prilog); vremenski prilozi; uvodni prilozi na početku rečenice i odvojeni zarezima (otvarači); prilozi koji modificiraju pridjeve, itd.

Od prednosti sistema treba napomenuti da je organizacija same procedure za pronalaženje opcija za sintaksičko predstavljanje veoma efikasna. Konstrukcija se ne odvija od vrha do dna (odozgo prema dolje) i ne odozdo prema gore (odozdo prema gore), već se sve hipoteze odnosa razmatraju paralelno: prvo se sve moguće veze grade prema formulama rječnika, a zatim moguće razlikuju se podskupovi ovih veza. Ovo, prvo, dovodi do algoritamske neprozirnosti sistema, jer je veoma teško pratiti sve relacije odjednom, i drugo, ne do linearne zavisnosti brzine algoritma od broja reči, već do eksponencijalne, jer skup svih varijanti sintaksičkih struktura na rečenici riječi u najgorem slučaju, jednak je skupu svih osnovnih stabala kompletnog grafa sa vrhovima.

Posljednja karakteristika algoritma prisiljava programere da koriste tajmer kako bi zaustavili proceduru koja traje predugo u vremenu. Međutim, svi ovi nedostaci su više nego nadoknađeni jezičkom transparentnošću sistema, u kojem se s jednakom lakoćom registruju valencije riječi, a red prikupljanja valencija unutar algoritma nije fundamentalno postavljen, veze se grade paralelno. , takoreći, što u potpunosti odgovara našoj jezičkoj intuiciji.

Za svaku riječ u rječniku napisano je kojim konektorima se može povezati s drugim riječima rečenice. Konektor se sastoji od imena tipa relacije kojoj se dotična jedinica analize može pridružiti. Postoji više od 100 osnovnih, najvažnijih priključaka. Za označavanje smjera veze, na konektoru je na desnoj strani pričvršćen znak "+", a na lijevoj znak "-". Lijevi i desni konektori istog tipa čine vezu. Jedna riječ se može pripisati formuli konektora, sastavljenih pomoću određenih snopova.

Zabilježimo i nedostatke Link Grammar Parser.

1. Praktično testiranje sistema pokazuje da pri analizi složene rečenicečija dužina prelazi 25–30 riječi, moguća je kombinatorna eksplozija. U ovom slučaju, rezultat rada analizatora je "panični" graf, po pravilu, slučajna verzija sintaksičke strukture, neadekvatna sa lingvističke tačke gledišta.

2. Primjena gore opisanih ideja je teška za flektivne jezike kao što je ruski zbog značajnog povećanja obima rječnika koji nastaju zbog morfološkog razvoja flektivnih jezika. Svaki morfološki oblik mora biti opisan posebnom formulom, pri čemu indeks konektora koji je uključen u njega mora pružiti proceduru uparivanja. To dovodi do komplikacije skupa konektora i povećanja njihovog broja.

Projekat Open Cognition, koji razvija Link Grammar Parser, je otvoren i besplatan, što je velika prednost za istraživanje. Prilično detaljan opis i izvorni kod mogu se naći na stranici. Open Cognition nastavlja da se razvija u ovom trenutku, što je takođe važno jer postoji prilika za interakciju sa programerima. Uz Link Gramatiku, u toku je razvoj RelEx analizatora, koji vam omogućava da izdvojite semantičke odnose zavisnosti u iskazima na prirodnom jeziku, a kao rezultat toga, rečenice su predstavljene u obliku stabala zavisnosti. Koristi nekoliko skupova pravila za ponovnu izgradnju grafa uzimajući u obzir sintaktičke odnose između riječi. Nakon svakog koraka, prema skupu pravila podudaranja, u rezultirajući graf se dodaju oznake strukturnih karakteristika i odnosa između riječi. Međutim, neka pravila, naprotiv, mogu skratiti graf. Tako dolazi do transformacije grafa. Ovaj proces primjene niza pravila sličan je onom koji se koristi u restriktivnim gramatikama. Glavna razlika je u tome što RelEx radi sa prikazom grafa, a ne sa jednostavnim skupovima oznaka (koji označavaju odnose). Ova funkcija vam omogućava da primijenite apstraktnije transformacije prilikom analize tekstova. Drugim riječima, glavna ideja je korištenje prepoznavanja obrazaca za transformaciju grafova. Za razliku od drugih analizatora koji se u potpunosti oslanjaju na sintaksičku strukturu rečenice, RelEx je više fokusiran na predstavljanje semantike, posebno se tiče entiteta, poređenja, pitanja, rješavanja anafora i leksičke polisemije riječi.

Sistem biranja

Biranje je automatski rusko-engleski sistem prevođenja koji je razvijen od 1999. do 2002. godine. u okviru projekta „Automatska obrada teksta“ (AOT). V drugačije vrijeme U radu na sistemu učestvovala su 22 specijalista, od kojih su većina poznati lingvisti.
Sistem biranja je zasnovan na francusko-ruskom sistemu automatskog prevođenja (FRAP), razvijenom u VTsP-u zajedno sa Moskovskim državnim pedagoškim institutom. M. Toreza 1976-1986, i sistem analize političkih tekstova na ruskom "Polytext", razvijen u Centru za istraživanje informacija 1991-1997.

Sistem Polytext je bio usmjeren na analizu službenih dokumenata na ruskom jeziku i sadržavao je cijeli lanac analizatora teksta: grafičke, morfološke, sintaktičke i djelimično semantičke. U sistemu biranja grafematska analiza je delimično pozajmljena, ali prilagođena novim programskim standardima. Program morfološke analize napisan je iznova, jer je brzina rada bila mala, ali se sam morfološki aparat nije mijenjao.

Na grafičkom nivou, konstante su grafematski deskriptori. Na primjer, LE (leksema) - dodjeljuje se sekvencama koje se sastoje od ćiriličkih znakova; ILE (strana leksema) - dodjeljuje se nizovima latiničnih znakova; CC (digitalni kompleks) - dodjeljuje se nizovima brojeva; PPK (alfanumerički kompleks) - dodjeljuje se sekvencama koje se sastoje od brojeva i slova, itd.

Na morfološkom nivou, gramame se koriste za oznake – gramatičke karakteristike koje upućuju oblik riječi na određenu morfološko klasu. Različiti gramami iste kategorije međusobno se isključuju i ne mogu se izraziti jednom riječju. Na primjer, jr - ženski rod, tv - instrumental, pl - množina, ali - neživ, sv - savršeni oblik, dst - aktivni glas, ne - prijelaznost glagola, pvl - imperativ glagola, nst - sadašnje vrijeme glagol, itd. itd.

Analiza fragmentacije ima za cilj podjelu rečenice na neodvojive fragmente (sintaksičke jedinice), veće fraze ili jednake njima (sintaksičke grupe), te uspostavljanje djelomične hijerarhije na skupu tih jedinica. Moguće vrste fragmenata: glavne rečenice, podređene rečenice kao dio složenih, participativnih, priloških i drugih zasebnih fraza. Za svaki fragment je poznato koji su fragmenti direktno ugniježđeni u njemu, a u koji je direktno ugniježđen.

FRAP sistem je sadržavao cijeli lanac analize teksta do semantičke, koji je samo djelimično implementiran. U sistemu FRAP razvijen je i testiran semantički aparat na osnovu kojeg je kreirana posebna metoda semantičke analize u sistemu biranja - metoda pune opcije... FRAP nije sadržavao mehanizme za strukturne evaluacije semantičke reprezentacije, odnosno metode ne samo jedne pojave tekstualnog elementa, već cijele strukture u cjelini. Ideja metode punih varijanti je da analiza treba jasno razdvojiti varijante analize koje nastaju u različitim fazama, i deklarativno jezička pravila (parcijalni modeli) koja grade i vrednuju pojedinačne varijante. Ovaj pristup, koji se ranije koristio samo za predsemantičke analizatore, sada je, zbog razvoja računarske moći, postao moguć prelazak na semantiku, čime se povećava nivo razdvajanja proceduralnih i deklarativnih delova sistema. Proceduralni dio semantičke analize, idealno, sveden je na petlje koje prolaze kroz različite jezičke opcije. Tako je postalo moguće pojednostaviti lingvističke modele zbog povećane brzine računara.

Glavne komponente semantičkog aparata koji se koristi u biranju su semantičke relacije (SR) i semantičke karakteristike (SR). Primjeri semantičkih relacija: INSTR - "alat", LOK - "lokacija, lokacija", PRINADL - "pripadanje", RESLT - "rezultat", itd. Oni su prilično univerzalni i imaju sličnosti s predikatima o kojima se govori u prvom dijelu, i semantičke uloge, spomenute u trećem dijelu. Semantičke karakteristike vam omogućavaju da gradite formule koristeći logičke veze "i" i "ili". Svakoj riječi se pripisuje određena formula, sastavljena od semantičkih karakteristika. Semantički rečnik "Biranje" sadrži oko 40 semantičkih karakteristika. Primeri semantičkih karakteristika: ABSTR - apstraktna imenica ili pridev, VESCHVO - naziv hemikalije ili nečega što se može meriti težinom ili zapreminom; GEOGR - geografski objekat; Kretanje - glagoli kretanja; INTEL - radnje koje se odnose na mentalnu aktivnost; KOMUNIKACIJSKI - glagoli govora; NOSINF - nosioci informacija; ORG - organizacija; SOBIR - sve što označava skup objekata istog tipa; EMOTs - pridjevi koji izražavaju emocije itd. Neke karakteristike su složene jer se mogu izraziti u terminima drugih. Postoje karakteristike koje su antonimi. Zabranjena je njihova upotreba u jednom spoju. Postoje karakteristike koje su varijante drugih. Semantičke karakteristike, uz gramatičke karakteristike, omogućavaju provjeru slaganja riječi pri tumačenju linkova u tekstu.

U ovom trenutku, svi alati razvijeni u okviru AOT projekta (uključujući i sistem biranja) su besplatni cross-platformski softver. Demo i detaljna dokumentacija dostupni su na web stranici.

Ekstrakcija informacija i sistemi predstavljanja znanja

Postoje i drugi sistemi koji sadrže komponente semantičke analize. Međutim, oni imaju značajne nedostatke za istraživanje: teško je pronaći opise koji nisu besplatni i slobodno distribuirani ili ne rade s tekstovima na ruskom jeziku. To uključuje OpenCalais (http://www.opencalais.com/opencalais-api/), RCO (http://www.rco.ru/?page_id=3554), Abbyy Compreno (https: //www.abbyy. com / ru-ru / isearch / compreno /), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/), itd.

Treba spomenuti sistem za izdvajanje podataka iz nestrukturiranih tekstova Pullenti (http://semantick.ru/). Zauzela je prvo mjesto na stazama T1, T2, T2-m i drugo mjesto na T1-l na konferenciji Dialogue-2016 u takmičenju FactRuEval. Na sajtu programera Pullenti sistema nalazi se i demo verzija semantičkog analizatora, koja omogućava izgradnju semantičke mreže na sugestiju.

DEKL instrumentalno okruženje (http://ipiranlogos.com/) je razvijeno kasnih 90-ih i korišćeno za izgradnju ekspertnih sistema (ES), školjki za ES, logičko-analitičkih sistema (LAS), lingvističkih procesora (LP), obezbeđivanje obrade i automatsko izdvajanje znanja iz tokova neformalizovanih dokumenata na prirodnom jeziku.

Sistem mašinskog prevođenja ETAP-3 je dizajniran za analizu i prevođenje tekstova na ruskom i engleskom jeziku. Sistem koristi transformaciju tekstova prirodnog jezika u njihovu semantičku reprezentaciju u univerzalnom mrežnom jeziku. Kao što je ranije spomenuto, označavanje sintaksičkog korpusa "Nacionalni korpus ruskog jezika" obavlja ETAP-3 jezički procesor, zasnovan na principima teorije "Značenje Û teksta".

U posljednje vrijeme se pojavljuje sve više sistema za predstavljanje baza znanja u obliku grafova. Budući da se količina informacija stalno povećava neverovatnom brzinom, takvi sistemi moraju podržavati izgradnju i dopunjavanje baza znanja u automatskom režimu. Automatska izgradnja baza znanja može se izvršiti na osnovu strukturiranih izvora podataka.

Primjeri takvih sistema: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http: //wiki.dbpedia .org /), Freebase (https: // programeri.
google.com/freebase/), Googleov Graf znanja (https://developers.google.com/knowledge-graph/), OpenCyc (http://www.opencyc.org/). Drugi pristup vam omogućava da izdvojite informacije iz otvorenih izvora na Internetu bez ljudske intervencije: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
softver / openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Takvi sistemi su eksperimentalni, svaki od njih ima svoje karakteristike. Na primjer, Trezor znanja pokušava da uzme u obzir nesigurnosti, svakoj činjenici se dodjeljuje koeficijent povjerenja i porijekla informacije. Dakle, sve tvrdnje se dijele na one za koje postoji velika vjerovatnoća da su istinite, i one koje mogu biti manje vjerovatne. Predviđanje činjenica i njihovih svojstava vrši se metodama mašinskog učenja na osnovu velikog broja tekstova i već dostupnih činjenica. Trezor znanja trenutno sadrži 1,6 milijardi činjenica. Razvijen kao dio projekta ReadTheWeb od strane Univerziteta Carnegie Mellon, NELL sadrži preko 50 miliona tvrdnji s različitim stepenom pouzdanosti. Oko 2 miliona 800 hiljada činjenica ima visok stepen pouzdanosti. Proces NELL obuke također još nije završen.

Hajde da donesemo sljedeće zaključke. Sa razvojem kompjuterske tehnologije i stalnim rastom
Tomovi istraživanja tekstualnih informacija u oblasti automatske obrade teksta fokusirali su se na primenjeni aspekt. Većina alata je ograničena na morfološku i sintaksičku analizu u kombinaciji sa metodama iz teorije vjerovatnoće i matematičke statistike. Dakle, samo odabrani dio najviše jednostavni zadaci ispostavilo se da je riješeno. Ostatak problema ostaje da se riješi.

Kao što smo vidjeli, postoji mnogo razloga za to. Na primjer, vjeruje se da svako pravilo u sintaksi ima svoj analog u semantici. Ovaj postulat se naziva hipoteza od pravila do pravila. U stvari, ova prepiska nije jedan na jedan, i to je glavna poteškoća. Zaista, svako pravilo sintakse (stablo raščlanjivanja) može biti povezano sa semantičkim pravilom (stablo raščlanjivanja), ali neće biti jedino. U suprotnom smjeru, slično semantičkom pravilu, usklađuje se sintaktično pravilo, ali ne nužno i jedino. Upravo ta dvosmislenost dovodi do nerešivih problema u oblasti automatske obrade teksta danas. U vezi sa ovim obrazloženjem postavlja se pitanje izbora željenog poređenja iz velikog broja mogućih opcija.

Iz svega navedenog može se izvući još jedan vrlo važan zaključak. Procese generisanja i tumačenja iskaza ne treba posmatrati odvojeno, oni su neraskidivo povezani između
sebe. Izražavajući svoju misao, osoba se vodi time da li će sagovornik razumjeti. U procesu generiranja iskaza, osoba se, takoreći, „duplo provjerava“, simulirajući kako će sagovornik percipirati informaciju. Sličan mehanizam je prisutan u tumačenju iskaza. Kada shvatimo ono što smo čuli ili pročitali, ponovo „provjeravamo“ svojim znanjem i predstavama o svijetu. Samo zahvaljujući tome možemo odabrati odgovarajuće značenje.

Moderni istraživači su skloni mišljenju da se neophodan izbor može napraviti uz dodatnu bazu znanja o svijetu. Takva baza znanja treba da sadrži opće semantičke informacije o pojmovima i odnosima između njih, kako bi prilikom pozivanja na nju bilo moguće odrediti odgovarajući kontekst iskaza u automatskom režimu. Pomoglo bi da se uzme u obzir akumulirano znanje o svijetu, koje nije eksplicitno prisutno u određenom iskazu, ali direktno utiče na njegovo značenje.

Književnost

  1. Melchuk I.A. Iskustvo teorije lingvističkih modela "Smisao-tekst". M.: Jezici ruske kulture, 1999.346 str.
  2. Lakhuti D.G., Rubashkin V.Sh. Semantički (konceptualni) rječnik za informacijske tehnologije // Znanstvene i tehničke informacije. 2000. br. 7. str. 1–9.
  3. E.V. Paducheva Dinamički modeli u semantici vokabulara. M.: Jezici slavenske kulture, 2004. 608 str.
  4. V.A. Tuzov Računarska semantika ruskog jezika. Sankt Peterburg: Izdavačka kuća St. Petersburg State University, 2003. 391 str.
  5. Nacionalni korpus ruskog jezika. URL: http://www.ruscorpora.ru/ (datum pristupa: 22.08.2016.).
  6. Apresyan V.Yu. i dr. Novi objašnjavajući rečnik sinonima ruskog jezika. Moskva – Beč: Jezici slovenske kulture – Bečki slavenski almanah, 2004. 1488 str.
  7. A.A. Khoroshilov Metode za automatsko utvrđivanje semantičke blizine dokumenata na osnovu njihove konceptualne analize // Elektronske biblioteke: napredne metode i tehnologije, digitalne zbirke: tr. XV Sve-Rusija. naučnim. konf. RCDL "2013. Jaroslavlj: Izdavačka kuća YarSU, 2013. P. 369–376.
  8. Rubashkin V.Sh. Predstavljanje i analiza značenja u inteligentnim informacionim sistemima. Moskva: Nauka, 1989. 189 str.
  9. Lakhuti D.G., Rubashkin V.Sh. Sredstva i postupak konceptualne interpretacije ulaznih poruka na prirodnom jeziku // Izv. Akademija nauka SSSR-a. Ser. Technical cybern. 1987. br. 2. str. 49–59.
  10. Rubashkin V.Sh. Semantička komponenta u sustavima razumijevanja teksta // KII-2006. Tr. 10 nacionalnih konf. vještačkim intelekt od int. dio. 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (datum pristupa: 23.08.2016).
  11. E.V. Paducheva Semantika pogleda i referentna točka // Izv. Akademija nauka SSSR: Ser. lit. i lang. 1986. T. 45. br. 5. P. 18–25.
  12. E.V. Paducheva Otpredikatska imena u leksikografskom aspektu // Znanstveno-tehnički. inf. 1991. Ser. 2. br. 5. str. 21–31.
  13. WordNet. Leksička baza podataka za engleski jezik. URL: http://wordnet.princeton.edu/ (datum pristupa: 23.08.2016).
  14. Semantički web. URL: https://ru.wikipedia.org/wiki/Semantic_network (datum pristupa: 23.08.2016).
  15. Minsky M. Teorija sistema okvira Minskyja // Zbornik radova s ​​radionice Teorijska pitanja u obradi prirodnog jezika (TINLAP) 75). 1975, str. 104-116.
  16. Khabarov S.P. Reprezentacija znanja u informacionim sistemima: bilješke sa predavanja. URL: http://www.habarov.spb.ru/bz/bz07.htm (datum pristupa: 23.08.2016).
  17. Lutsenko E.V. Zastupljenost znanja u informacionim sistemima: elektr. studija. priručnik za studente. Krasnodar: Izdavačka kuća KubGAU, 2010. 428 str.
  18. I. S. Konstantinova, O. A. Mitrofanova Ontologije kao sistemi za skladištenje znanja // Vseros. konkurentan izbor stat. po prioritetu. smjer "Informacioni i telekomunikacioni sistemi". 2008.54 str.
  19. Razin V.V., Tuzovski A.F. Reprezentacija znanja o vremenu uzimajući u obzir nesigurnost u semantičkim WEB ontologijama // Dokl. Tomsk država Univerzitet za upravljačke sisteme i radioelektroniku. 2013. br. 2 (28). S. 157-162.
  20. Patel-Schneider P. F., Horrocks I. et al. SWRL: Jezik pravila semantičkog veba koji kombinuje OWL i RuleML // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (datum pristupa: 18.08.2016).
  21. Fillmore Ch. Slučaj za slučaj. Proc. Texas Symp. o jezičkim univerzalijama, 1967, 134 str.
  22. Fillmore Ch. Slučaj slučaja // Novo u stranoj lingvistici. Moskva: Progres, 1981. P. 369–495.
  23. Dowty D. Tematske proto-uloge i odabir argumenata // Jezik, 1991, sv. 67, br. 3, str. 547-619.
  24. Norvig P., Russell S. Umjetna inteligencija: moderan pristup. M.: Williams, 2007. 1408 str.
  25. Jurafsky D., Martin J. Obrada govora i jezika: Uvod u obradu prirodnog jezika, računarsku lingvistiku i prepoznavanje govora. 2008, 1024 str.
  26. Batura T.V., Murzin F.A. Mašinski orijentisane logičke metode za prikaz semantike teksta na prirodnom jeziku: monografija. Novosibirsk: Izdavačka kuća NSTU, 2008. 248 str.
  27. Vremenska logika. URL: https://ru.wikipedia.org/wiki/Temporal_logika (datum pristupa: 23.08.2016).
  28. Vendler Z. Glagoli i vremena. The Philosophical Review, 1957, vol. 66, br. 2, str. 143-160.
  29. E.V. Paducheva Leksička aspektualnost i klasifikacija predikata prema Maslovu – Wendleru // Pitanja lingvistike. 2009. br. 6. str. 3–21.
  30. Zaključak u logičkim modelima. Metoda rezolucije. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (datum pristupa: 11.08.2016).
  31. Boral H., Redfield S. Database Machine Morphology. Proc. 11. Intern. Konf. Vrlo velike baze podataka, 1985, str. 59-71.
  32. Fushimi S., Kitsuregawa M., Tanaka H. Pregled sistema paralelne mašine za relacione baze podataka GRACE. Proc. 12th Intern. Konf. Vrlo velike baze podataka, 1986, str. 209-219.
  33. Tanaka H. Parallel Inference Engine. IOS Press Publ., 2000, 296 str.
  34. Open Cognition. URL: http://opencog.org/ (datum pristupa: 23.08.2016).
  35. Link Grammar Parser. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (datum pristupa: 20.08.2016).
  36. Parser prirodnog jezika CMU Link Grammar. URL: https://github.com/opencog/link-grammar/ (datum pristupa: 22.08.2016).
  37. RelEx Dependency Relationship Extractor. OpenCog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (datum pristupa: 22.08.2016).
  38. Sokirko A.V. Semantički rječnici u automatskoj obradi teksta (bazirani na sistemu DIALING). Diss. ... Cand. one. nauke. Moskva: MGPIIYa, 2001. 120 str.
  39. Automatska obrada teksta. URL: http: //www.aot.ruhttp: //aot.ru/ (datum pristupa: 23.08.2016).
  40. Prószéky G. Mašinsko prevođenje i hipoteza od pravila do pravila. Novi trendovi u prevoditeljskim studijama (U čast Kinge Klaudy). Budimpešta: Akadémiai Kiadó, 2005, str. 207-218.

Reč semantika dolazi iz starogrčkog jezika: σημαντικός sēmantikos, što znači „značajan“, a kao termin ju je prvi upotrebio francuski filolog i istoričar Michel Breal.

Semantika je nauka koja proučava značenje reči(leksička semantika), puno pojedinačnih slova (u drevnim alfabetima), rečenice - semantičke fraze i tekstovi. Bliska je drugim disciplinama kao što su semiologija, logika, psihologija, teorija komunikacije, stilistika, filozofija jezika, lingvistička antropologija i simbolička antropologija. Skup pojmova koji dijele zajednički semantički faktor naziva se semantičko polje.

Šta je semantika

Ova nauka proučava jezičko i filozofsko značenje jezik, programski jezici, formalna logika, semiotika i analizira tekst. Nju vezuje stav:

  • sa značenjem riječi;
  • riječi;
  • fraze;
  • znakovi;
  • simboli i šta oni znače, njihova oznaka.

Problem razumijevanja je bio predmet mnogih istraživanja u dužem vremenskom periodu, ali ovim pitanjem su se bavili uglavnom psiholozi, a ne lingvisti. Ali samo u lingvistici proučava se tumačenje znakova ili simbola koriste se u zajednicama pod određenim okolnostima i kontekstima. U ovom pogledu, zvuci, izrazi lica, govor tijela i proksemika imaju semantički (značenjski) sadržaj, i svaki uključuje nekoliko grana. U pisanom jeziku, stvari poput strukture pasusa i interpunkcije sadrže semantički sadržaj.

Formalna analiza semantike preklapa se s mnogim drugim područjima proučavanja, uključujući:

  • leksikologija;
  • sintaksa;
  • pragmatičar;
  • etimologija i drugi.

Nepotrebno je reći da je definiranje semantike također dobro definirana oblast sama po sebi, često sa sintetičkim svojstvima. U filozofiji jezika, semantika i referenca su usko povezani. Dalja srodna polja uključuju filologiju, komunikaciju i semiotiku.

Semantika je u suprotnosti sa sintaksom, proučavanjem kombinatorike jezičkih jedinica (bez osvrta na njihovo značenje) i pragmatikom, proučavanjem odnosa između simbola jezika, njihovog značenja i korisnika jezika. Područje proučavanja u ovom slučaju također ima značajne veze sa različitim reprezentativnim teorijama značenja, uključujući istinite teorije značenja, teorije koherentnosti značenja i teorije koherentnosti značenja. Svaki od njih povezan je s općim filozofskim proučavanjem stvarnosti i predstavljanjem značenja.

Lingvistika

U lingvistici je semantika potpolje posvećeno proučavanju značenja svojstvene nivoima riječi, fraza, rečenica i širih jedinica diskursa (analiza teksta ili naracije). Proučavanje semantike je također usko povezano sa predmetima prezentacije, reference i označavanja. Glavno istraživanje ovdje je usmjereno na proučavanje značenja znakova i proučavanje odnosa između različitih jezičkih jedinica i složenica kao što su:

  • homonimija;
  • sinonimija;
  • antonimija
  • metonimija;

Ključno pitanje je kako dati više značenja velikim dijelovima teksta kao rezultat sastavljanja od manjih jedinica značenja.

Montag gramatika

Kasnih 1960-ih, Richard Montague (semantika Wikipedije) je predložio sistem za definisanje semantičkih zapisa u smislu lambda računa. Montague je pokazao da se značenje teksta u cjelini može razložiti na značenja njegovih dijelova iu relativno malim pravilima kombinacije. Koncept takvih semantičkih atoma ili primitiva je fundamentalan za jezik mentalne hipoteze iz 1970. godine.

Uprkos svojoj eleganciji, Montagueova gramatika je bila ograničena varijabilnosti koja zavisi od konteksta u smislu te reči, i dovela je do nekoliko pokušaja da se uključi kontekst.

Za Montagua, jezik nije skup oznaka vezanih za stvari, već skup alata čiji su elementi važni u načinu na koji funkcioniraju, a ne u vezi sa stvarima.

Konkretan primjer ovog fenomena je semantička dvosmislenost, vrijednosti su nepotpune bez nekih kontekstualnih elemenata. Nijedna riječ nema značenje koje se može identificirati bez obzira na to šta se još nalazi u njenoj blizini.

Formalna semantika

Dolazi iz Montagueovog djela. Visoko formalizirana teorija semantike prirodnog jezika u kojoj se izrazima dodjeljuju oznake (vrijednosti) kao što su pojedinci, vrijednosti istine ili funkcije od jedne do druge. Istinitost rečenice, i što je još zanimljivije, njen logički odnos prema drugim rečenicama, tada se procjenjuje u odnosu na tekst.

Istinsko-uslovna semantika

Još jedna formalizirana teorija koju je stvorio filozof Donald Davidson. Cilj ove teorije je povezujući svaku rečenicu prirodnog jezika sa opisom uslova pod kojima je istinita, na primjer: "snijeg je bijeli" je istina ako i samo ako je snijeg bijel. Izazov je doći do pravih uslova za bilo koju rečenicu od fiksnih značenja koja se pripisuju pojedinačnim riječima i fiksnih pravila za njihovo kombinovanje.

U praksi, uslovna semantika je analogna apstraktnom modelu; konceptualno, međutim, razlikuju se po tome što istinito-uslovna semantika nastoji povezati jezik s iskazima o stvarnom svijetu (u obliku metajezičkih iskaza), a ne sa apstraktnim modelima.

Konceptualna semantika

Ova teorija je pokušaj da se objasne svojstva strukture argumenta. Pretpostavka koja leži u osnovi ove teorije je da sintaktička svojstva fraza odražavaju značenja riječi koje ih vode.

Leksička semantika

Lingvistička teorija koja istražuje značenje riječi. Ova teorija to razumije značenje riječi se u potpunosti odražava u njenom kontekstu... Ovdje je značenje riječi u njenom kontekstualnom odnosu. Odnosno, svaki dio rečenice koji ima smisla i koji se kombinira sa značenjima drugih komponenti označava se kao semantička komponenta.

Računarska semantika

Računarska semantika fokusirana je na obradu jezičkog značenja. Za to su opisani specifični algoritmi i arhitektura. U okviru ovog okvira, algoritmi i arhitekture se također analiziraju u smislu razlučivosti, vremenske/prostorne složenosti, potrebnih struktura podataka i komunikacijskih protokola.

Umjetna semantika je grupa ključnih riječi i fraza za pretraživanje za kreiranje sadržaja, tj. stvaranje semantičkog jezgra, koji može skrenuti pažnju na sadržaj ili povećati promet web resursa itd. U osnovi, umjetna semantika ili semantika teksta koristi se za kreiranje sadržaja, reklama.

Semantika online

U računarskoj nauci, termin semantika se odnosi na značenje jezičkih konstrukcija, za razliku od njihovog oblika (sintakse). To pruža pravila za tumačenje sintakse, koji ne daje značenje direktno, ali ograničava moguća tumačenja onoga što je deklarirano. U ontološkoj tehnologiji, ovaj termin se odnosi na značenje pojmova, svojstava i odnosa koji formalno predstavljaju objekte, događaje i scene stvarnog svijeta u logičkom pristupu, kao što je logika opisa koja se obično implementira na Internetu.

Značenje pojmova logike opisa i uloga određeno je njihovom modelsko-teorijskom semantikom zasnovanom na interpretacijama. Koncepti, svojstva i odnosi definirani u ontologijama mogu se primijeniti direktno u markupu web stranice, u bazama podataka grafova u obliku okidača. Semantika programskih jezika i drugih jezika je važan problem i oblast proučavanja u računarstvu. Razvijene su različite metode za formalno opisivanje programskih jezika, zasnovane na matematičkoj logici.

Semantički modeli

Online semantika se odnosi na širenje World Wide Weba kroz ugrađivanje dodatih metapodataka korištenjem tehnika semantičkog modeliranja podataka. U semantičkom webu, termini kao što su semantički web i semantički model podataka koriste se za opisivanje specifičnih tipova modela podataka koje karakterizira upotreba usmjerenih grafova, u kojima vrhovi označavaju svjetske koncepte ili entitete i njihova svojstva, a lukovi označavaju odnose između njih.

Na webu, analiza riječi, strukture veza i web dekompozicija su rijetki i daleko između i uključuju dio, tip i slične veze. U automatizovanim ontologijama, veze se računaju kao vektori bez eksplicitne vrednosti. Razvijaju se različite automatizovane tehnologije za izračunavanje značenja reči: mašine za latentno semantičko indeksiranje i vektorsku podršku, kao i obrada prirodnog jezika, neuronske mreže i metode predikatskog računa.

Psihologija

U psihologiji, semantičko pamćenje je pamćenje za značenje – drugim riječima, aspekt pamćenja koji zadržava samo suštinu, opšte značenje zapamćenog iskustva, dok je epizodno pamćenje pamćenje efemernih detalja - individualnih karakteristika ili jedinstvenih karakteristika iskustva. Termin "epizodično pamćenje" skovali su Tulwig i Schacter u kontekstu "deklarativnog pamćenja", koje je uključivalo jednostavno agregiranje činjeničnih ili objektivnih informacija o objektu.

Sjećanja se mogu prenositi generacijama ili izolovati u jednoj generaciji zbog kulturnog uništenja. Različite generacije mogu imati različita iskustva u sličnim trenucima u svojim vremenskim linijama. Ovo može stvoriti vertikalno heterogenu semantičku mrežu za određene riječi u homogenoj kulturi.

Zašto značenje zanima filozofe i psihologe i zašto se smatra kontroverznim „problemom“, nije teško razumjeti. Razmislite o naizgled nevinom pitanju: "Šta znači riječ krava" krava "? Naravno, ovo nije neka posebna životinja. Možda je onda čitava klasa životinja kojoj dajemo naziv krava "krava"? Sve krave su različite na ovaj ili onaj način; i u svakom slučaju, niko ne zna i nije mogao znati sve pripadnike klase krava, ali ipak želim da mislim da znamo značenje riječi krava, i možemo je ispravno koristiti kada se govori o određenim životinjama koje nikada nisu već viđeno... Postoji li jedno ili više svojstava po kojima se krave razlikuju od svih drugih objekata koje nazivamo drugačije? Razmišljajući na ovaj način, upadamo u filozofsku raspravu između "nominista" i "realista", koja se u ovom ili onom obliku nastavlja od Platonovog vremena do danas. Da li stvari koje nazivamo istim imenom imaju neka zajednička "esencijalna" svojstva po kojima se mogu identificirati (kako bi rekli "realisti"), ili nemaju ništa zajedničko jedno s drugim, osim imena, koje, prema preovlađujućem običaju koji smo naučili primjenjivati ​​u odnosu na njih (kako bi to rekao "nominalista")? A krava nije posebno težak slučaj. Na kraju krajeva, može se uzeti zdravo za gotovo da se krave mogu definirati u smislu biološke klasifikacije rodova i vrsta. Ali šta je sa rečju sto "stol"? Stolovi dolaze u različitim oblicima i veličinama, izrađuju se od raznih materijala i koriste se u različite svrhe. Ali stolovi su, barem fizički, vidljivi i opipljivi objekti; i za njih se može sastaviti određena lista definišnih karakteristika. A šta je sa riječima kao što su istina "istina", ljepota "ljepota", dobrota "ljubaznost, dobar kvalitet" itd.? Imaju li sve ove stvari koje opisujemo kao "lijepe" ili "dobre" neko zajedničko svojstvo? Ako je tako, kako ga identificirati i opisati? Možda bi trebalo reći da je značenje riječi kao što su istina, ljepota i dobrota „pojam” ili „ideja” povezana s njima u „umovima” izvornih govornika dotičnog jezika, ^ i općenito, to „značenje ” su “koncepti” ili “ideje”? Reći ovo znači ponovo se upuštati u filozofske i psihološke sporove, jer mnogi filozofi i psiholozi sumnjaju u mogućnost postojanja pojmova (ili čak "razuma"). Ali čak i ako te poteškoće ostavimo po strani ili odbijemo da ih razmotrimo, otkrit ćemo da postoje i druga pitanja koja se odnose na značenje i da imaju više ili manje filozofsku prirodu. Da li je smisleno reći da je neko upotrebio reč sa drugačijim značenjem od onoga što ta reč „stvarno“ znači? Postoji li uopće "pravo" ili "ispravno" značenje riječi?

9.1.4. VALUE "VALUE"

Do sada smo govorili samo o značenjima reči. Rekli smo i o rečenicama da imaju značenje. Da li se izraz "značenje" ovdje koristi u istom smislu? Inače, često kažemo da rečenice i kombinacije riječi jesu ili nisu "smislene", ali obično ne kažemo da riječi nisu "smislene". Da li je onda moguće ukazati na razliku i možda čitav niz razlika između pojmova „biti značajan“ i „imati značenje“? O ovim i mnogim drugim srodnim pitanjima više puta su raspravljali filozofi i lingvisti. Već je postalo istinito u predstavljanju semantičke teorije da se skrene pažnja na višestruka značenja "značenja".

Uz filozofska pitanja, postoje i ona koja se direktno odnose na kompetenciju lingviste. Filozofi, poput "prvog dolaza", obično uzimaju "riječi" i "rečenice" zdravo za gotovo. Lingvista to ne može. Za njega su riječi i rečenice prvenstveno jedinice gramatičkog opisa; uz njih se prepoznaju i druge gramatičke jedinice. Lingvista mora razmotriti opšte pitanje kako su gramatičke jedinice različitih vrsta povezane sa jedinicama semantičke analize. Posebno bi trebao istražiti da li treba praviti razliku između "leksičkog" i "gramatičkog" značenja.

Do sada niko nije predstavio, čak ni generalno, zadovoljavajuću i razumnu teoriju semantike. I to treba jasno prepoznati u svakoj raspravi o problemima ove discipline. Međutim, odsustvo koherentne i potpune teorije semantike ne znači da do sada nije napravljen apsolutno nikakav napredak na polju teorijskog istraživanja značenja. U nastavku će biti dat kratak pregled najvažnijih dostignuća lingvista i filozofa posljednjih godina.

Semantiku smo već okvirno definisali kao nauku o značenju; a ova definicija je jedina stvar koja zbližava svu semantiku. Jednom kada se počnemo upoznavati s određenim semantičkim radovima, suočeni smo s toliko raznolikim pristupima definiranju i utvrđivanju značenja da je neiskusnog čitatelja to zbunilo. Pravi se razlika između "emocionalnog" i "konceptualnog" značenja, između "značenja" i "značenja", između "performativnog" i "opisnog" značenja, između "značenja" i "reference", između "denotacije" i konotacije, između znakova i simbola, između ekstenzije i intenzije, između implikacije, povlastice i pretpostavke, između analitičkog i sintetičkog, itd. Terminologija semantike je bogata i potpuno zbunjujuća, budući da se upotreba termina od strane različitih autora razlikuje po odsustvu bilo kakve konzistentnosti i uniformnost. Zbog toga termini koje uvodimo u ovom poglavlju neće nužno imati isto značenje kao u drugim radovima o semantici.

Počinjemo s kratkom kritikom tradicionalnog pristupa definiranju značenja.

9.2. TRADICIONALNA SEMANTIKA

9.2.1. IME STVARI

Tradicionalna gramatika se zasnivala na pretpostavci da je reč (u smislu „leksema”; up. § 5.4.4) osnovna jedinica sintakse i semantike (up. takođe § 1.2.7 i § 7.1.2). Riječ se smatrala "znakom" u dva dijela; nazvaćemo ove dvije komponente formu riječi i njegove vrijednost... (Podsjetimo da je ovo samo jedno od značenja koje termin "oblik" ima u lingvistici; "oblik" riječi kao "znaka" ili leksičke jedinice treba razlikovati od specifičnih "usputnih" ili flektivnih "oblika" u kojima reč se pojavljuje u rečenicama; up. § 4.1.5.) Vrlo rano u istoriji tradicionalne gramatike, postavilo se pitanje o odnosu između reči i "stvari" na koje se odnose ili koje su "označavale". Drevni grčki filozofi iz vremena Sokrata, a nakon njih i Platona, formulirali su ovo pitanje terminima koji su se od tada obično koristili u raspravi. Za njih je semantički odnos između riječi i "stvari" bio odnos "imenovanja"; a onda se pojavio sledeći problem: da li „imena” koja dajemo „stvarima” imaju „prirodno” ili „uslovno” poreklo (up. § 1.2.2). Sa razvojem tradicionalne gramatike, postalo je uobičajeno praviti razliku između značenja riječi i "stvari" ili "stvari" koje su "imenovane", "nazvane" datom riječi. Srednjovjekovne gramatike formulirale su ovu razliku na sljedeći način: oblik riječi (onaj dio dictio-a koji je okarakteriziran kao vox) označava "stvari" pomoću "koncepta" povezanog s oblikom u glavama govornika datog jezika; a ovaj koncept je značenje riječi (njegovo značenje. Ovaj koncept ćemo smatrati tradicionalnim pogledom na odnos između riječi i „stvari“. Kao što je već spomenuto, ovaj pogled je, u principu, bio osnova za filozofsku definiciju „stvari“. delovi govora” u skladu sa njima „pomoću označavanja” (up. § 1.2.7) Ne ulazeći u detaljno izlaganje tradicionalne teorije „značenja”, samo napominjemo da terminologija koja se koristi u ovoj teoriji ne isključuje mogućnost dvosmislene ili nepodijeljene upotrebe termina "označiti" (označiti): moglo bi se reći da oblik riječi "označava" "koncept" pod koji su "stvari" podvedene ("apstrahiranjem" od njihovih "slučajna" svojstva); moglo bi se reći i da "označava" same "stvari". Što se tiče odnosa između "koncepta" i "stvari", on je, naravno, bio predmet znatnih filozofskih neslaganja (nesuglasice između “nominalisti” i “realisti” su posebno upečatljivi; up. § 9.1.3). možemo zanemariti ove filozofske razlike.

9.2.2. REFERENCE

Ovdje je korisno uvesti moderan termin za označavanje "stvari" koje se razmatraju sa stanovišta "imenovanja", "imenovanja" ih riječima. Ovo je termin referent... Reći ćemo da je odnos koji se odvija između riječi i stvari (njihovih referenta) odnos reference (korelacije): riječi korelirati sa stvarima (a ne "imenovati" ili "imenovati" ih). Ako prihvatimo razliku između oblika, značenja i referenta, onda možemo dati dobro poznatu šematski prikaz tradicionalnog pogleda na odnos između njih u obliku trokuta (ponekad nazvanog "semiotički trokut"), prikazanog na Sl. . 23. Isprekidana linija između forme i referenta označava da je odnos između njih indirektan; oblik je povezan sa svojim referentom kroz posredničko (pojmovno) značenje, koje se vezuje za svaki od njih nezavisno. Dijagram jasno ilustrira važnu stvar da je, u tradicionalnoj gramatici, riječ rezultat kombinovanja određenog oblika sa određenim značenjem.

Već smo spomenuli filozofske i psihološke rasprave o statusu "koncepta" i "ideja" u "um" (up. §9.1.3). Tradicionalna semantika uzdiže postojanje "koncepta" na princip svih teorijskih konstrukcija i stoga (gotovo neizbježno) potiče subjektivnost i introspekciju u proučavanju značenja. Kao što Haas piše, "empirijska nauka ne može se u potpunosti osloniti na istraživačku metodologiju koja se svodi na činjenicu da ljudi vrše zapažanja u svojim umovima, svaki u svom vlastitom umu." Ova kritika pretpostavlja prihvatanje gledišta da je semantika, ili bi trebala biti, empirijska znanost, a ovo gledište ne bi trebalo, koliko je to moguće, biti vezano za tako kontroverzna filozofska i psihološka pitanja kao što je razlika između "tijela" i "duha". " ili status " koncepti ". Mi ćemo se pridržavati ove tačke gledišta kada razmatramo semantiku u ovim poglavljima. Treba, međutim, naglasiti da metodološko odbacivanje "mentalizma" ne znači i prihvatanje "mehanizma", kako smatraju neki lingvisti. Bloomfieldova "mehanistička" i "pozitivistička" definicija značenja riječi kao potpunog "naučnog" opisa njenog referenta više je štetna za napredak u semantici nego tradicionalna definicija u smislu "koncepta", budući da se Bloomfieldova definicija fokusira na relativno mali skup riječi u vokabularu prirodnih jezika, riječi koje se odnose na "stvari", koje se, u principu, mogu opisati pomoću fizičkih nauka. Štaviše, počiva na dvije implicitne i nepotkrijepljene pretpostavke: (i) da je "znanstveni" opis referenata ovih riječi povezan s načinom na koji govornici datog jezika koriste riječi (većina govornika nema dovoljno pojma o „naučni” opis); (ii) da se značenje svih riječi u konačnici može opisati istim terminima. Istina, može se smatrati da Bloomfieldov pristup (koji se nalazi i kod drugih autora) zavisi od "realističkog" pogleda na odnos između jezika i "svijeta", gledišta koje se bitno ne razlikuje od stanovišta mnogih "konceptualista". "; to barem implicira pretpostavku da pošto postoji, na primjer, riječ inteligencija "um, intelekt, mentalne sposobnosti", onda postoji i nešto na što se ona odnosi (a to "nešto" će, kako se pretpostavlja, na kraju biti opisan kao zadovoljavajući način pomoću "nauke"); pošto postoji reč ljubav "voliti, voleti", onda postoji i nešto na šta se ova reč odnosi itd. e. Stav kojeg se lingvista mora pridržavati je pozicija koja je neutralna u odnosu na "mentalizam" i "mehanizam"; to je stav koji je u skladu sa, ali ne implicira ni jedno gledište.

9.2.7. "OSTENZIVNA" DEFINICIJA

Prethodni odjeljak implicitno sadrži još jednu kritiku tradicionalne semantike (kao i nekih modernih teorija). Već smo vidjeli da termin "značenje" u svojoj uobičajenoj upotrebi sam po sebi ima mnoga "značenja". Kada nekome postavimo pitanje – „Šta je značenje te riječi X?" - u svakodnevnom (nefilozofskom i ne usko specijalizovanom) razgovoru dobijamo (i to nas nimalo ne iznenađuje) odgovore, različite forme, u zavisnosti od okolnosti i situacije u kojoj postavljamo ovo pitanje. Ako nas zanima značenje riječi na jeziku koji nije naš, onda je odgovor na naše pitanje najčešće prijevod. ("Prevod" postavlja razne probleme od semantičkog interesa, ali za sada ih nećemo dirati; up. § 9.4.7.) Za nas je sada više indikativno za situaciju u kojoj pitamo o značenjima riječi na našem jeziku (ili drugom jeziku, koji "znamo", barem "djelimično" - općenito, koncept "potpunog znanja jezika" je, naravno, fikcija). Pretpostavimo da želimo znati značenje riječi krava "krava" u malo vjerovatnoj (ali prikladnoj za naše svrhe) situaciji, kada postoji nekoliko krava na susjednoj livadi. Moglo bi nam se reći: „Vidiš li one životinje tamo? Ovo su krave." Ovaj način prenošenja značenja krave "krava" uključuje element onoga što filozofi nazivaju ostenzivna definicija... (Ostenzivna (vizuelna) definicija je takva definicija kada je direktno "usmjerena" na odgovarajući objekt.) Ali ostenzivna definicija sama po sebi nikada nije dovoljna, budući da osoba koja tumači ovu "definiciju" prije svega mora znati značenje gest „pokazivanja“ u ovom kontekstu (i takođe da zna da je govornikova namera upravo da da „definiciju“) i, što je još važnije, on mora ispravno identifikovati objekat na koji je „ukazano“. U slučaju našeg hipotetičkog primjera, riječi te životinje "te životinje" ograničavaju mogućnost nesporazuma. (Oni ga ne eliminišu u potpunosti; ali ćemo pretpostaviti da je "definicija" riječi krava "krava" na zadovoljavajući način protumačena.) Teorijske implikacije ovog previše pojednostavljenog i prilično nerealnog primjera su dvostruke: prvo, on pokazuje poteškoću objašnjavajući značenje bilo koje riječi bez upotrebe drugih riječi kako bi ograničio i učinio eksplicitnijim "područje" "indikacije" (on potvrđuje ideju da je vjerovatno nemoguće ustanoviti, a možda čak i znati, značenje jedne riječi, ne znajući ni značenje drugih riječi, s kojima je „srodan“; na primjer, krava „krava“ je povezana sa životinjskom „životinjom“); drugo, ostenzivna definicija se odnosi samo na relativno mali skup riječi. Zamislite, na primjer, uzaludnost pokušaja da se na ovaj način objasni značenje riječi istinito "tačno, istinito", lijepo "lijepo, lijepo, veličanstveno" itd.! Značenje takvih riječi u pravilu se objašnjava, međutim, ne uvijek uspješno, uz pomoć sinonima (pretpostavlja se da su značenja već poznata osobi koja postavlja pitanje) ili uz pomoć prilično dugih definicija tipa koji se obično daju u rječnicima. I opet, tu se jasno očituje neizbježna kružnost semantike: u rječniku ne postoji nijedna tačka koja se može uzeti kao polazište i iz koje se može izvesti značenje svega ostalog. Ovaj problem "kružnosti" će biti razmotren u nastavku (up. § 9.4.7).

9.2.8. KONTEKST

Još jedna karakteristika svakodnevnih situacija u kojima se nalazimo kada pitamo o značenju riječi je da nam se često kaže: "Zavisi od konteksta". („Daj mi kontekst u kojem si naišao na ovu riječ i ja ću ti objasniti njeno značenje.”) Često je nemoguće odrediti značenje riječi bez „stavljanja u kontekst”; a korisnost rječnika je u direktnoj proporciji sa brojem i raznolikošću "konteksta" koje pružaju riječima. Često (a to je možda i najčešći slučaj), značenje riječi se objašnjava na sljedeći način: daje se "sinonim" koji ukazuje na "kontekstualna" ograničenja koja regulišu upotrebu riječi o kojoj je riječ (dodano: "razmažen (oko jaja)"; užeglo: "pokvareno (o puteru)" itd.). Činjenice kao što su raznovrsnost načina na koje utvrđujemo značenje riječi u praksi, "kružnost" vokabulara i suštinska uloga "konteksta" ne dobijaju puno teorijsko priznanje u tradicionalnoj semantici.

9.2.9. "VRIJEDNOST" I "UPOTREBA"

Ovdje možemo spomenuti poznatu i vrlo popularnu Vitgenštajnovu parolu: "Ne tražite značenje riječi, tražite njenu upotrebu." Termin "upotreba" sam po sebi nije ni na koji način jasniji od pojma "značenje"; ali zamjenom jednog termina drugim, semantika napušta tradicionalnu tendenciju da se "značenje" definira u terminima "značenja". Primjeri samog Vitgenštajna (u njegovom kasnijem radu) pokazuju da je on vjerovao da su "upotrebe" u kojima se riječi pojavljuju u jeziku najrazličitije prirode. On nije izneo (i nije deklarisao svoju nameru da iznese) teoriju „upotrebe“ reči kao teoriju semantike. Ali vjerovatno imamo pravo izvući sljedeće principe iz Vitgenštajnove programske izjave. Jedini testni kriterijum primenljiv na proučavanje jezika je „upotreba“ jezičkih iskaza u različitim situacijama. Svakodnevni život... Izrazi kao što su "značenje riječi" i "značenje rečenice (ili presude)" prepuni su opasnosti od zablude povezane s činjenicom da nas naginju da tražimo "značenja" koja imaju i da identifikujemo njihova "značenja" sa entitetima kao što su fizički objekti, "koncepti" dati "umovima" ili "stanjima stvari" u fizičkom svijetu.

Ne raspolažemo direktnim dokazima o razumijevanju izjava, već imamo podatke o njima nesporazumi(nerazumijevanje) - kada se nešto "poremeti" u procesu komunikacije. Ako, na primjer, nekome kažemo donesi mi crvenu knjigu koja je na stolu gore "donesi mi crvenu knjigu koja je na stolu gore", a on nam donese knjigu druge boje, ili kutiju umjesto knjigu, ili se spusti na potragu za knjigom, ili uradi nešto sasvim neočekivano, onda s razlogom možemo reći da je "pogrešno shvatio" celu ili deo naše izjave (moguća su i druga objašnjenja, naravno). Ako uradi ono što se od njega očekuje (ode na u pravom smjeru i vraća se sa željenom knjigom), onda možemo reći da je ispravno shvatio izjavu. Želimo da naglasimo da (u ovakvom slučaju) postoje prima facie činjenice „bihejvioralne“ prirode koje ukazuju da nije došlo do nesporazuma. Moguće je da ako bismo nastavili da vrlo uporno testiramo njegovo "razumijevanje" riječi donijeti "donesi", ili crveno "crveno", ili knjiga "knjiga", onda bi došao trenutak kada bi nešto što je uradio ili rekao otkrilo da njegovo "razumijevanje" ovih riječi je donekle drugačije od našeg, onoga što on donosi iz izjava koje sadrže te riječi, zaključaka koje mi ne donosimo (ili, obrnuto, da donosimo zaključke koje on ne izvodi), ili da ih koristi da označavanje malo drugačije klase objekata ili radnji. Normalna komunikacija zasniva se na pretpostavci da svi „razumijemo“ riječi na isti način; ova pretpostavka se s vremena na vrijeme prekrši, ali ako se to ne dogodi, činjenica "razumijevanja" se uzima zdravo za gotovo. Da li imamo iste “koncepte” u našim “umovima” kada razgovaramo jedni s drugima je pitanje na koje se ne može odgovoriti drugačije osim u smislu “upotrebe” riječi u izjavama. Tvrdnja da svi istu riječ "razumijeju" na malo različite načine je vjerovatno poštena, ali prilično besmislena. Semantika se bavi objašnjavanjem stepena uniformnosti u "upotrebi" jezika koji omogućava normalnu komunikaciju. Jednom kada napustimo gledište da je "značenje" riječi ono što ona "označava", sasvim prirodno prepoznajemo da se moraju uspostaviti određeni odnosi različitih vrsta kako bi se objasnila "upotreba". Dva "faktora" koje treba razlikovati su referenca(o čemu smo već govorili gore) i značenje(smisao).

9.2.10. NEUTVRĐIVANJE VRIJEDNOSTI

Dakle, predlažemo da se napusti stav da je „značenje“ reči ono što ona „znači“, a u procesu komunikacije ovo „označeno“ se „prenosi“ (u izvesnom smislu) govorniku koji sluša; već smo spremni da se složimo da determinizam (izvesnost) značenja reči uopšte nije neophodan ili poželjan. Kao što smo vidjeli, upotreba jezika u normalnim situacijama može se objasniti na osnovu mnogo slabije pretpostavke, koja je dovoljna da eliminira "nesporazum". Ovaj zaključak se mora imati na umu u svakoj analizi "značenja" riječi i rečenica. Uzećemo to zdravo za gotovo u narednim odeljcima ova dva poglavlja o semantici.

Postoje još dvije stvari koje treba istaknuti u vezi sa društveno propisanim izjavama kao što je Kako ste? "Zdravo!". Obično imaju karakter "gotovih" formacija, odnosno uče ih izvorni govornici kao neanalizirane čitave jedinice i, očito, ne konstruišu se iznova u svakom slučaju kada se koriste u okolnostima koje, slijedeći Fursea, možemo nazivaju „tipični događaji koji se ponavljaju u lancu društvenog procesa“. Budući da su takve prirode, mogli bismo ih objasniti u okviru koncepta „biheviorističkog“: dotične izjave bi se mogle opisati kao „uslovljene reakcije“ na situacije u kojima se javljaju. Ovu činjenicu ne treba zanemariti naučnik semantike. Značajan dio naše svakodnevne upotrebe jezika sasvim je adekvatno opisan „bihejviorističkim“ terminima i može biti povezan s činjenicom da „igramo“ određene „uloge“ u implementaciji društveno propisanih, „ritualnih“ obrazaca ponašanja. Kada se posmatra u smislu ovog aspekta upotrebe jezika, ljudske individue pokazuju ponašanje slično onom mnogih životinja, u kojima se "komunikacijski sistemi" sastoje od mnogih "gotovih izjava" koje se koriste u određene situacije... Tipičniji ljudski aspekti jezičkog ponašanja, koji zavise od generativnih svojstava jezika, kao i od semantičkih koncepata posjedovanja značenja, reference i značenja, ne mogu se vjerodostojno objasniti na osnovu ekstenzije "biheviorista" koncepte "stimulusa" i "odgovora" na njih. Istina je, međutim, da ljudski jezik uključuje i "bihevioralnu" komponentu. Iako o tome više nećemo govoriti u nastavku, u teoriji tu istinu ovdje moramo priznati.

9.3.7. PHATIC COMUNION

S tim u vezi, potrebno je spomenuti i aspekt jezičkog ponašanja na koji je B. Malinovsky upotrijebio termin "fatička komunikacija". Skrenuo je pažnju na činjenicu da se mnoge naše izjave pogrešno pripisuju kao njihova jedina ili glavna funkcija prenošenja ili traženja informacija, davanja naređenja, izražavanja nade, potreba i želja, ili čak „pokazivanje emocija“ (u nejasnom smislu u kojem stručnjaci za semantiku, ovaj posljednji izraz se često koristi); zapravo, služe uspostavljanju i održavanju osjećaja društvene solidarnosti i društvenog samoodržanja. Mnoge "gotove" izjave poput Kako ste? "Halo!", društveno propisano u određenim kontekstima, može ispuniti upravo tu funkciju "fatalne komunikacije". Međutim, postoje mnogi drugi iskazi koje govornici više-manje slobodno konstruiraju, ali u isto vrijeme prenose informacije i služe u svrhu "fatičke komunikacije". Primjer bi bio izraz "Još je jedan lijep dan" Opet je lijep dan ", izgovorena (navodno) kao prva fraza u razgovoru između kupca i trgovca. informacija o vremenu; ovo je jasan primjer " fatička” komunikacija. ”Istovremeno, ova izjava i dalje ima drugačije značenje od značenja bezbroj drugih izjava koje bi se mogle pojaviti u ovom kontekstu i koje bi također mogle poslužiti u svrhu “fatičke” komunikacije”; i sljedeći “korak” u razgovoru se obično povezuje sa datim konkretnim iskazom na osnovu njegovog značenja. Stoga moramo razlikovati onaj aspekt "upotrebe "izreka koji se mogu pripisati implementaciji "fatičke komunikacije" i onog dijela koji treba izdvojiti kao njihovo značenje (ako imaju značenje sa stanovišta naše definicije). Ali u isto vrijeme prepoznajemo da čak i kada izjave Budući da su oba ova aspekta inherentna, dominantan dio "upotrebe" iskaza može biti ili prvi ili drugi aspekt. Malinovsky je očito pretjerao kada je tvrdio da je prijenos informacija jedna od "najperifernijih i visokospecijaliziranih funkcija" jezika.

9.3.8. PROŠIRENJE KONCEPTA "POSEDAVANJE ZNAČENJA" NA SVE JEZIČKE JEDINICE

Do sada smo ilustrovali koncept da ima značenje samo u odnosu na čitave iskaze, koji se smatraju nerazložljivim jedinicama. Sada ćemo nastaviti da razmatramo izjave, a ne rečenice, i nastavićemo da se pozivamo na intuitivni pojam "konteksta"; ali sada ćemo generalizirati koncept postojanja značenja u smislu sljedećeg principa: svaki jezički element koji se pojavljuje u iskazu ima značenje, osim ako nije potpuno unaprijed određen („obavezan“) u datom kontekstu.

Očigledno, koncept posedovanja značenja (kako je ovde definisan) je primenljiv na svim nivoima analize iskaza, uključujući i fonološki nivo. Na primjer, postoji mnogo konteksta u kojima se riječi jagnje "jagnje" i ovan "ovan" mogu koristiti jednako dobro, a odgovarajuće izjave mogu se razlikovati samo u ovim riječima. Budući da su ovi iskazi, očigledno, različiti po značenju (referenti riječi janje i ovan su različiti i, općenito govoreći, implikacije "sadržane" u odgovarajućim izjavama su različite), fonemi / l / i / r / ne imaju samo značenje, ali imaju drugačije značenje u ovim izrekama. Postoje i drugi iskazi koji sadrže riječi osim jagnje i ovan, u kojima se razlika u značenju može izraziti isključivo fonološkom opozicijom / l / - / r /. Kao što smo videli u jednom od prethodnih poglavlja (uporedi § 3.1.3), fonološka struktura određenih jezika počiva, u krajnjoj liniji, na sposobnosti diferencijacije fonema (tačnije, na sposobnosti razlikovanja njihovih "odlikovnih karakteristika" ), ograničen određenim okvirom nametnuo je dodatni princip fonetske sličnosti. Dakle, postoje dobri razlozi za korištenje koncepta smisla čak i na nivou fonološke analize. Vrijedi napomenuti, međutim, da u slučaju fonetski različitih, ali „sličnih“ glasova, postojanje značenja nužno podrazumijeva drugačije značenje, barem u nekim kontekstima. To nije slučaj na "višim" nivoima. Kada je riječ o jezicima u kojima se javljaju glasovi [l] i [r], ali nikada ne razlikuju iskaze, kažemo da su u tim jezicima naznačeni glasovi u odnosu na dodatnu distribuciju ili slobodnu varijaciju (drugim riječima , da su alternativne fonetske realizacije iste fonološke jedinice; up. § 3.3.4). U kontekstima u kojima glasovi govora, koji se inače razlikuju kao zasebne fonološke jedinice, imaju isto značenje, razumno se mogu okarakterizirati kao sinonimi. Primjeri su početni samoglasnici u alternativnom izgovoru riječi ekonomija (suprotan je diferencijalni kvalitet istih samoglasnika u taktu / bi: t /: opklada / opklada / itd.) ili kontroverza: kontroverzni obrasci stresa.

Iako bi semantičar teorijski trebao prepoznati princip primjenjivosti posjedovanja značenja na fonološki nivo, on se u svom praktičnom radu obično ne bavi značenjem fonoloških jedinica. Razlog je u tome što fonološke jedinice nikada nemaju subjekatsku korelaciju i ne ulaze ni u kakve semantičke odnose, osim u relacije istog i razlike značenja. Štaviše, odnos istog značenja kada se javlja između fonoloških jedinica (fonološka "sinonimija" kao što je gore ilustrovano) je sporadičan i nesistemski. Mora se opisati u smislu alternativnih pravila implementacije za određene riječi; kada se ova pravila prime, ništa drugo nije potrebno. Uopšteno govoreći (slučaj "zvučnog simbolizma" - semantički zanimljiv fenomen koji ovdje nećemo razmatrati zbog ograničenih mogućnosti; up. § 1.2.2), "značenje" date fonološke jedinice je jednostavno njeno razlikovanje od svih ostalih fonološke jedinice (ako ih ima) koje se mogu pojaviti u istom kontekstu.

9.3.9. OGRANIČENI KONTEKSTI

Sada se možemo obratiti na razliku između iskaza i rečenica (up. § 5.1.2). Dvije su stvari koje treba imati na umu. Prvo. Kada koristimo jezik da komuniciramo jedni s drugima, ne pravimo rečenice, već izjave; takve izjave su date u određenim kontekstima i ne mogu se razumjeti (čak i unutar granica postavljenih iznad za tumačenje pojma "razumijevanje"; up. § 9.2.9) bez poznavanja relevantnih kontekstualnih karakteristika. Štaviše, u toku razgovora (pretpostavimo da je reč o razgovoru), kontekst se stalno razvija, u smislu da „upija“ iz rečenog i dešavanja sve što je relevantno za produkciju i razumijevanje narednih izjava. Ekstremni slučaj konteksta koji nisu “razvijeni” u ovom smislu bili bi oni u kojima se učesnici u razgovoru ne oslanjaju na prethodno znanje jedni o drugima ili na “informacije” sadržane u prethodno izrečenim izjavama, već u kojima koriste opštije mišljenja, običaje i pretpostavke koje prevladavaju u ovoj posebnoj "sferi rasuđivanja" iu datom društvu. Takvi konteksti - mi ćemo ih nazvati ograničeni konteksti(ograničeni konteksti) su relativno rijetki, jer razumijevanje većine izjava zavisi od informacija sadržanih u prethodnim izjavama. Ne smijemo izgubiti iz vida odnos između iskaza i specifičnih konteksta.

Druga stvar je sljedeća: budući da rečenice nikada ne proizvode govornici (na kraju krajeva, rečenice su teorijske jedinice koje su uspostavili lingvisti kako bi opisali distributivna ograničenja na pojavu klasa gramatičkih elemenata), ne može postojati direktan odnos između rečenica i specifičnih kontekstima. U isto vrijeme, iskazi imaju gramatičku strukturu koja ovisi o njihovoj „derivaciji“ iz rečenica, a gramatička struktura iskaza je ili može biti semantički relevantna. Ovo je posebno evidentno u slučaju sintaksičke "dvosmislenosti" (up. § 6.1.3). Štaviše (sa izuzetkom takvih "gotovih" izraza kao što je Kako radiš? "Zdravo!"), izgovore izvode govornici, a slušaoci ih razumiju na osnovu pravilnosti u konstrukciji i transformacijama koje postavlja za rečenice gramatička pravila. U današnje vrijeme, ni lingvistika ni bilo koja druga nauka koja proučava "mehanizme" koji se nalaze u osnovi proizvodnje iskaza ne mogu dati bilo kakve definitivne izjave o tome kako tačno znanje o apstraktnim odnosima koji se odvijaju između gramatičkih elemenata u rečenicama stupaju u interakciju sa različita svojstva konteksta, što rezultira formiranjem i razumijevanjem iskaza u kojima se nalaze "korelati" ovih gramatičkih elemenata. Sama činjenica da postoji određena interakcija između gramatičke strukture jezika i relevantnih kontekstualnih karakteristika čini se nepobitnom, i tu činjenicu moramo uzeti u obzir.

Budući da u opštem slučaju ne možemo identifikovati ni one stvarne elemente koje govornik „odabire” u procesu formiranja iskaza, ni sve relevantne karakteristike konkretnih konteksta, možemo kao metodološku odluku uzeti princip da su lingvisti obično vođeni u praksi, odnosno sagledavanjem semantičkih odnosa između iskaza u smislu semantičkih odnosa koji se odvijaju između rečenica, na osnovu kojih se često „stvaraju“ iskazi kada ih proizvedu izvorni govornici u ograničenim kontekstima. (Pojam "ograničenog konteksta" ipak se mora zadržati, jer, kao što ćemo vidjeti u nastavku, nemoguće je formulirati semantičke odnose koji se odvijaju između rečenica bez razmatranja, barem u maloj mjeri, "kontekstualizacije"; up. § 10.1.2.) Tada će se koristiti svojstva specifičnih konteksta (u obliku koji se, barem za sada, može okarakterisati kao ad hoc opisi) da se objasne "rezidualni" semantički relevantni aspekti iskaza. Ono što smo ovdje predstavili kao svjesnu, metodološku odluku ne treba, međutim, doživljavati kao da želimo naglasiti primat gramatičkog nad kontekstualnim u psihološkim procesima proizvodnje i razumijevanja iskaza.

9.3.10. U PRIJEDLOZIMA BITNI ELEMENTI DUBINSKE STRUKTURE

Sada možemo primijeniti koncept "imanja značenja" na gramatičke elemente iz kojih se generiraju rečenice pomoću pravila koja regulišu konstrukciju i transformaciju njihovih osnova (up. § 6.6.1). Pošto posjedovanje značenja podrazumijeva "izbor", onda, dakle, nikakvi elementi koji se unose u rečenice putem obaveznih pravila ne mogu imati značenje u našem smislu. ("Dummy" elementi kao što je učiniti (pomoćni glagol) u Da li želite da idete? "Želite li da idete?" nemaju značenje; uporedi § 7.6.3.) Štaviše, ako pretpostavimo da su svi "izbori" izvršeno u vezi sa odabirom elemenata u "dubokoj" strukturi (ovi elementi su ili" kategorije "ili" znakovi "; up. § 7.6.9), tada će postati jasno da koncept posedovanja značenja nije vezano za jedinice bilo kojeg određenog ranga. Prvo, razlika u jeziku jedinica kao što su morfeme, riječi i grupe riječi (fraze) je donekle zasnovana na "površinskoj" strukturi (§ 6.6.1); i, drugo, postoje mnoge "gramatičke kategorije" (vreme, raspoloženje, vrsta, rod, broj, itd.; uporedi § 7.1.5), koje se mogu ili ne moraju realizovati u morfemama ili rečima, ali koje čine sistem "izbora" u rečenicama. Pitanje da li je moguće povući striktnu razliku između "leksičkog" i "gramatičkog" značenja, uzimajući u obzir tačno značenje elemenata, biće razmotreno u nastavku (up. § 9.5.2). Ovdje je dovoljno napomenuti da se koncept posedovanja značenja podjednako primenjuje na obe vrste elemenata u „dubokoj“ strukturi rečenica. Štaviše, ovaj koncept se, eksplicitno ili implicitno, uzima u obzir u svim najnovijim lingvističkim teorijama. Klase elemenata (označene ili pomoćnim ili terminalnim simbolima - up. § 6.2.2) se uspostavljaju na svakoj tački "izbora" u procesu generisanja rečenica.

Iz rečenog proizilazi da nijedan element u rečenici nema značenje ako nije član jedne od sintaksički definiranih klasa u „dubokoj“ strukturi rečenice: i upravo ta činjenica opravdava pretpostavku, gotovo lingvisti, logičari i filozofi univerzalno smatraju da su mnogi elementi, koji imaju značenje u određenom jeziku, u najmanju ruku u vrlo visokoj mjeri, srazmjerni skupovima terminalnih "komponenti" i "karakteristike" ovog jezika. Međutim, iz ovoga ne proizlazi da će svaki "konstituent" i svaka "osobina" imati značenje u svakoj rečenici u kojoj se pojavljuju. Ovu važnu tačku lingvisti ponekad zanemaruju i stoga zaslužuje nešto detaljnije razmatranje.

Čitav problem se svodi na razliku između gramatičke i semantičke prihvatljivosti. Kao što smo videli u jednom od prethodnih poglavlja (up. § 4.2.12 i dalje), gramatičnost je onaj aspekt prihvatljivosti iskaza koji se može objasniti u smislu pravila konstrukcije i transformacije koja određuju dozvoljene kombinacije distributivnih klasa elemenata ("kategorije" i "znakovi") u rečenicama. Općenito se vjeruje da gramatika bilo kojeg jezika stvara, posebno, beskonačan broj rečenica koje su neprihvatljive u različitim aspektima; i postalo je tradicionalno opisivati ​​barem jednu vrstu neprikladnosti karakterizirajući dotične rečenice kao "besmislene" ili "besmislene". Neka sljedeće rečenice budu generirane gramatikom engleskog jezika (i stoga su gramatički tačne):

(a) Jovan pije mlijeko (pivo, vino, vodu, itd.) "Jovan pije mlijeko (pivo, vino, vodu, itd.)"

(b) Jovan jede sir (ribu, meso, hleb, itd.) "Jovan jede sir (ribu, meso, hleb, itd.)"

(c) Jovan pije sir (ribu, meso, hleb, itd.) "Jovan pije sir (ribu, meso, hleb, itd.)"

(d) Jovan jede mleko (pivo, vino, vodu, itd.) "Jovan jede mleko (pivo, vino, vodu, itd.)"

Pretpostavimo dalje da su sve ove rečenice, kada su generisane, snabdevene istim strukturnim opisom: da glagoli piti "piti" i jesti "jesti, jesti", kao i imenice mleko "mleko", pivo " pivo", vino "vino", voda "voda", sir "sir", riba "riba", meso "meso", hleb "hleb" itd. ne razlikuju se u leksikonu ni po jednom relevantnom sintaksičkom karakteru. Očigledno, uz određeno razumijevanje pojmova "prihvatljivo" i "neprihvatljivo", izjave izvedene iz rečenica grupisanih u klase (a) i (b) su prihvatljive, dok su izjave izvedene iz rečenica uključenih u grupe (c) i (d) prihvatljive. neprihvatljivo (pod „prirodnim“ okolnostima). Da li ovu vrstu prihvatljivosti i neprihvatljivosti treba opisivati, oslanjajući se na kriterijum „supstantivnosti“ (u smislu ovog pojma, koji predlažemo da istaknemo terminom „značajnost“) – ovo ćemo pitanje razmotriti nešto u nastavku. . Ovdje želimo naglasiti da su skupovi elemenata koji se mogu pojaviti i koji imaju značenje glagola i objekta u ovim rečenicama vrlo ograničeni podskupovi tih skupova elemenata, čiji je izgled dozvoljen pravilima gramatike. Opet, ovdje je ekstremni slučaj kada je izgled elementa u potpunosti određen kontekstom ostalih elemenata u rečenici. Primjer potpune predodređenosti na ovom nivou je pojava riječi zubi "zubi" u Ugrizao sam ga svojim umjetnim zubima "Ugrizao sam ga svojim umjetnim zubima". Kao što ćemo vidjeti u nastavku (up. § 9.5.3), ova rečenica otkriva semantički zanimljiv tip sintagmatske "pretpostavke", koja je obično latentna, ali koja se može eksplicitno prikazati kada se njen "sintaktički odraz" pojavi u rečenici. » U obliku "definicije" (u ovom primjeru - lažni" dodatak "). Da se riječ teeth "zubi" nikada nije pojavljivala u rečenicama osim u onima u kojima je u potpunosti određena svojim kontekstom, onda ne bi imala značenje u engleskom jeziku, a stručnjak za semantiku ne bi imao ništa o tome da kaže.

Svrha našeg rasuđivanja bila je da pokažemo kako se tačno pojam posjedovanja značenja može i treba prenijeti sa nivoa prilično „specifičnih“ slučajeva kada se radi, s jedne strane, o gramatički ispravnim, nestrukturiranim cijelim iskazima, a s druge strane. sa strane, iskaze, koji se minimalno razlikuju po svojoj fonološkoj strukturi, na "apstraktniji" nivo, na kojem se primjenjuje na važniju i mnogo širu klasu rečenica generiranih pravilima gramatike. Koncept postojanja značenja podržan je činjenicom da odražava intuitivno jasan princip da „značenje implicira izbor“ u specifičnim kontekstima. Njegov prelazak na „apstraktniji“ nivo zasniva se na metodološkom rješenju, čija motivacija ima dva aspekta: prvo, ova odluka prepoznaje činjenicu da se specifične kontekstualne karakteristike koje utiču na proizvodnju i interpretaciju iskaza mogu opisati samo ad hoc; i drugo, ovaj pristup na zadovoljavajući način povezuje semantičku interpretaciju rečenica sa njihovim sintaksičkim opisom. Ako se ustanovi da određeni element ima značenje unutar određene klase rečenica, onda možemo postaviti pitanje kakvo značenje ima taj element; a na ovo pitanje se može odgovoriti na različite načine, kao što ćemo vidjeti u sljedećem odjeljku.

9.3.11. "ZNAČAJ"

Sada se moramo ukratko zadržati na konceptu "značaja" (up. § 9.3.1). Na prvi pogled, potpuno je opravdano željeti izjednačiti značaj sa punom prihvatljivošću u odnosu na specifične kontekste u slučaju iskaza i relativno generaliziranije ograničene kontekste u slučaju rečenica. Ali već smo vidjeli da postoji mnogo slojeva prihvatljivosti (lociranih "iznad" gramatičkog sloja), koji se, iako se često bez kvalifikacije opisuju kao "semantički", mogu, međutim, razlikovati od onoga što se tradicionalno naziva "sadržaj" ili " značaj.” (Uporedi § 4.2.3). Neke izjave mogu biti osuđene kao "blasfemične" ili "nepristojne"; drugi se mogu smatrati prihvatljivim u određenim upotrebama jezika (molitve, mitovi, bajke, naučna fantastika, itd.), ali neprihvatljivi u svakodnevnom razgovoru. Teško je preporučljivo pokušati definirati "značaj" na način koji bi pokrio sve te različite "dimenzije" prihvatljivosti. Uzmimo primjer iz engleskog: iako se glagol die "umrijeti" slobodno koristi u sprezi sa živim imenicama, uključujući imena osoba, postoji općeprihvaćeni tabu na engleskom koji zabranjuje njegovu upotrebu u sprezi sa mojim ocem "moj otac “, moja majka “moja majka”, moj brat “moj brat” i moja sestra “moja sestra” (odnosno u odnosu na članove uže porodice govornika); stoga, moj otac je sinoć umro "Moj otac je umro sinoć" neće se smatrati prihvatljivim, ali ne i Njegov otac je umro sinoć "Njegov otac je umro sinoć." Onda bi, očigledno, ispravno objašnjenje neprihvatljivosti rečenice Moj otac je umro sinoć trebalo da bude takvo da možemo reći, prvo, da je "značajna", jer će, upotrebljena suprotno tabuu, biti shvaćena (zapravo , moglo bi se tvrditi da sam tabu zavisi od mogućnosti razumijevanja ove rečenice), i, drugo, da je semantički odnos između Moj otac je sinoć umro i Njegov otac je umro sinoć identičan odnosu između Moj otac je sinoć "Moj otac je sinoć došao" i njegov otac sinoć je došao "Njegov otac je došao sinoć" itd. Tradicionalno, važnost gramatički ispravnih rečenica objašnjava se u smislu određenih opštih principa kompatibilnosti "značenja" njihovih sastavnih elemenata . Moglo bi se, na primjer, reći da su rečenice John jede mlijeko "Jovan jede mlijeko" i John drinks bread "Jovan pije hljeb" besmislene, jer je glagol jesti "jesti, jesti" kompatibilan samo s imenicama (kao objekt ) koji označava čvrste jestive tvari, a glagol piti "piti" uz imenice koje označavaju jestive tekuće tvari. (Imajte na umu da se, sa ove tačke gledišta, rečenica Džon jede supu „John jede supu“ može smatrati semantički anomalnom, jer poseduje „društvenu prihvatljivost“ samo zbog posebne konvencije van generalizovanih pravila za tumačenje engleskih rečenica.) poteškoća ( mogli bismo tvrditi, na primjer, da je John jede mlijeko „smislena“ rečenica, iako su okolnosti pod kojima bi se moglo koristiti pomalo neobične). Ipak, čini se da je tradicionalna eksplikacija ovog koncepta u smislu "kompatibilnosti" uglavnom razumna. Razmotrićemo neke od najnovijih formulacija ovog koncepta u sledećem poglavlju (up. § 10.5.4).

9.4.1. REFERENCE

Termin "referenca" ("korelacija") uveden je ranije za odnos koji se odvija između riječi, s jedne strane, i stvari, događaja, radnji i kvaliteta koje one "zamjenjuju" - s druge strane (up. §9.2 .2). Gore je navedeno da se pod određenim uslovima postavlja pitanje „Šta je značenje riječi X?" može se odgovoriti korištenjem "ostenzivne" definicije - pokazivanjem ili na drugi način direktnim pokazivanjem referent(ili referenti) date riječi (up. § 9.2.7). Određene filozofske poteškoće povezane su sa preciznom definicijom pojma "referenca", koja se ovdje može zanemariti. Pretpostavimo da se relacija reference (koja se ponekad naziva "denotacija") mora uzeti u obzir u konstrukciji bilo koje zadovoljavajuće teorije semantike; Drugim riječima, u određenom smislu možemo reći da se barem neke jedinice vokabulara u svim jezicima mogu povezati s jednim ili drugim "svojstvima" fizičkog svijeta.

Pretpostavka koju smo postavili ne znači da referencu smatramo semantičkom relacijom na koju se svi drugi odnosi mogu svesti; niti se misli na to da sve vokabularne jedinice jezika imaju referencu. "Referenca", kako se shvata u ovom radu, nužno je povezana sa početnim pretpostavkama o "egzistenciji" (ili "stvarnosti"), koje su izvedene iz naše direktne percepcije objekata fizičkog sveta. Kada se kaže da određena riječ (ili druga jedinica sa značenjem) "odgovara nekom objektu", podrazumijeva se da je referent riječi predmet koji "postoji" (je "stvaran") u istom smislu u za koje kažemo da konkretni ljudi, životinje i stvari "postoje"; također se podrazumijeva da bi, u principu, bilo moguće dati opis fizičkih svojstava predmeta koji se razmatra. Ovaj koncept "fizičkog postojanja" može se smatrati fundamentalnim za definisanje semantičkog odnosa reference. Upotreba izraza "postojanje" i "referenca" se tada može proširiti na nekoliko načina. Na primjer, iako na svijetu ne postoje takvi objekti kao što su kolačići, jednorozi ili kentauri (to će biti naša pretpostavka), bilo bi sasvim razumno pripisati im izmišljeno ili mitsko „postojanje“ u rasuđivanju određene vrste; te stoga možemo reći da riječi goblin "brownie", unicorn "unicorn" ili centaur "centaur" imaju referencu na engleskom (u okviru odgovarajućeg rezonovanja). Na sličan način možemo proširiti upotrebu pojmova "egzistencija" i "referenca", proširujući ih na takve teorijske konstrukcije nauke kao što su atomi, geni itd., pa čak i na potpuno apstraktne objekte. Važno je, međutim, napomenuti da se izvor ovih “analognih” ekstenzija pojmova “egzistencije” i “reference” može pronaći u njihovoj temeljnoj, ili primarnoj, primjeni na fizičke objekte u toku “svakodnevnog” upotreba jezika.

Iz ovakvog tumačenja koncepta reference proizilazi da u rječniku jezika može postojati mnogo jedinica koje nisu povezane odnosom reference ni sa jednim entitetom izvan jezika. Na primjer, može se smatrati da ne postoje stvari kao što su inteligencija ili ljubaznost, s kojima su povezane riječi inteligentan "pametan" i dobar "ljubazan", iako psiholog ili filozof uvijek može pretpostaviti postojanje takvih entiteta unutar okvira. neke specifične teorije psihologije ili etike i čak mogu tvrditi da se njihova "stvarnost" može demonstrirati nekom vrstom "ostenzivne" definicije. Činjenica da na različitim nivoima ovakvih sofističkih konstrukcija mogu nastati neslaganja između njihovih autora oko "stvarnosti" određenih imaginarnih "objekata"; to ne mijenja opći stav da referenca pretpostavlja postojanje. Bilo bi uzaludno insistirati na tome da sve leksičke jedinice budu nešto koreliraju, ako se istovremeno ima na umu da je u određenim slučajevima nemoguće iznijeti bilo koji drugi dokaz o postojanju tog "nečega", osim same činjenice prisutnosti određene leksičke jedinice, "korelirane" sa ovo "nešto".

U vezi sa konceptom reference mogu se uočiti još dvije tačke. Slažući se da određene leksičke jedinice odgovaraju objektima i svojstvima objekata izvan jezika, nismo dužni logički neminovno doći do zaključka da svi objekti označeni određenom riječi čine "prirodnu klasu" (bez obzira na "konvenciju", Prešutno prihvaćeno od strane članova date govorne zajednice da bi ove objekte podveli pod „neki opšti pojam); drugim riječima, gore opisana pozicija kompatibilna je ili s “nominalizmom” ili “realizmom” u filozofskoj semantici. Drugo, referenca određene leksičke jedinice ne mora biti tačna i potpuno određena u smislu da je uvijek jasno da li određeni objekt ili svojstvo spada ili ne spada u opseg date leksičke jedinice: već smo vidjeli da takva pretpostavka nije obavezna da bi se objasnilo "razumijevanje" izjava u normalnoj komunikaciji (up. § 9.2.9). Često su "referentne granice" leksičkih jedinica neodređene. Na primjer, nemoguće je naznačiti sasvim određenu tačku na kojoj bi trebalo povući liniju razdvajanja između riječi brdo "brdo, brdo, brdo" i planina "planina", piletina "kokoška; mladi pijetao; piletina; piletina " i kokoš "piletina" , zeleno "zeleno" i plavo "plavo; plavo, azurno; plavkasto" itd. Ali to ne znači da koncept reference nije primjenjiv na takve riječi. Karakteristična karakteristika jezika je da oni nameću određenu leksičku "kategorizaciju" stvarnom svijetu i, takoreći, povlače "proizvoljne" granice na različitim mjestima. Kao što ćemo vidjeti, ovo je jedan od razloga zašto je često nemoguće uspostaviti leksičke ekvivalentnosti između različitih jezika. Činjenica da su "referentne granice" "proizvoljne" i neodređene obično ne dovodi do narušavanja međusobnog razumijevanja, budući da je "precizno" dodjeljivanje objekta "pod" jednom ili drugom leksičkom jedinicom vrlo rijetko relevantno; a kada se pokaže relevantnim, okrećemo se drugim sistemima identifikacije ili specifikacije. Na primjer, ako želimo da označimo jednu od dvije osobe, od kojih bi svaka mogla biti nazvana ili riječju djevojka "djevojka" ili riječju žena "žena", možemo ih razlikovati jednu od druge po imenu, relativnoj starosti, kosi boja, način na koji su obučeni, itd. Iako se referenti devojke "preklapaju" sa referencama žene, te dve reči nisu sinonimi; njihov relativni položaj na starosnoj skali je fiksan, a postoji mnogo slučajeva u kojima je samo jedna od njih prikladna reč za upotrebu. "Netačnost" reference koju smo ilustrovali, iako uopće nije nedostatak jezika (kako neki filozofi misle), čini jezik djelotvornijim sredstvom komunikacije. Apsolutna "preciznost" je nedostižna, budući da nema ograničenja u broju i prirodi razlika koje se mogu napraviti između različitih objekata; i jedva da postoji ikakva zasluga u nasilnom pravljenju više razlika nego što je potrebno za navedene svrhe.

9.4.2. SENSE

Sada moramo uvesti koncept "značenja". Ispod značenje riječ označava svoje mjesto u sistemu odnosa u koje ulazi sa drugim riječima u rječniku jezika. Jasno je da, budući da se značenje mora definirati u smislu odnosa koji se odvijaju između jedinica rječnika, onda ono ne nosi nikakve početne pretpostavke o postojanju objekata ili svojstava izvan rječnika dotičnog jezika.

Ako se dva elementa mogu pojaviti u istom kontekstu, onda oni imaju značenje u ovom kontekstu; i dalje, možemo se zapitati da li koju vrijednost oni imaju. Kao što smo vidjeli, jedan dio ili komponenta značenja određenih elemenata može se opisati u smislu njihove reference. Bez obzira na to imaju li dva elementa referencu ili ne, možemo se zapitati da li imaju isto značenje u kontekstu ili kontekstima u kojima se oba pojavljuju. Pošto je ista vrijednost sinonimija- postoji odnos koji se odvija između dvije (ili više) jedinica vokabulara, povezan je sa značenjem, a ne sa referencom. Iz razloga koje ovdje ne moramo razmatrati, ponekad bi moglo biti zgodno reći da dvije jedinice imaju istu referencu, ali se razlikuju po značenju; i, naravno, prirodno je reći da jedinice mogu biti sinonimi čak i ako su lišene reference. Može se pretpostaviti da je (za jedinice s referencom) identitet reference neophodan, ali ne i dovoljan uslov za sinonimiju.

Teorijsko razmatranje sinonimije često je neadekvatno zbog dvije neopravdane pretpostavke. Prvi je da dva elementa ne mogu biti “potpuno sinonimni” u istom kontekstu osim ako nisu sinonimi u svim kontekstima. Ovaj zaključak se ponekad opravdava upućivanjem na razliku između "konceptualnog" i "emocionalnog" značenja. Ali sama ova razlika treba opravdanje. Ne može se poreći da je izbor određenog govornika jedne jedinice u odnosu na drugu određen "emocionalnim asocijacijama". Međutim, to ne znači da su "emocionalne asocijacije" uvijek relevantne (čak i ako su zajedničke svim članovima govorne zajednice). I ne može se jednostavno računati kao premisa tvrdnja da riječi uvijek nose "asocijacije" izvedene iz njihove upotrebe u drugim kontekstima. Stoga odbacujemo pretpostavku da riječi ne mogu biti sinonimne u odvojenim kontekstima ako nisu sinonimne u svim kontekstima.

Druga pretpostavka, koju često postavlja semantika, je da je sinonimija odnos identiteta koji postoji između dva (ili više) nezavisno definiranih značenja. Drugim riječima, pitanje da li su dvije riječi - a i b - sinonimi svodi se na pitanje da li a i b označavaju istu suštinu, isto značenje. U okviru pristupa semantici koji skiciramo u ovoj knjizi, neće biti potrebno postulirati postojanje nezavisno definiranih značenja. Sinonimija će se definirati na sljedeći način: dvije (ili više) jedinica su sinonimne ako rečenice nastale zamjenom jedne jedinice umjesto druge imaju isto značenje. Ova definicija je eksplicitno zasnovana na apriornom pojmu “istog značenja” za rečenice (i iskaze). Kasnije ćemo se vratiti na ovo pitanje. Ovdje samo želimo naglasiti ideju da se odnos sinonimije definira kao odnos koji se odvija između leksičkih jedinica, a ne između njihovih značenja. Sinonimnost leksičkih jedinica dio je njihovog značenja. Ista ideja može se formulirati u općenitijem obliku: ono što nazivamo značenjem leksičke jedinice je cijeli skup semantičkih odnosa(uključujući sinonimiju), u kojoj ulazi sa drugim jedinicama u vokabular jezika.

9.4.3. PARADIGMATSKI I SINTAGMATSKI ODNOSI

Pored sinonimije, postoji mnogo drugih semantičkih odnosa. Na primjer, muž "muž" i žena "žena" nisu sinonimi, ali su semantički povezani u odnosu koji nije slučaj između muža i sira "sira" ili vodonika "vodika"; dobar "dobar" i loš "loš" su različiti po značenju, ali su bliži od dobrog i crvenog "crvenog" ili okruglog "okrugla"; knock "kuc; bang", bang "bang, bang; pljes; zveckanje", tap "lako udariti, lupiti" i rap "lagano udariti; kuc, kuc" povezani su odnosom koji se ne odnosi na riječi kucati i jesti "jesti, jesti "ili se diviti" diviti se. Ovdje ilustrovani odnosi su paradigmatičan(svi članovi skupova semantički povezanih pojmova mogu se pojaviti u istom kontekstu). Riječi se također mogu povezati jedna s drugom sintagmatski; up.: plava "plava" i kosa "kosa", lavež "laj" i pas "pas", udarac "udarati, šutnuti, šutnuti" i noga "noga" itd. (Opšti principi razlikovanja paradigmatskih i sintagmatskih odnosa, vidi § 2.3.3.) Ovdje nećemo razmatrati pitanje da li se ovi sintagmatski i paradigmatski odnosi (kao što neki semantičari sugeriraju) mogu definirati u smislu njihove "udaljenosti" od sinonimije na skali sličnosti i razlike. alternativni pristup ovome će biti opisan u sljedećem poglavlju. Ovdje jednostavno pretpostavljamo da su barem neke oblasti vokabulara podijeljene na leksičkim sistemima i šta semantička struktura ove sisteme treba opisati u smislu semantičkih odnosa između leksičkih jedinica. Smatramo ovu izjavu rafiniranom formulacijom principa prema kojem je "značenje svake jedinice funkcija mjesta koje zauzima u odgovarajućem sistemu" (up. § 2.2.1, gdje se porede ruski i engleski pojmovi srodstva ).

Posljednjih godina dosta se radilo na proučavanju leksičkih sistema u vokabularu različitih jezika, posebno u odnosu na takve polja(ili oblasti), kao srodstvo, boja, biljni i životinjski svijet, težina i mjera, vojni čin, moralne i estetske ocjene, kao i različite vrste znanja, vještina i razumijevanja. Ovi rezultati još jednom su pokazali vrijednost strukturalnog pristupa semantici i potvrdili predviđanja naučnika poput Humboldta, Saussurea i Sapira da rječnici različitih jezika (barem u određenim područjima) nije izomorfna da postoje semantičke razlike povučene u jednom jeziku, a ne sprovedene na drugom; osim toga, kategorizacija specifičnih polja na različitim jezicima može se izvršiti na različite načine. Izražavajući ovu činjenicu Sosirovim terminima, kaže se da svaki jezik nameće specifičnost oblik do a priori nediferenciranih supstance plan sadržaja (up. § 2.2.2 i § 2.2.3). Da biste ilustrirali ovaj koncept, možete uzeti (kao supstancu) polje boje i vidjeti kako se ovaj koncept tumači, ili "formira", na engleskom.

Radi jednostavnosti, razmotrićemo pre svega samo onaj deo polja koji je pokriven rečima crvena „crvena“, narandžasta „narandžasta“, žuta „žuta“, zelena „zelena“ i plava „plava; cijan, azurna; plavkasto ". Svaki od ovih pojmova je neprecizan sa referentne tačke gledišta, ali je njihov relativni položaj u ovom leksičkom sistemu fiksiran (i generalno pokrivaju većinu vidljivog spektra): narandžasta je između crvene i žute, žuta je između narandžaste i zelene, itd. e. Značenje svake od ovih riječi uključuje indikaciju da one pripadaju ovom određenom leksičkom sistemu engleskog jezika i da su u ovom sistemu jedna s drugom u odnosu susjedstva (ili, možda tačnije, "nalaženja između"). Može se činiti da je koncept značenja ovdje suvišan i da bi za opisivanje njihovog značenja bilo sasvim dovoljno uzeti u obzir referencu svake od oznaka boja. Uzmite u obzir, međutim, uslove pod kojima osoba može prepoznati (ili se može smatrati da zna) referencu ovih riječi. Dijete koje uči engleski ne može prvo savladati referencu riječi zeleno, a zatim, zauzvrat, referencu riječi plavo ili žuto, tako da bi se u određenom trenutku moglo reći da zna referencu jedne riječi, ali ne zna referencu drugog. (Naravno, koristeći ostenzivnu metodu definicije, mogao je otkriti da riječ zeleno odgovara boji trave ili lišća određenog drveta, ili boji jedne od majčinih haljina: ali referenca riječi zeleno je šire od bilo koje njegove specifične upotrebe, a poznavanje njegove reference uključuje i poznavanje granica ove reference.) Treba pretpostaviti da tokom određenog vremenskog perioda dijete postepeno uči poziciju riječi zeleno u odnosu na reči plavo i žuto, a reč žuto u odnosu na reči zeleno i narandžasto itd. do tada dok ne nauči pozicije svake oznake boje u odnosu na njen sused u datom leksičkom sistemu i približan prolaz granica tog region u kontinuumu datog polja, koje pokriva svaka reč. Njegovo poznavanje značenja termina u boji nužno uključuje, stoga, poznavanje i njihovog značenja i njihove reference.

Polje pokriveno sa pet gore navedenih oznaka boja može se zamisliti kao nediferencirana (perceptivna ili fizička) supstanca, kojoj engleski jezik nameće određenu specifičnu formu povlačeći granice na određenim mjestima i primjenjuje određenu leksičku klasifikaciju na pet područja. tako dobijeni (nazivajući ih riječima crvena, narandžasta, žuta, zelena i plava). Često se primjećuje da drugi jezici nameću drugačiji oblik ovoj tvari, odnosno prepoznaju različit broj regija u njoj i povlače granice na drugim mjestima. Za gornji primjer možemo reći da su ruske riječi plava i plava zajedno pokrivaju približno istu površinu kao engleska riječ plava; označavajući posebne, iako susedne boje i zauzimajući ravnopravan položaj u sistemu sa rečima zeleno i žuta, ne treba ih smatrati riječima koje označavaju različite nijanse iste boje, poput grimizno "grimizno" i grimizno "grimizno; grimizno" zajedno s drugim riječima dijele područje pokriveno riječju crveno na engleskom (usp. § 2.2.3 ) ...

Odnos između pojmova u boji i njihovog značenja ne može se zamisliti tako jednostavno kao što smo to činili do sada. Razlika u referenci riječi crveno, narandžasto, žuto, zeleno i plavo može se opisati u smislu varijacije. tonovima(refleksije svjetlosti različitih talasnih dužina). Fizičari razlikuju dvije druge varijable kada analiziraju boju: gospodstvo, ili svjetlina (reflektirajući više ili manje svjetla), i zasićenje(stepen oslobođenosti od nečistoća bijeli). Područja boja, označena na engleskom riječima crna "crna", siva "siva" i bijela "bijela", razlikuju se uglavnom po svjetlini, ali referencu nekih drugih najčešće korištenih oznaka boja treba dati uzimajući u obzir sve tri dimenzije duž koja boja može varirati, na primjer: smeđa "braon" se odnosi na raspon boja koji je u nijansi između crvene "crvene" i žute "žute", ima relativno nisku svjetlost i zasićenost; ružičasta "ružičasta" se odnosi na boju koja je crvenkastog tona, ima prilično visoku lakoću i vrlo nisku zasićenost. Analiza ovih činjenica može dovesti do vjerovanja da je supstanca boje lisnih uši trodimenzionalni (fizički ili perceptualni) kontinuum.

Ali čak se i ova izjava čini da je previše pojednostavljena. Poenta nije samo u tome da se jezici razlikuju po relativnoj težini koju daju dimenzijama - nijansi, svjetlini i zasićenosti - u organizaciji svojih sistema označavanja boja (na primjer, za latinski i grčki, čini se da je lakoća bila važnija nego ton); postoje jezici u kojima se diferencijacija boja provodi na osnovu potpuno različitih principa. U svom klasičnom istraživanju na ovu temu, Conklin je pokazao da su četiri glavna "termina boja" Hanunoo (jezik koji se govori na Filipinima) povezana sa svjetlom (obično uključujući bijele i svijetle nijanse drugih "engleskih boja"), tamom (uključujući Engleska crna, ljubičasta, plava, tamnozelena i tamne nijanse drugih boja), "vlažnost" (obično povezana sa svijetlozelenom, žutom i svijetlo smeđom, itd.) i "suvoća" (obično povezana sa kestenjastom, crvenom, narandžastom itd. ). Da razlika između "vlažnosti" i "suvoće" nije samo pitanje tona ("zeleno" vs... "Crveno": upravo ta razlika može biti upečatljiva ako se zasniva na najčešćim engleskim prijevodima ova dva termina u pitanju), postaje jasno iz činjenice da "sjaj, vlažan, braon komad svježe isječenog bambusa ”opisuje se riječju koja se uobičajeno koristi za svijetlozeleno, itd. Conklin zaključuje da “boja, u tačnom smislu riječi, nije univerzalni koncept za zapadnoevropske jezike”; da opozicije, u smislu kojih se određuje supstancija boje u različitim jezicima, mogu ovisiti prvenstveno o povezanosti leksičkih jedinica s onim svojstvima predmeta u prirodnom okruženju osobe koja su bitna za datu kulturu. Što se tiče hanunbo jezika, sistem njegovih definicija, očigledno, polazi od tipične vrste svježih, mladih ("mokrih", "sočnih") biljaka. S tim u vezi, vrijedi napomenuti da engleski rječnici često definiraju osnovne oznake boja koje se tiču ​​tipičnih svojstava čovjekove okoline (na primjer, u rječniku se može reći da plava odgovara boji vedrog neba, crvena boji krvi itd. .).

9.4.6. SEMANTIČKA "RELATIVNOST"

Polje boja smo razmotrili pobliže jer se ono vrlo često koristi kao primjer da se pokaže kako isto supstanca može imati drugačiji oblik, koji joj nameću različiti jezici. Sada znamo da čak iu slučaju označavanja boja imamo sve razloge da sumnjamo u mogućnost apriorne postulacije identiteta "supstancije sadržaja". Kategorije “boja” koje je opisao Conklin u Hanunoo-u trebale bi nas prirodno dovesti do ideje da definicije supstance boje koje su relevantne za jezik teško da treba uvijek smatrati upravo onim dimenzijama koje su odabrane kao osnovne prirodne znanosti. To implicira opći zaključak da je jezik određenog društva sastavni dio njegove kulture i da leksičke distinkcije koje svaki jezik pravi obično odražavaju bitna (sa stanovišta ove kulture) svojstva objekata, institucija i aktivnosti društva. društva u kojem jezik funkcionira. Ovaj zaključak potkrepljuje niz novijih studija iz različitih oblasti rečnika različitih jezika. S obzirom na činjenicu da prirodno okruženje različitih društava može biti vrlo različito (da ne spominjemo njihove društvene institucije i modele ponašanja), čini se vrlo sumnjivom i sama mogućnost plodonosnog razmatranja semantičke strukture kao rezultat superpozicije. oblika na osnovnoj (perceptivnoj, fizičkoj ili konceptualnoj) supstanci zajedničkoj za sve jezike. Kao što je Sapir rekao: "Svjetovi u kojima žive različita društva su posebni svjetovi, a ne jedan te isti svijet s različitim etiketama."

Čak i ako pretpostavimo da različita društva žive u “posebnim svjetovima” (a na to ćemo se uskoro vratiti), ipak se može tvrditi da svaki jezik nameće neki specifičan oblik supstanciji “svijeta” u kojem funkcionira. To je u određenoj mjeri tačno (kao što smo vidjeli, na primjer, u slučaju termina u boji). Važno je, međutim, biti svjestan da leksički sistemi ne moraju biti izgrađeni na osnovu unaprijed određene "osnovne" supstance. Neka, na primjer, riječi poštenje "poštenje, istinitost, iskrenost, direktnost, čednost, vrlina, pristojnost," iskrenost, suzdržanost, suzdržanost, suzdržanost ", vjernost" vjernost, odanost, lojalnost, tačnost, ispravnost itd. isti leksički sistem sa riječju vrlina "vrlina, moral, čednost, dobar kvalitet, pozitivna osobina, dostojanstvo". Struktura ovog sistema može se opisati u smislu semantičkih odnosa između njegovih članova. Sa ove tačke gledišta, pitanje da li postoje "značajne" korelacije između leksičkih jedinica i prepoznatljivih osobina ili obrazaca ponašanja je irelevantno. Ako se takve korelacije uoče, onda će biti opisane u smislu referenci, a ne značenja. Ukratko, primenljivost koncepta supstance u semantici određena je istim postulatom „postojanja“ kao i koncept reference (up. § 9.4.1).

Tvrdnja da su “svjetovi u kojima žive različita društva posebni svjetovi” često se tumači kao proklamacija lingvističkog “determinizma”. Da li je Sapir (ili Humboldt prije njega i Whorf nakon njega) vjerovao da je naša kategorizacija svijeta u potpunosti određena strukturom našeg maternjeg jezika - ovo pitanje nećemo ovdje raspravljati. Većina naučnika se slaže da je lingvistički determinizam, shvaćen u ovom snažnom smislu, neodrživa hipoteza. Međutim, gore usvojeno gledište prema kojem jezici u svom vokabularu odražavaju razlike koje su važne sa stanovišta kulture društava u kojima funkcionišu, dijelom nas naginje na poziciju jezičke i kulturne „relativnosti“. " Stoga moramo naglasiti neospornu činjenicu da je razumijevanje strukture leksičkih sistema u jezicima koji nisu naš, neophodno i sasvim moguće kako u njihovoj asimilaciji u praktične svrhe, tako i u proučavanju njihovog rječnika. Od toga, očigledno, zavisi mogućnost prevođenja sa jednog jezika na drugi.

9.4.7. USPOREĐIVANJE KULTURA

Kulture (u smislu u kojem ovaj termin koriste antropolozi i sociolozi) nisu u korespondenciji jedan na jedan sa jezicima. Na primjer, mnoge institucije, običaji, odjevni predmeti, namještaj, hrana, itd., koji se odvijaju u Francuskoj i Njemačkoj, vidimo iu Engleskoj; drugi se ispostavljaju kao karakteristični za pojedinačne zemlje ili određene regije ili društvene klase jedne zemlje. (Odnos između jezika i kulture je, naravno, mnogo složeniji nego što slijedi iz ove pojednostavljene prezentacije: političke granice se ne poklapaju s jezičkim granicama, čak i ako koncept jedinstvenog govornog kolektiva smatramo u određenoj mjeri legitimnim bez dokaza; kulturne sličnosti se mogu naći između različitih društvenih grupa u različitim zemljama, itd.). U opštem slučaju, može se tvrditi da će između bilo koja dva društva postojati veći ili manji stepen podudarnost kultura; a može se ispostaviti da će određene osobine biti prisutne u kulturi svih društava. Praktično iskustvo u proučavanju stranih jezika (u onim normalnim uvjetima u kojima se ti jezici koriste) sugerira da brzo identificiramo određene objekte, situacije i znakove kada se kulture poklapaju i lako naučimo riječi i izraze koji se na njih primjenjuju. Značenja drugih riječi i fraza se teže uče, a njihova ispravna upotreba dolazi, ako ih ima, samo kao rezultat duže konverzacijske prakse. Teorijska interpretacija ovih činjenica našeg iskustva može biti sljedeća: ulaz u semantičku strukturu drugog jezika otvara se iz područja podudarnosti kultura; i kada jednom prekinemo ovaj krug značenja identifikacijom jedinica u ovoj oblasti (uporedi § 9.4.7, o neizbežnoj "kružnoj" prirodi semantike), možemo postepeno poboljšati i poboljšati naše znanje o ostatku rečnika iz unutra, savladavanjem referenci leksičkih jedinica i semantičkih odnosa koji povezuju jedinice u kontekstu njihove upotrebe. Prava dvojezičnost uključuje asimilaciju dvije kulture.

9.4.8. "PRIJAVA"

Ako se jedinice različitih jezika mogu povezati jedna s drugom na osnovu identifikacije zajedničkih karakteristika i situacija dviju kultura, možemo reći da te jedinice imaju iste aplikacija... Razlog za korištenje ovog termina umjesto termina “referenca” povezan je s dva razmatranja. Prije svega, predloženi termin označava odnos koji se odvija između situacija i izraza koji se javljaju u tim situacijama (na primjer, odnos između Oprostite "Izvinite", Hvala "Hvala" itd. i raznih karakterističnih situacija u kojima se te izjave susreću); očigledno nije referentna relacija. Drugo, potrebno je uzeti u obzir i semantičku identifikaciju leksičkih jedinica koje nemaju referencu; poželjno je reći, na primjer, da engleska riječ sin "sin" i francuska riječ peche imaju istu primjenu, iako bi moglo biti vrlo teško ili čak nemoguće utvrditi ovu činjenicu sa referentne tačke gledišta. Može se dogoditi da će drugi od ovih razloga za uvođenje koncepta "aplikacije" nestati kada se izgradi sveobuhvatna i zadovoljavajuća teorija kulture. Danas, tumačenje aplikacije, kao i proces prevođenja, u velikoj mjeri ovisi o intuiciji dvojezičnih govornika. To ne znači da koncept nema objektivan sadržaj, jer se dvojezični govornici obično međusobno slažu oko upotrebe većine riječi i izraza u jezicima koje koriste.

U ovom dijelu ništa nije rečeno o tome kako se uspostavljaju paradigmatski i sintagmatski semantički odnosi. Prije nego što se pozabavimo ovim pitanjem, moramo razmotriti mogućnost proširenja pojmova reference i značenja i na gramatičke jedinice.

9.5. "LEKSIČKO" ZNAČENJE I "GRAMATIČKO" ZNAČENJE

9.5.1. "STRUKTURNE VRIJEDNOSTI"

Razmatrajući pitanje "gramatičkih kategorija", osvrnuli smo se na tradicionalno, "aristotelovsko" gledište, prema kojem su samo glavni dijelovi govora (imenice, glagoli, "pridjevi" i prilozi) "značajni" u punom smislu. pojma (oni "označuju" "koncepte" koji čine "materiju" diskursa), a ostatak govora učestvuje u formiranju agregatnog značenja rečenica, namećući određeni gramatički "oblik" "sadržaju". " diskursa (up. § 7.1.3). Mnogi protivnici tradicionalne gramatike imaju izuzetno slične stavove.

Na primjer, Frieze pravi razliku između "leksičkog" i "strukturalnog" značenja, a ova opozicija tačno odražava "aristotelovsku" razliku između "materijalnog" i "formalnog" značenja. Glavni dijelovi govora imaju "leksičko" značenje; i dat je u rječniku koji je povezan s određenom gramatikom. Naprotiv, razlika između subjekta i objekta u rečenici, suprotnosti u određenosti, vremenu i broju, kao i razlika između iskaza, pitanja i zahtjeva – sve te razlike odnose se na „strukturalna značenja“. ("Agregatno jezičko značenje bilo kojeg iskaza sastoji se od leksičkih značenja pojedinačnih riječi plus takva strukturalna značenja... Gramatika jezika je sastavljena od sredstava za signaliziranje strukturalnih značenja.")

Friezeov koncept "strukturnog značenja" uključuje najmanje tri različite vrste semantičke funkcije; drugi lingvisti koriste termin “gramatičko značenje” (za razliku od “leksičkog značenja”) u istom smislu. Tri tipa "značenja" koja se spominju su: (1) "značenje" gramatičkih jedinica (obično služe za dijelove govora i sekundarne gramatičke kategorije); (2) "značenje" gramatičkih "funkcija" kao što su "subjekt", "objekat" ili "modifikator"; (3) “značenje” povezano s konceptima kao što su “deklarativno”, “upitno” ili “imperativno” kada se klasifikuju različite vrste rečenica. Važno je razlikovati ove vrste "gramatičkog značenja" i u nastavku ćemo ih razmotriti jednu po jednu.

9.5.2. LEKSIČKE I GRAMATIČKE JEDINICE

Predloženi su različiti kriterijumi za razlikovanje gramatičkih i leksičkih jedinica. Najzadovoljavajući od njih (i jedini koji ćemo ovdje spomenuti) formulirali su Martinet, Holliday i drugi u smislu paradigmatske opozicije unutar bilo kojeg zatvoreno ili otvoren skupovi alternativa. Zatvoreni skup jedinica je skup sa fiksnim i obično malim brojem članova, na primjer, skup ličnih zamjenica, vremena, rodova itd. Otvoreni skup je skup s neograničenim, neograničeno velikim brojem članova, tj. na primjer, klasa imenica ili glagola u jeziku. Koristeći ovu razliku, možemo reći da gramatičke jedinice pripadaju zatvorenim skupovima, a leksičke jedinice otvorenim skupovima. Ova definicija odgovara tradicionalnom razlikovanju značajnih dijelova govora, s jedne strane, i službenih dijelova govora i sekundarnih gramatičkih kategorija, s druge strane. Za razliku od nekih drugih predloženih definicija, nije vezan za jezike istog morfološkog "tipa" (na primjer, za "flektivne" jezike; up. § 5.3.6). Za sada ćemo pretpostaviti da je ova definicija tačna i da se (na osnovu razlikovanja zatvorenih i otvorenih skupova) svi elementi koji se unose u dubinsku strukturu rečenica mogu klasifikovati na „gramatičke“ i „leksičke“. Sada se postavlja pitanje da li u principu postoji razlika između značenja gramatičkih i leksičkih jedinica.

Prvo, imajte na umu da leksičke jedinice, prema tradicionalnom gledištu, imaju i “leksička” i “gramatička” značenja (i “materijalna” i “formalna” značenja; up. §9.5.1). Koristeći terminologiju skolastičke, „spekulativne“ gramatike, možemo reći da određena leksička jedinica, na primjer krava „krava“, ne „označava“ samo neki specifičan „pojam“ (ovo je „materijalno“ ili „leksičko“ značenje jedinice o kojoj je reč), ali istovremeno ostvaruje određeni „način označavanja“ fenomena u obliku, na primer, „supstanci“, „kvaliteta“, „dejstava“ itd. (up. § 1.2.7. i § 7.1.1). Iako se danas lingvisti rijetko objašnjavaju korištenjem ovih termina, ovaj opći koncept razlike između "leksičkog" i "gramatičkog" značenja leksičkih jedinica još uvijek je u upotrebi. Štaviše, čini se da je u određenoj mjeri opravdano.

Na primjer, Lermontov ima dobro poznatu pjesmu koja počinje riječima: Usamljeno jedro se bjeli... Ovu frazu je teško (a možda i nemoguće) prevesti na engleski, jer njen efekat zavisi od činjenice da se na ruskom "posedovanje svojstva belog" može "izraziti" uz pomoć "glagola" (onda se isto izražava riječju Bijelo, koji se u rečenicama koje nisu označene vremenom, vrstom i modalitetom obično koristi bez "glagola biti"; sri § 7.6.3). Kombinacija usamljeno jedro može se prevesti na engleski kao "usamljeno jedro" ( ploviti- imenica, i usamljena - "pridjev"). Sa tradicionalnog stanovišta, „glagol“ predstavlja „posedovanje svojstva belog“ kao „proces“ ili „aktivnost“, „pridev“ kao „kvalitet“ ili „stanje“. Specifičnosti preferiranog izbora u ovom slučaju „glagola“ a ne „pridjeva“ mogu se prikazati pomoću engleskog jezika samo uz pomoć prilično neadekvatne parafraze poput „Postoji usamljeno jedro koje se ističe (ili čak i sija) bijelo (na pozadini mora ili neba)... „Problemi ove vrste dobro su poznati onima koji prevode s jednog jezika na drugi. Ovdje smo zainteresirani teorijsko pitanje: možemo li reći da postoji određeno "gramatičko značenje" povezano sa svakim od glavnih dijelova govora?

Već smo vidjeli da je razlika između "glagola" i "pridjeva" u općoj sintaksičkoj teoriji složen problem: u nekim jezicima takva razlika se uopće ne pravi; u drugim jezicima, brojne sintaksičke karakteristike su povezane sa ovom razlikom, au određenim slučajevima one mogu biti u suprotnosti jedna s drugom (up. § 7.6.4). Ali glavni kriterijum, kriterijum koji odražava tradicionalnu razliku između “aktivnosti” i “kvaliteta”, je specifična razlika između “dinamičkog” i “statičnog” (up. § 8.4.7). Na ruskom, ova razlika u "gramatičkom značenju" je "superponirana" na "leksičko značenje", što je uobičajeno za "glagol" pobijeli i za "pridjev" Bijelo... Sa ovim pristupom, tradicionalna teorija "načina notacije" mora biti priznata kao ispravna: naravno, mora se preformulisati u okviru zadovoljavajuće teorije sintaksičke strukture.

Istovremeno, ne smijemo izgubiti iz vida opći princip da „posedovanje značenja implicira izbor“. Ako opisani jezik dozvoljava izbor izraza "glagol" ili "pridjev" (ograničavamo se na razliku koja je ilustrirana u našem primjeru), onda upotreba jedne ili druge od ovih metoda već spada u sferu semantička analiza jezika. Dalje se možemo zapitati da li su data dva "načina" izražavanja istu vrijednost ili ne; i, ako se razlikuju po značenju, onda se možemo zapitati koja je semantička razlika između njih. Ako se ova razlika može povezati s bilo kojom gramatičkom razlikom u dubokoj strukturi (na primjer, "dinamički" vs... "Statično"), onda je izraz "gramatičko značenje" sasvim prikladan za ovaj slučaj. Ali to ne znači da je izbor "glagola", a ne "pridjeva" uvijek povezan s razlikom u "gramatičkom značenju". U mnogim slučajevima, određeno "leksičko značenje" povezano je s jednim, ali ne i s drugim dijelom govora. Ukratko, po ovom pitanju, kao iu mnogim drugim, lingvistička teorija mora uspostaviti ravnotežu između “konceptualne” i “formalne” gramatike (up. § 7.6.1). Ne treba tvrditi da je “označavanje aktivnosti” dio “značenja” svakog “glagola” ili da je “označavanje kvaliteta” dio “značenja” svakog “pridjeva”.

Tradicionalno se vjeruje da leksičke jedinice imaju i "leksičko" ("stvarno") i "gramatičko" ("formalno") značenje. Gramatičke jedinice, kako se obično smatra, imaju samo "gramatičko" značenje. U prethodnom poglavlju smo vidjeli da se neke jedinice, koje se pojavljuju u površnoj strukturi rečenica kao "glagoli", mogu tumačiti kao "leksičke realizacije" vrsta, kauzativnih i drugih "gramatičkih" razlika. Ostavićemo po strani pitanje kako ove hipoteze odgovaraju stvarnosti. U trenutnom stanju sintaktičke teorije, razlika između gramatičkih i leksičkih jedinica je prilično nejasna. Razlog je taj što se razlika između otvorenih i zatvorenih skupova alternativa može primijeniti samo na pozicije odabira u dubokoj strukturi rečenica; ali, kao što smo vidjeli, moguća su vrlo različita gledišta o tome gdje se te pozicije „izbora“ nalaze.

Glavna stvar koju ovdje treba naglasiti svodi se na sljedeće: očigledno ne postoji značajna razlika između "vrste značenja" koja je povezana s leksičkim jedinicama i "vrste značenja" povezana s gramatičkim jedinicama u slučajevima kada ove dvije klase elemenata su duboke strukture koje se mogu jasno ocrtati. Koncepti "značenja" i "reference" primjenjuju se na obje vrste elemenata. Ako postoji bilo kakva generalizacija koja se može napraviti o značenju gramatičkih elemenata (a neki čisto gramatički elementi, kao što se sjećamo, uopće nemaju značenje; usp. §8.4.1), onda će se vjerovatno sastojati u činjenici da su gramatički "izbori" povezani sa opštim konceptima prostorne i vremenske korelacije, uzročnosti, procesa, individualizacije, itd., pojmovima tipa o kojima se govorilo u poglavljima 7 i 8. Međutim, ne možemo unapred reći da u strukturi neki od određenog jezika, takvi koncepti, čak i ako ih je lako razlikovati, nužno će biti "gramatikalizirani", a ne "leksikalizirani".

9.5.3. "VRIJEDNOST" GRAMATIČKIH "FUNKCIJA"

Druga klasa fenomena u strukturi engleskog jezika, za koju su Freese (i drugi) koristili termin "strukturno značenje" (ili "gramatičko značenje"), može se ilustrirati korištenjem pojmova kao što su "subjekt", "objekat" i "definicija." Friezeova knjiga je napisana prije stvaranja moderne teorije transformacijske sintakse i smatrao je izuzetno površnom strukturom (unutar prilično ograničenog koncepta). Stoga, mnogo toga što on kaže o ovim "funkcionalnim" konceptima, iako je istinito, teško da je relevantno za semantičku analizu. Isto se može reći i za većinu modernih lingvističkih teorija.

Sasvim je jasno da su neki gramatički odnosi koji se odvijaju na nivou dubinske strukture između leksičkih jedinica i kombinacija leksičkih jedinica relevantni za semantičku analizu rečenica. Prema Chomskyju, "funkcionalni" koncepti "subjekta", "direktnog objekta", "predikata" i "glavnog glagola" čine osnovne duboke odnose između leksičkih jedinica; Katz, Fodor i Postal su nedavno pokušali da formalizuju teoriju semantike skupom "pravila projekcije" koja djeluju na leksičke jedinice koje su povezane ovim odnosima unutar rečenica (usp. § 10.5.4). Koncepti kao što su "subjekt", "predikat" i "objekat" razmatrani su u prethodnom poglavlju; i vidjeli smo da njihova formalizacija u općoj sintaksičkoj teoriji uopće nije tako očigledna kao što je Čomski pretpostavljao. Iz toga slijedi da se upitnim čini i status "pravila projekcije" koji tumače rečenice zasnovane na ovim konceptima.

Uzimajući u obzir "tranzitivnost" i "ergativnost", istakli smo da se mnogi "direktni objekti" engleskih rečenica mogu generirati umetanjem jednomjesnih konstrukcija kao predikata dvomjesnih konstrukcija i uvođenjem novog "agentivnog" subjekta. Ali također smo vidjeli da postoje i druge konstrukcije tranzicije na dva mjesta koje se ne mogu generirati na zadovoljavajući način prema ovoj shemi. Sama ova činjenica sugerira da odnos “direktnog objekta” ne može dobiti jedinstvenu interpretaciju u semantičkoj analizi rečenica. U tradicionalnoj gramatici razlikuju se mnoge različite vrste "direktnog objekta". Ovdje se može spomenuti jedan od njih, budući da je (bez obzira na njegov status u teoriji sintakse) nesumnjivo vrlo važan u semantici. Mislimo na "objekat rezultata" (ili "efekat").

"Objekat rezultata" može se ilustrovati sa sledeće dve rečenice:

(1) Nije čitanje knjige "On čita knjigu."

(1) Nije pisanje knjige "On piše knjigu."

Knjiga iz rečenice (1) postoji prije i bez obzira na čitanje, ali knjiga iz rečenice (2) još ne postoji - ona nastaje nakon završetka aktivnosti opisane u ovoj rečenici. Zbog ove razlike, knjiga u (1) se tradicionalno posmatra kao "običan" objekat glagola čitanje, dok se knjiga u (2) opisuje kao "objekat rezultata". Sa semantičke tačke gledišta, svaki glagol koji uz sebe ima „objekat rezultata” može se nazvati „egzistencijalnim kauzativom”. Najčešći "glagol" na engleskom koji spada u ovu klasu je make "to do", a već smo istakli da je on takođe i "pomoćni uzročnik" (up. § 8.3.6 i § 8.4.7). Isti "glagol" djeluje, kao i glagol do "raditi", kao "zamjenski glagol" u upitnim rečenicama. Pitanje poput Šta radiš? "Šta radiš?" nosi manje pretpostavki o „predikatu“ rečenice koja odgovara na pitanje (glagol može biti prelazan ili neprelazan, ali mora biti glagol „radnja“; up. § 7.6.4). Pitanje Šta praviš? "Šta radiš?" U brojnim evropskim jezicima ova se razlika pojavljuje, međutim, ne tako jasno kao u engleskom. (Na primjer, na francuskom, Qu "est-ce que tu fais? Može se prevesti na engleski kao "Šta radiš?" ili "Šta radiš?") Ali to ne znači da je za ove jezike razlika razlika. između "normalnih" objekata i "rezultatnih objekata" nije bitno.

Važnost pojma "egzistencijalnog kauzativa" je zbog činjenice da u rečenicama koje sadrže konstrukt sa "rezultatnim objektom" često postoji visok stepen međuzavisnosti između određenog glagola ili klase glagola i određene imenice ili klase glagola. imenice. Na primjer, nemoguće je dati zadovoljavajuću semantičku analizu imenice slika "slika" a da se ne identifikuju njene sintagmatske veze s glagolima kao što su slikati "farbati, slikati, pisati" i crtati "crtati, slikati"; nasuprot tome, činjenica da ovi glagoli mogu imati imenicu sliku kao svoj "rezultatni objekat" mora se uzeti u obzir kao dio njihovog značenja.

Ovaj pojam sintagmatske međuzavisnosti, ili pretpostavke, igra značajnu ulogu u analizi vokabulara bilo kog jezika (up. § 9.4.3). Ima mnogo širu primjenu nego što to mogu pokazati naši primjeri. Postoje pretpostavke između određenih klasa imenica i glagola kada je imenica subjekat glagola (npr. ptica "ptica": letjeti "leti", riba "riba": plivati ​​"plivati"); između "pridjeva" i imenica (plava "plava": kosa "kosa", dodano "pokvareno": jaje "jaje"); između glagola i "običnih" objekata (vožnja "voziti": sag "automobil"); između glagola i imenica koje su s njima u "instrumentalnim" odnosima (ugriz "ugriz": zubi "zubi", udarac "udarac": stopalo "noga, noga") itd. Mnogi od ovih odnosa su između određenih klasa leksičkih jedinica ne može se formulisati drugačije osim uz pomoć određenog skupa "pravila projekcije" (ad hoc pravila) u okviru transformacione sintakse koju je ocrtao Čomski.

S obzirom na činjenicu da još uvijek ne postoji potpuno zadovoljavajuća sintaktička osnova unutar koje bi bilo moguće formulirati različite semantičke relacije koje služe kao sredstvo za strukturiranje rječnika jezika, nećemo pokušavati formulirati skupove "pravila projekcije" koji djeluju sa dubokim gramatičkim odnosima. U sljedećem poglavlju ćemo pogledati nekoliko posebno važnih paradigmatskih odnosa između klasa leksičkih jedinica; njihova analiza će se vršiti na neformalan način. Prema našoj pretpostavci, ovi odnosi bi se mogli formulisati na elegantniji način u smislu nekog zadovoljavajućeg opisa gramatičkih odnosa na nivou dubinske strukture.

9.5.4. "VRIJEDNOST" "VRSTE PONUDE"

Treća klasa "značenja" koja se obično smatraju "gramatičkim" može se ilustrovati razlikovanjem između "deklarativnih", "upitnih" i "imperativnih" rečenica. U novijim radovima na teoriji transformacije, postojala je tendencija da se u duboke neuronske strukture rečenica uvedu gramatički elementi kao što su "znak pitanja" i "imperativ", a zatim se formuliraju pravila transformacijske komponente na način da se prisustvo jednog od ovih "markera" bi "uključivalo »odgovarajuće pravilo transformacije. Ovdje ne razmatramo sintaktičke prednosti ove formulacije diferencijacije između različitih "vrsta rečenica", zanima nas njena semantička suština.

Sugerirano je (od strane Katza i Postala) da su ovi "markeri" semantički slični leksičkim i gramatičkim elementima koji se javljaju kao sastavni dijelovi u jezgri rečenica. Na primjer, "imperativ marker" je napisan u rječniku i snabdjeven naznakom "što ga karakterizira da ima približno sljedeće značenje:" govornik upućuje zahtjev (pita, zahtijeva, insistira, itd.) na "". Ali ovo mišljenje je zasnovano na zbrci u upotrebi termina "značenje". On zaobilazi one kontradikcije koje nastaju u vezi sa razlikama koje se prave u semantici između "značenja", "reference" i drugih vrsta "značenja". Ako nastavimo koristiti termin "značenje" za sve vrste razlikovnih semantičkih funkcija, onda možemo razumno reći da postoje razlike u "značenju" između odgovarajućih iskaza, pitanja i naredbi (koje nisu nužno "izražene" deklarativnim, upitne i imperativne rečenice, ali zbog jednostavnosti ovu činjenicu zanemarujemo). Međutim, pitanje da li dvije leksičke jedinice imaju „isto značenje“ ili ne obično se tumači u odnosu na pojam sinonimije – isto značenje. To je paradigmatski odnos, odnosno odnos koji se odvija ili ne odvija između jedinica koje se javljaju u istom kontekstu, u istoj "vrsti rečenice". U narednom poglavlju ćemo vidjeti da je koncept "sinonimije" između X i at može se opisati u smislu skupa implikacija koje "slede" iz dve rečenice koje se razlikuju samo u onom mestu gde u jednom slučaju stoji X, u drugom - košta at... Ali ova razmatranja jednostavno se ne odnose na odgovarajuće izjavne i upitne (imperativne) rečenice (na primjer: Pišete pismo "Pišete pismo" vs... Pišete li pismo? "Pišete li pismo?" ili Napišite pismo! "Napisati pismo!"). Dok se odgovarajući članovi različitih „vrsta rečenica“ mogu okarakterisati kao različiti u „značenju“, ne može se smatrati da su različiti po značenju. Nema potrebe pokušavati formalizirati teoriju semantike na takav način da se "značenje" "znaka pitanja" ili "imperativnog znaka" može opisati istim terminima kao i "značenje" leksičkih jedinica.

Povratak

×
Pridružite se koon.ru zajednici!
U kontaktu sa:
Već sam se pretplatio na zajednicu "koon.ru"