Náčrt lekcie na tému: Lekcia MDK "Systémy strojového prekladu textov a počítačových slovníkov." Preklad primárnych dokumentov z cudzieho jazyka

Prihlásiť sa na odber
Pripojte sa ku komunite „koon.ru“!
VKontakte:

V súčasnosti existujú tri typy systémov strojového prekladu:

Systémy založené na gramatických pravidlách (Rule-Based Machine Translation, RBMT);

Štatistické systémy (Statistical Machine Translation, SMT);

hybridné systémy;

Systémy založené na gramatických pravidlách analyzujú text, ktorý sa používa v procese prekladu. Preklad sa realizuje na základe vstavaných slovníkov pre daný jazykový pár, ako aj gramatík pokrývajúcich sémantické, morfologické, syntaktické vzory oboch jazykov. Na základe všetkých týchto údajov sa zdrojový text postupne, vetu po vete, prevedie na text v požadovanom jazyku. Základným princípom fungovania takýchto systémov je prepojenie štruktúr východiskového a cieľového textu.

Systémy založené na gramatických pravidlách sa často delia do troch ďalších podskupín – systémy prekladu slovo po slove, prenosové systémy a interlingvistické systémy.

Výhody systémov založených na gramatických pravidlách sú gramatická a syntaktická presnosť, stabilita výsledku a možnosť prispôsobenia pre konkrétnu oblasť. Medzi nevýhody systémov založených na gramatických pravidlách patrí potreba vytvárať, udržiavať a aktualizovať lingvistické databázy, zložitosť tvorby takéhoto systému, ako aj jeho vysoká cena.

Štatistické systémy využívajú pri svojej práci štatistickú analýzu. Do systému sa načíta dvojjazyčný textový korpus (obsahujúci veľké množstvo textu v zdrojovom jazyku a jeho „ručný“ preklad do požadovaného jazyka), po ktorom systém analyzuje štatistiku medzijazykových korešpondencií, syntaktických štruktúr atď. sa samoučí – pri výbere možnosti prekladu sa spolieha na predtým získané štatistiky. Čím väčší je slovník v rámci jazykového páru a čím presnejšie je zostavený, tým lepší je výsledok štatistického strojového prekladu. S každým novým preloženým textom sa kvalita následných prekladov zlepšuje.

Štatistické systémy sa rýchlo nastavujú a ľahko sa pridávajú nové smery prekladu. Z nedostatkov sú najvýznamnejšie prítomnosť početných gramatických chýb a nestabilita prekladu.

Hybridné systémy kombinujú prístupy opísané vyššie. Očakáva sa, že hybridné systémy strojového prekladu budú spájať všetky výhody štatistických systémov a systémov založených na pravidlách.

1.3 Klasifikácia systémov strojového prekladu

Systémy strojového prekladu sú programy, ktoré vykonávajú plne automatizovaný preklad. Hlavným kritériom programu je kvalita prekladu. Okrem toho sú dôležitými bodmi pre používateľa pohodlie rozhrania, jednoduchosť integrácie programu s inými nástrojmi na spracovanie dokumentov, výber tém a nástroj na doplnenie slovníka. S príchodom internetu hlavní dodávatelia strojového prekladu zahrnuli webové rozhrania do svojich produktov a zároveň ich integrovali s iným softvérom a e-mailom, čo umožnilo použiť MT motory na preklad webových stránok, e-mailovej korešpondencie a online konverzačných relácií.

Noví členovia Cudzojazyčného fóra CompuServe sa často pýtajú, či niekto môže odporučiť dobrý program strojového prekladu za rozumnú cenu.

Odpoveď na túto otázku je vždy „nie“. V závislosti od odpovedajúcej osoby môže odpoveď obsahovať dva hlavné argumenty: buď že stroje nedokážu preložiť, alebo že strojový preklad je príliš drahý.

Oba tieto argumenty sú do určitej miery platné. Odpoveď však zďaleka nie je taká jednoduchá. Pri štúdiu problému strojového prekladu (MT) je potrebné samostatne zvážiť rôzne podsekcie tohto problému. Nasledujúce rozdelenie je založené na prednáškach Larryho Childsa na Medzinárodnej konferencii technickej komunikácie v roku 1990:

Plne automatický preklad;

Automatizovaný strojový preklad s ľudskou účasťou;

Preklad vykonáva osoba pomocou počítača.

Plne automatizovaný strojový preklad. Tento typ strojového prekladu má väčšina ľudí na mysli, keď hovoria o strojovom preklade. Význam je tu jednoduchý: text v jednom jazyku sa zadá do počítača, tento text sa spracuje a počítač zobrazí rovnaký text v inom jazyku. Žiaľ, implementácia tohto typu automatického prekladu naráža na určité prekážky, ktoré je ešte potrebné prekonať.

Hlavným problémom je zložitosť samotného jazyka. Vezmime si napríklad významy slova „môže“. Okrem základného významu modálneho pomocného slovesa má slovo „can“ ako podstatné meno viacero formálnych a slangových významov: „can“, „latrína“, „väzenie“. Okrem toho existuje archaický význam tohto slova - „poznať alebo pochopiť“. Za predpokladu, že výstupný jazyk má pre každý z týchto významov samostatné slovo, ako ich môže počítač rozlíšiť?

Ako sa ukazuje, určitý pokrok sa dosiahol vo vývoji prekladateľských programov, ktoré rozlišujú význam na základe kontextu. Novšie štúdie sa pri analýze textov viac spoliehajú na teórie pravdepodobnosti. Plne automatizovaný strojový preklad textov s rozsiahlou tematikou je však stále nesplniteľnou úlohou.

Automatizovaný strojový preklad s ľudskou účasťou. Tento typ strojového prekladu je teraz úplne realizovateľný. Keď hovoríme o strojovom preklade za pomoci človeka, zvyčajne máme na mysli úpravu textov pred aj po ich spracovaní počítačom. Ľudskí prekladatelia menia texty tak, aby boli zrozumiteľné pre stroje. Keď počítač vykoná preklad, ľudia opäť upravia hrubý strojový preklad, čím sa text vo výstupnom jazyku upraví. Okrem tohto operačného postupu existujú systémy MT, ktoré počas prekladu vyžadujú neustálu prítomnosť ľudského prekladateľa, ktorý počítaču pomáha prekladať obzvlášť zložité alebo nejednoznačné štruktúry.

Strojový preklad pomocou človeka je vo väčšej miere použiteľný na texty s obmedzenou slovnou zásobou a úzko vymedzeným predmetom.

Nákladová efektívnosť používania strojového prekladu za pomoci človeka je stále kontroverznou otázkou. Samotné programy sú zvyčajne dosť drahé a niektoré z nich vyžadujú na spustenie špeciálne vybavenie. Pre- a post-editovanie si vyžaduje zaučenie a nie je to príjemná práca. Vytváranie a údržba databáz slov je proces náročný na prácu a často si vyžaduje špeciálne zručnosti. Avšak pre organizáciu, ktorá prekladá veľké objemy textu v presne definovanej oblasti, môže byť strojový preklad pomocou človeka pomerne cenovo výhodnou alternatívou k tradičnému ľudskému prekladu.

Preklad vykonáva osoba pomocou počítača. V tomto prístupe je ľudský prekladateľ v centre prekladateľského procesu, zatiaľ čo počítačový program sa považuje za nástroj, ktorý robí proces prekladu efektívnejším a presnejším. Ide o bežné elektronické slovníky, ktoré poskytujú preklad požadovaného slova, pričom zodpovednosť za výber požadovanej možnosti a význam prekladaného textu kladie na osobu. Takéto slovníky značne uľahčujú proces prekladu, ale vyžadujú, aby používateľ mal určitú znalosť jazyka a venoval čas jeho implementácii. A predsa je samotný proces prekladu výrazne rýchlejší a jednoduchší.

Medzi systémami, ktoré pomáhajú prekladateľovi pri jeho práci, zaujímajú najdôležitejšie miesto takzvané systémy prekladovej pamäte (TM) systémy TM sú interaktívnym nástrojom na zhromažďovanie párov ekvivalentných textových segmentov v pôvodnom jazyku v databáze preklad s možnosťou ich následného vyhľadávania a úpravy. Tieto softvérové ​​produkty si nekladú za cieľ využívať vysoko inteligentné informačné technológie, ale naopak, sú založené na využití tvorivého potenciálu prekladateľa. V procese práce si prekladateľ sám vytvorí databázu (alebo ju dostane od iných prekladateľov alebo od zákazníka) a čím viac jednotiek obsahuje, tým väčšia je návratnosť jej použitia.

Tu je zoznam najznámejších systémov TM:

Tranzit od švajčiarskej spoločnosti Star,

Trados (USA),

Manažér prekladov od IBM,

Eurolang Optimizer od francúzskej spoločnosti LANT,

DejaVu z ATRIL (USA),

WordFisher (Maďarsko).

Systémy TM umožňujú eliminovať opakované preklady identických textových fragmentov. Preklad segmentu vykoná prekladateľ iba raz a potom sa každý nasledujúci segment skontroluje na zhodu (úplnú alebo neostrú) s databázou a ak sa nájde identický alebo podobný segment, ponúkne sa ako možnosť prekladu. .

V súčasnosti prebieha vývoj na zlepšenie systémov TM. Napríklad jadro systému Star's Transit je implementované na základe technológie neurónových sietí.

Napriek širokému spektru systémov TM majú niekoľko spoločných čŕt:

Funkcia zarovnania. Jednou z výhod TM systémov je možnosť využiť už preložené materiály na danú tému. Databázu PP možno získať porovnaním segmentu po segmente pôvodných a prekladových súborov.

Dostupnosť importných a exportných filtrov. Táto vlastnosť zabezpečuje kompatibilitu systémov PP s rôznymi textovými procesormi a publikačnými systémami a dáva prekladateľovi relatívnu nezávislosť od zákazníka.

Mechanizmus na vyhľadávanie nejasných alebo úplných zhôd. Práve tento mechanizmus predstavuje hlavnú výhodu TM systémov. Ak systém pri preklade textu narazí na segment, ktorý je identický alebo blízky predtým preloženému, potom sa už preložený segment ponúkne prekladateľovi ako možnosť prekladu aktuálneho segmentu, ktorý je možné opraviť. Stupeň fuzzy zhody určuje používateľ.

Podpora pre tematické slovníky. Táto funkcia pomáha prekladateľovi držať sa slovníka. Spravidla, ak sa slovo alebo fráza z tematického slovníka vyskytne v prekladanom segmente, je farebne zvýraznená a navrhne sa jej preklad, ktorý môže byť automaticky vložený do preloženého textu.

Nástroje na vyhľadávanie fragmentov textu. Tento nástroj je veľmi praktický pri úprave prekladov. Ak sa počas pracovného procesu našla úspešnejšia možnosť prekladu pre akýkoľvek fragment textu, potom tento fragment možno nájsť vo všetkých segmentoch PP, po ktorých sa postupne vykonajú potrebné zmeny v segmentoch PP.

Samozrejme, ako každý softvérový produkt, aj systémy TM majú svoje výhody a nevýhody a rozsah použitia. Pokiaľ ide o systémy TM, hlavnou nevýhodou je ich vysoká cena.

Systémy TM je vhodné použiť najmä pri prekladoch dokumentov, ako sú používateľské manuály, návody na obsluhu, konštrukčná a obchodná dokumentácia, katalógy produktov a iná podobná dokumentácia s veľkým počtom zhôd.

Dokumenty vyhotovené v cudzích jazykoch by mala cestovná kancelária preložiť do ruštiny. V opačnom prípade výdavky na ne nemožno daňovo uznať. Niekedy však preklad nie je potrebný. Napríklad, ak hovoríme o podrobnostiach elektronickej letenky zakódovanej v latinčine (list Federálnej daňovej služby Ruska zo 7. júna 2011 č. ED-4-3/8983).

Potreba prekladu dokumentov
V súlade s odsekom 1 článku 16 zákona Ruskej federácie z 25. októbra 1991 č. 18071 „O jazykoch národov Ruskej federácie“ sa úradné dokumenty v organizáciách v našej krajine vedú v ruštine.

A ako je uvedené v odseku 9 Predpisov o vedení účtovníctva a finančného výkazníctva v Ruskej federácii, schválených nariadením Ministerstva financií Ruska zo dňa 29. júla 1998 č. 34n, účtovanie majetku, záväzkov a obchodných transakcií (skutočnosti ekonomická činnosť) sa zaznamenáva v mene Ruskej federácie - v rubľoch.

Zároveň sa v ruštine vykonáva dokumentácia majetku, záväzkov a iných skutočností o hospodárskej činnosti, vedenie účtovných a výkazníckych registrov. Ďalej sa hovorí: primárne účtovné doklady zostavené v iných jazykoch musia mať riadkový preklad do ruštiny.

Na základe týchto noriem regulačné orgány dospeli k záveru, že primárne dokumenty, ak sú vyhotovené v cudzom jazyku, musia byť preložené do ruštiny. Tento názor je vyjadrený najmä v listoch Ministerstva financií Ruska zo dňa 3. novembra 2009 č. 03-03-06/725, zo dňa 14. septembra 2009 č. 03-03-05/170 zo 16. februára. , 2009 č. 03- 03-05/23.

Hoci na súdoch sa organizáciám darí obhajovať výdavky, ktoré sú potvrdené dokumentmi bez prekladu (uznesenia Federálnej protimonopolnej služby Moskovského okresu zo dňa 21. apríla 2011 č. KA-A40/2152-11, zo dňa 8. októbra 2008 č. KA-A40/8061-08).

Rozhodcovia sa tiež najčastejšie stavajú na stranu platiteľov dane a poukazujú na to, že chýbajúci preklad dokumentov do ruštiny nemôže slúžiť ako základ na odmietnutie odpočtu DPH. Príkladom toho je uznesenie Moskovského dištriktu FAS zo dňa 1. apríla 2009 č. KA-A40/132809 zo dňa 16. marca 2009 č. KA-A40/1450-09, Západosibírskeho obvodu FAS zo dňa 5. marca 2007 č. F04-979/2007(31967-A45-14).

Ak však doklady cestovnej kancelárie nie sú preložené, s najväčšou pravdepodobnosťou budete musieť obhájiť možnosť daňového účtovania výdavkov alebo nároku na odpočet. Výsledok súdneho sporu zároveň nemusí byť v prospech daňovníka.

Ako preložiť dokument
Finančné oddelenie spresňuje, že preklad môže vyhotoviť buď profesionálny prekladateľ, alebo samotná organizácia, respektíve jej zamestnanec (listy zo dňa 14. septembra 2009 č. 03-03-05/170, z 20. marca 2006 č. 03-02-07 /1-66).

Legislatíva však nestanovuje, ako sa má takýto dokument vyhotoviť. Preto sa to dá urobiť vo forme samostatného dokumentu alebo môžete zadať ruský text na fotokópie cudzieho primárneho dokumentu.

Treba poznamenať, že preklad môže vykonať aj organizácia, ktorá vydala primárny dokument, napríklad vo forme osvedčenia (list Ministerstva financií Ruska č. 03-03-05/170).

Kedy sa zaobídete bez prekladu?
V niektorých prípadoch nebudete musieť prekladať dokumenty.

Toto nie je potrebné robiť, po prvé, ak pravidelne dostávate štandardné dokumenty od svojich zahraničných protistrán, v ktorých sa líšia iba digitálne ukazovatele (číslo, dátum dokumentu, cena atď.), stačí raz preložiť formulár dokumentu do ruštiny . Vysvetlenia k tejto problematike sú uvedené v liste Ministerstva financií Ruska z 3. novembra 2009 č. 03-03-06/1/725.

Po druhé, nie je potrebné prekladať informácie, ktoré nie sú nevyhnutné na potvrdenie vynaložených výdavkov.

Napríklad podmienky uplatňovania cestovného, ​​pravidlá leteckej dopravy, pravidlá prepravy batožiny. Upozornili na to úradníci hlavného finančného odboru listom zo 14. septembra 2009 č.03-03-05/170.

Po tretie, nie je potrebné prekladať formalizované (kódované) podrobnosti elektronickej letenky vyplnené latinkou (listy Federálnej daňovej služby Ruska zo 7. júna 2011 č. ED-4-3/8983 z 26. apríla , 2010 č. ShS-37- 3/656@).

Ak sú však hodnoty v elektronickej letenke skutočne uvedené v cudzom jazyku a nezhodujú sa s formalizovanými (kódovanými) hodnotami alebo kódmi v súlade s Unified International Codifiers, potom tieto ukazovatele (hodnoty) vzduchu lístok musí byť preložený do ruštiny.

Účtovanie nákladov na preklad
Výdavky cestovnej kancelárie na úhradu služieb prekladu dokumentov sú v účtovníctve zahrnuté v ostatných výdavkoch v mesiaci, v ktorom boli poskytnuté. Prejaví sa to zápisom na ťarchu účtu 91 „Ostatné výnosy a náklady“ (podúčet „Ostatné náklady“) a v prospech účtu 76 „Vysporiadania s rôznymi dlžníkmi a veriteľmi“ (odseky 11, 16, 18 PBU 10 /99 „Výdavky organizácie“).

Takéto výdavky sú akceptované aj na účely dane zo zisku - ako súčasť iných ako platba za informačné služby (odsek 14, odsek 1, článok 264 daňového poriadku Ruskej federácie) alebo ako iné iné výdavky. O tom sa hovorí v liste Federálnej daňovej služby Ruska pre Moskvu z 26. mája 2008 č. 20-12/050126. Je pravda, že toto pravidlo sa týka nákladov na preklad tretej strany.

Pripomeňme, že na splnenie požiadaviek článku 252 daňového poriadku Ruskej federácie je potrebné zdokumentovať výdavky na preklad dokumentov.

Pri „zjednodušení“ nebude možné takéto výdavky zohľadňovať. Keďže nie sú zahrnuté v uzavretom zozname povolených výdavkov (článok 1 článku 346.16 daňového poriadku Ruskej federácie).

Dôležité mať na pamäti

Náklady na preklad dokumentov treťou stranou je možné zohľadniť na účely dane z príjmov. Nie je však možné ich prijať „zjednodušene“.

Téma: „Počítačové prekladače. Systémy rozpoznávania textu."

Ciele lekcie:

    pomôcť študentom pochopiť počítačové slovníky a systémy strojového prekladu textu, zoznámiť sa s možnosťami týchto programov a naučiť ich používať. pomôcť študentom porozumieť OCR - programom na rozpoznávanie textu, oboznámiť sa s dátovými možnosťami programu, naučiť ich rozpoznávať naskenovaný text, prenášať ho a upravovať vo Worde. pestovanie informačnej kultúry študentov, pozornosť, presnosť, disciplína, vytrvalosť. rozvoj kognitívnych záujmov, počítačových zručností, sebakontroly a schopnosti zapisovať poznámky.

Vybavenie:
tabuľa, počítač, počítačová prezentácia.

Plán lekcie:

1) Organizačný moment. (1 min)

2) Aktualizácia vedomostí. (5 min)

3) Teoretická časť. (10 min)

4) Praktická časť. (15 min)

5) domáca úloha (2 minúty)

6) Otázky študentov. (5 min)

7) Zhrnutie lekcie. (2 min)

Priebeh lekcie:

I. Organizačný moment.

Zdravím vás, kontrolujem prítomných. Vysvetlenie lekcie.

II. Aktualizácia vedomostí.

Ako vidíte, na získanie elektronickej kópie akéhokoľvek vytlačeného textu pripraveného na úpravu musí program OCR vykonať „reťazec“ mnohých jednotlivých operácií.

Najprv musíte rozpoznať štruktúru textu na stránke: vyberte stĺpce, tabuľky, obrázky atď. Ďalej je potrebné previesť vybrané textové fragmenty grafického obrazu stránky na text.

Ak má zdrojový dokument typografickú kvalitu (dostatočne veľké písmo, žiadne zle vytlačené znaky alebo opravy), potom je problém s rozpoznávaním vyriešený porovnaním s rastrovou šablónou. Najprv sa bitmapový obrázok stránky rozdelí na obrázky jednotlivých znakov. Potom sa každý z nich postupne prekrýva so šablónami symbolov dostupnými v systémovej pamäti a vyberie sa šablóna s najmenším počtom bodov odlišným od vstupného obrázka.

Pri rozpoznávaní dokumentov s nízkou kvalitou tlače (strojom písaný text, fax atď.) sa používa metóda rozpoznávania znakov prítomnosťou určitých štruktúrnych prvkov v nich (segmenty, prstence, oblúky atď.).

Akýkoľvek symbol môže byť opísaný pomocou súboru hodnôt parametrov, ktoré určujú relatívnu polohu jeho prvkov. Napríklad písmeno „H“ a písmeno „I“ pozostávajú z troch segmentov, z ktorých dva sú navzájom rovnobežné a tretí tieto segmenty spája. Rozdiel medzi týmito písmenami je vo veľkosti uhlov, ktoré tvorí tretí segment s ostatnými dvoma.

Pri rozpoznávaní pomocou štrukturálnej metódy sa charakteristické detaily identifikujú v skreslenom symbolickom obraze a porovnávajú sa so štrukturálnymi vzormi symbolov. V dôsledku toho sa vyberie symbol, pre ktorý súčet všetkých konštrukčných prvkov a ich usporiadanie najviac zodpovedá rozpoznanému symbolu.

Najbežnejšie systémy optického rozpoznávania znakov, napríklad ABBYY FineReader a CuneiForm od spoločnosti Cognitive, využívajú rastrové aj štrukturálne metódy rozpoznávania. Tieto systémy sú navyše „samoučiace“ (pre každý konkrétny dokument vytvoria vhodnú sadu šablón znakov) a preto sa rýchlosť a kvalita rozpoznávania viacstranového dokumentu postupne zvyšuje.

Programy na rozpoznávanie textu si môžete zakúpiť samostatne alebo ich dostanete bezplatne spolu so zakúpeným skenerom.

Asi najznámejším programom na rozpoznávanie textu je FineReader od ABBYY. Práve na tento program sa najčastejšie spomína pri rozpoznávacích systémoch.

FineReader vám umožňuje rozpoznať texty napísané takmer akýmkoľvek písmom bez predchádzajúceho školenia. Zvláštnosťou programu FineReader je vysoká presnosť rozpoznávania a nízka citlivosť na chyby tlače, čo sa dosahuje použitím technológie „holistického cieleného adaptívneho rozpoznávania“.

FineReader má množstvo doplnkových funkcií, ktoré bežný používateľ možno nepotrebuje, no na určité skupiny kupujúcich robia dojem. Takže jedným z tromfov FineReadera je jeho podpora pre neuveriteľný počet rozpoznávacích jazykov - 176, medzi ktorými nájdete exotické a starodávne jazyky a dokonca aj populárne programovacie jazyky.

Ale nie všetky funkcie sú zahrnuté v najjednoduchšej úprave programu, ktorý môžete získať zadarmo spolu so skenerom. Dávkové skenovanie, kompetentné spracovanie tabuliek a obrázkov - pre to všetko sa oplatí zakúpiť profesionálnu verziu programu.

Všetky verzie FineReadera, od najjednoduchších po najvýkonnejšie, zdieľajú užívateľsky prívetivé rozhranie. Ak chcete spustiť proces rozpoznávania, stačí vložiť dokument do skenera a stlačiť jediné tlačidlo (Sprievodca skenovaním a čítaním) na paneli nástrojov programu. Program vykoná všetky ďalšie operácie - skenovanie, rozdelenie obrazu na „bloky“ a nakoniec aj samotné rozpoznávanie. Používateľ bude musieť iba nastaviť potrebné parametre skenovania.

Kvalita rozpoznania do značnej miery závisí od toho, ako dobrý sa obrázok získa počas skenovania. Kvalita obrazu sa reguluje nastavením základných parametrov skenovania: typ obrazu, rozlíšenie a jas.

Skenovanie v šedej farbe je optimálny režim pre rozpoznávací systém. Pri skenovaní v sivom režime sa automaticky vyberie jas. Ak chcete, aby sa farebné prvky obsiahnuté v dokumente (obrázky, farba písmen a pozadia) preniesli do elektronického dokumentu pri zachovaní farby, musíte zvoliť typ farebného obrázka. V opačnom prípade použite sivý typ obrázka.

Optimálne rozlíšenie pre bežné texty je 300 dpi a 400-600 dpi pre texty v malom písme (9 bodov alebo menej).

Po dokončení rozpoznávania stránok FineReader ponúkne používateľovi výber: skenovať a rozpoznávať ďalej (pre viacstranový dokument) alebo uložiť výsledný text v jednom z mnohých populárnych formátov – od dokumentov Microsoft Office po HTML alebo PDF. Môžete však okamžite preniesť dokument do Wordu alebo Excelu a opraviť tam všetky chyby rozpoznávania (bez toho sa to jednoducho nedá). FineReader zároveň plne zachováva všetky funkcie formátovania dokumentu a jeho grafický dizajn.

    Prečo potrebujeme programy na rozpoznávanie textu? Ako funguje rozpoznávanie textu? Aké programy na rozpoznávanie textu poznáte? Ktoré ste použili? Aké rozlíšenie je optimálne na skenovanie textu a obrázkov?

III. Praktická časť.
1. Práca s textovým prekladačom (riadok po riadku)
2. Teraz si precvičme prácu s programom ABBYY FineReader. Použijeme zjednodušenú verziu programu dodávaného so skenerom.

IV. Domáce úlohy
Vedieť, čo sú programy na automatický preklad textu, a vedieť s týmito programami pracovať. Ďalšia úloha: pripojte sa na internet a na preklad textu použite akýkoľvek online prekladač.
Vedieť, čo sú programy na rozpoznávanie textu, a vedieť s týmito programami pracovať. Ďalšia úloha: nainštalujte si doma program OCR a pripravte esej na ľubovoľnú tému. Text je rozpoznaný v OCR, úpravy a formátovanie sa vykonáva vo Worde.

V. Otázky študentov.
Odpovede na otázky študentov.

VI. Zhrnutie lekcie.
Zhrnutie lekcie. Klasifikácia.

Na hodine sme sa zoznámili s počítačovými prekladovými programami pre texty a naučili sme sa prekladať slová a text pomocou prekladateľského programu.

Počas hodiny sme sa zoznámili s OCR programami a naučili sme sa rozpoznávať naskenovaný obrázok pomocou programu ABBYY FineReader 5.0.

    Preložiť vety do ruštiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Informácie musia byť spoľahlivé, relevantné a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

    Programy inštrumentálneho systému uľahčujú proces vytvárania nových programov pre počítač.

    Univerzálnym zariadením spracovania informácií je počítač.

1. Preložte vety do angličtiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Informácie musia byť spoľahlivé, relevantné a užitočné.

2. Preložte vety do ruštiny:

    Učiteľov počítač je umiestnený na stole v rohu triedy.

    Programy inštrumentálneho systému uľahčujú proces vytvárania nových programov pre počítač.

    Univerzálnym zariadením spracovania informácií je počítač.

1. Preložte vety do angličtiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Informácie musia byť spoľahlivé, relevantné a užitočné.

2. Preložte vety do ruštiny:

    Učiteľov počítač je umiestnený na stole v rohu triedy.

    Programy inštrumentálneho systému uľahčujú proces vytvárania nových programov pre počítač.

    Univerzálnym zariadením spracovania informácií je počítač.

1. Preložte vety do angličtiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Informácie musia byť spoľahlivé, relevantné a užitočné.

2. Preložte vety do ruštiny:

    Učiteľov počítač je umiestnený na stole v rohu triedy.

    Programy inštrumentálneho systému uľahčujú proces vytvárania nových programov pre počítač.

    Univerzálnym zariadením spracovania informácií je počítač.

1. Preložte vety do angličtiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Informácie musia byť spoľahlivé, relevantné a užitočné.

2. Preložte vety do ruštiny:

    Učiteľov počítač je umiestnený na stole v rohu triedy.

    Programy inštrumentálneho systému uľahčujú proces vytvárania nových programov pre počítač.

    Univerzálnym zariadením spracovania informácií je počítač.

1. Preložte vety do angličtiny:

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

2. Preložte vety do ruštiny:

    Učiteľov počítač je umiestnený na stole v rohu triedy.

1. Preložte vety do angličtiny:

    Univerzálnym zariadením na spracovanie informácií je počítač.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Programy systémových nástrojov uľahčujú proces vytvárania nových počítačových programov.

2. Preložte vety do ruštiny:

    Informácie by mali byť autentické, aktuálne a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

1. Preložte vety do angličtiny:

    Univerzálnym zariadením na spracovanie informácií je počítač.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Programy systémových nástrojov uľahčujú proces vytvárania nových počítačových programov.

2. Preložte vety do ruštiny:

    1) Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Informácie by mali byť autentické, aktuálne a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

1. Preložte vety do angličtiny:

    Univerzálnym zariadením na spracovanie informácií je počítač.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Programy systémových nástrojov uľahčujú proces vytvárania nových počítačových programov.

2. Preložte vety do ruštiny:

    1) Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Informácie by mali byť autentické, aktuálne a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

1. Preložte vety do angličtiny:

    Univerzálnym zariadením na spracovanie informácií je počítač.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Programy systémových nástrojov uľahčujú proces vytvárania nových počítačových programov.

2. Preložte vety do ruštiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Informácie by mali byť autentické, aktuálne a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

1. Preložte vety do angličtiny:

    Univerzálnym zariadením na spracovanie informácií je počítač.

    Slovníky sú potrebné na preklad textov z jedného jazyka do druhého.

    Programy systémových nástrojov uľahčujú proces vytvárania nových počítačových programov.

2. Preložte vety do ruštiny:

    Operačný systém je zvyčajne uložený v externej pamäti počítača.

    Informácie by mali byť autentické, aktuálne a užitočné.

    Učiteľov počítač je umiestnený na stole v rohu triedy.

Prehľad produktov

S príchodom písma dostali ľudia mocný nástroj na uchovávanie vedomostí a na komunikáciu. Prvé spisy, ktoré sa k nám dostali na stenách chrámov a hrobiek, hovoria o skutkoch kráľov a generálov, ktoré sa odohrali pred mnohými storočiami. Okrem toho si ľudia zaznamenávali výsledky hospodárskej činnosti, aby mohli úspešne obchodovať, vyberať dane atď.

Na uľahčenie písomnej komunikácie medzi národmi boli vytvorené prvé slovníky.

Jeden z týchto slovníkov napísali sumerskí kňazi na hlinené tabuľky.

Každá tableta bola rozdelená na dve rovnaké časti. Na jednej strane bolo napísané sumerské slovo a na druhej slovo podobného významu v inom jazyku, niekedy so stručným vysvetlením. Od tých čias až do súčasnosti zostala štruktúra slovníkov prakticky nezmenená.

S príchodom osobného počítača sa začali vytvárať elektronické slovníky, ktoré uľahčujú hľadanie správneho slova a ponúkajú množstvo nových užitočných funkcií (vyslovovanie slova, vyhľadávanie synoným a pod.).

V poslednej dobe sa aktívne diskutuje o možnostiach a perspektívach technológií strojového prekladu (MT). Na diskusiách sa zúčastňujú profesionálni prekladatelia aj výrobcovia MT systémov. Skúsme zhodnotiť schopnosti MP, na základe skúseností z používania reálnych systémov.

Aby sme boli spravodliví, treba poznamenať, že strojová technika v dohľadnej dobe nedokáže úplne nahradiť ľudského prekladača. Pokiaľ ide o kvalitu prekladu, programy MP nemôžu konkurovať ľuďom. Pomocou takýchto programov však môžete výrazne zvýšiť efektivitu práce prekladateľa.

Na základe formálneho popisu jazykov program analyzuje text v jednom jazyku a potom syntetizuje frázu v inom jazyku. Algoritmy analýzy a syntézy sú spravidla pomerne zložité a sú riadené informáciami zo slovníka priradenými lexikálnym jednotkám v systémových slovníkoch pre jazyk zdrojového textu a jazyk jeho prekladu.

Kde sa používajú systémy MP? Po prvé, prekladateľské programy možno použiť na rýchly preklad textu, aby ste pochopili jeho význam.

Samozrejme, kvalita strojového prekladu sa nedá porovnávať s prekladom vykonaným osobou, ale používateľ dostane odpoveď „tu a teraz“. Okrem toho si pomocou systémov MP môžete prečítať informácie zverejnené na zahraničných webových stránkach, ako aj porozumieť textu odoslaného listu napísaného vo francúzštine, nemčine, japončine alebo inom jazyku.

Aké výhody prináša použitie MP systémov a kde je najvhodnejšie? MP systémy využívajúce na preklad spoločnú slovnú zásobu výrazne minimalizujú náklady na udržiavanie jednotnej terminológie a tým aj na redakčnú úpravu. V tomto prípade dostane technický redaktor zo systému MP preklad vyhotovený v rovnakom štýle. Využitie systémov strojového prekladu je teda najefektívnejšie na organizáciu technologického procesu prekladu veľkých polí podobných dokumentov v krátkom čase, čím sa zabezpečí jednotnosť terminológie a štýlu v celom rade dokumentov.

Možnosť využitia systému MP je daná jeho schopnosťou prispôsobiť sa prekladom dokumentov na rôzne témy. Kvalita výsledného prekladu do značnej miery závisí od nastavení. Okrem všeobecného lexikálneho slovníka by sa mali používať špecializované slovníky, ktoré reflektujú tak tému prekladu, ako aj špecifiká konkrétnych dokumentov. Okrem toho kvalita prekladov závisí od schopnosti prekladateľa vytvárať si vlastné slovníky, ktoré by mali obsahovať terminológiu špecifickú pre túto dokumentáciu, ako aj často sa vyskytujúce frázy/výrazy (mikrosegmenty), ktorých preklad nie je možné formálne.

Takéto nastavenie zaručuje kvalitu, pri ktorej sa používanie MT stáva efektívnym pri riešení „priemyselných“ prekladových problémov.

Na vyhodnotenie efektívnosti využívania systémov MP spoločnosť PROMT poskytla svoj systém PROMT 2000 Translation Office prekladateľskému centru LONIIS. Experiment ukázal, že použitie MP môže skrátiť celkový čas dokončenia projektu približne 2-krát.

Je potrebné poznamenať, že existuje množstvo obmedzení na používanie systémov MP. Nemá zmysel prekladať literárne texty, príslovia a porekadlá pomocou prekladateľského programu. Malé texty na rôzne témy sa tiež lepšie prekladajú tradičným spôsobom.

PROMT Translation Office 2000

PROMT Translation Office 2000 (ďalej len PROMT) s cenou 300 USD je sada profesionálnych nástrojov, ktoré poskytujú preklady z hlavných európskych jazykov do ruštiny a naopak. S jeho pomocou môžete nielen prekladať, ale aj upravovať preklad a súčasne pracovať so slovníkmi všetkých jazykových oblastí.

  • PROMT obsahuje nasledujúce zbierky slovníkov:
  • "Ľahký priemysel" (180 dolárov);
  • "Ťažký priemysel" (180 dolárov);
  • Obchod (99 dolárov);
  • veda (120 dolárov);

Na zabezpečenie vysokej kvality prekladu poskytuje systém PROMT možnosť konfigurácie prekladu konkrétneho textu – pripojením špecializovaných predmetových slovníkov, dodávaných samostatne, ako aj vytvorením vlastných slovníkov na mieru. Pohodlným prostriedkom nastavenia systému je aj možnosť výberu predmetu dokumentu: ktoré slovníky spájať, ktoré slová nechať bez prekladu a ako spracovať špeciálne konštrukcie ako emailová adresa, dátum a čas.

Systém PROMT obsahuje nasledujúce moduly:

  • PROMT - profesionálne prostredie pre preklad;
  • Dictionary Editor - nástroj na dopĺňanie a úpravu slovníkov systémov strojového prekladu rodiny PROMT;
  • Elektronický slovník PROMT je elektronický slovník, ktorý používateľovi poskytuje rozsiahly prístup k lexikálnym a gramatickým informáciám zozbieraným v špecializovaných slovníkoch rodiny PROMT. Dá sa použiť na akúkoľvek prácu s textami (napríklad na rýchle získanie informácií o prekladových ekvivalentoch daného slova alebo slovného spojenia);
  • WebView je prehliadač, ktorý vám umožňuje získať simultánny preklad HTML stránok pri navigácii na internete. WebView obsahuje dve okná na zobrazenie HTML stránok: horné zobrazuje pôvodnú stránku prijatú z internetu, spodné zobrazuje jej preklad, ukladanie odkazov, obrázkov, vložených objektov atď. Odkazy môžete sledovať ako v hornom okne so zdrojovým textom, tak aj v dolnom okne s prekladom;
  • SmarTool je nástroj, ktorý implementuje funkcie prekladu v aplikáciách Microsoft Office 97 (Word, Excel) a Microsoft Office 2000 (Word, Excel, PowerPoint, FrontPage, Outlook). Ponuka prekladu a panel nástrojov sú zabudované do všetkých hlavných aplikácií Microsoft Office 2000 a Microsoft Office 97, čo vám umožňuje získať preklad otvoreného dokumentu priamo v týchto aplikáciách;
  • QTrans je program určený na rýchly preklad neformátovaného textu. S jeho pomocou môžete jednoducho a rýchlo preložiť text, textový súbor alebo schránku (Clipboard). Na zlepšenie kvality prekladu si môžete vybrať vhodnú tému, pripojiť špecializované slovníky a rezervovať slová;
  • Clipboard Translator je program určený na rýchly preklad textu predtým skopírovaného do schránky. Text je možné skopírovať z ľubovoľnej aplikácie Windows (Pomocník, Poznámkový blok, Word, Word Perfect, PageMaker atď.);
  • „Integrátor“ je prostriedok na prístup ku všetkým aplikáciám balíka.

Preklad dokumentu v systéme PROMT

Označenie označuje aktuálny odsek zdrojového textu a preklad tohto odseku (aktuálny je ten, v ktorom je aktuálne umiestnený kurzor).

Všetky dokumenty, s ktorými program PROMT pracuje, sa zobrazujú v oknách dokumentov.

Súčasne môže byť otvorených niekoľko dokumentov – každý vo vlastnom okne (obr. 4,).

  • Hotový preklad je možné objasniť pomocou elektronických slovníkov vyvinutých inými spoločnosťami (samozrejme, ak sú nainštalované na vašom počítači).
  • Elektronické slovníky možno použiť:
  • Lingvo 6.0 (program ABBYY);
  • “Context 3.0” (program od spoločnosti Informatik);

"MultiLex 1.0, 2.0, 3.0" (program spoločnosti "MediaLingua");

Elektronický slovník PROMT 1.0 (program od PROMT).

Pri prekladoch systém PROMT nepoužíva elektronické slovníky iných výrobcov.

  1. Ak sa teda nejaké slovo nenachádza v systémových slovníkoch PROMT alebo nie ste spokojní s prekladom slova či frázy, môžete si vyvolať elektronický slovník a použiť ho ako referenciu.
  2. Prehliadač WebView je súčasťou balíka na preklad HTML dokumentov.
  3. Postupnosť akcií pri vykonávaní prekladu
  4. Otvorte súbor so zdrojovým textom alebo vytvorte nový dokument (nový text je možné zadať priamo v okne PROMT).
  5. Skontrolujte členenie textu na odseky (po preklade zostane formátovanie odsekov rovnaké).
    • Skontrolujte pravopis a v prípade potreby upravte zdrojový text.
    • Vyberte šablónu témy vhodnú na preklad daného textu (šablóna témy pre daný smer prekladu je sada slovníkov a zoznam rezervovaných slov; inštaluje sa na zlepšenie kvality prekladu).
    • Zadajte predmet dokumentu prispôsobením jeho komponentov:
    • pripojiť slovníky, ktoré budú použité pri preklade textu.
  6. Ak nie je pripojený žiadny slovník, na preklad sa použije iba všeobecný lexikálny všeobecný slovník;
  7. vyhradiť slová, ktoré by v prekladovom texte mali zostať v pôvodnom jazyku;
  8. pripojte preprocesor, ak chcete zrušiť preklad určitých štruktúr, ako sú e-mailové adresy, názvy súborov, a tiež zvoliť formu reprezentácie dátumu a času v texte prekladu;
  9. Uložte výsledky prekladu.

Systémové požiadavky

  • Počítač kompatibilný s IBM PC s procesorom P166 alebo vyšším;
  • 32 MB pamäte RAM;
  • približne 160 MB miesta na pevnom disku (pre systém so všetkými komponentmi);
  • Video adaptér SVGA alebo lepšie rozlíšenie;
  • Čítačka CD-ROM (na inštaláciu);
  • myš alebo kompatibilné zariadenie;
  • OS: Windows 98 (ruská verzia alebo celoeurópska verzia s podporou ruského jazyka a ruskými regionálnymi nastaveniami), alebo Windows NT 4.0 SP3 (alebo vyšší) s podporou ruského jazyka a ruskými regionálnymi nastaveniami, alebo Windows 2000 Professional (s podporou ruského jazyka a ruské regionálne nastavenia);
  • Microsoft Internet Explorer 5.x (je súčasťou dodávky).
  • Počítač kompatibilný s IBM PC s procesorom PII-300 alebo vyšším;
  • 64 MB RAM

Preklad dokumentu v systéme Socrates Personal

Hlavné okno programu je znázornené na obr. 6.

Keď ho prvýkrát spustíte, hlavné okno programu sa štandardne otvorí na karte „Prekladač“. Preklad textu napísaného v okne programu: zadaním textu do horného okna záložky „Prekladač“ a kliknutím na tlačidlo „Preložiť“ na paneli nástrojov alebo v ponuke „Preklad“ získate preklad textu v spodnom okne karty.

Ak chcete použiť slovník (obr. 7), stačí kliknúť na príslušnú kartu. Okno slovníka je navyše možné vyvolať pomocou klávesových skratiek.

Pomocou slovníka môžete získať preklad hľadaného slova nasledujúcimi spôsobmi:

  • Zadajte slovo do vstupného poľa v pravom hornom okne slovníka.
  • Navigácia v databáze slovníka sa vykonáva pri zadávaní písmen, kým sa nedosiahne maximálna možná zhoda;
  • prilepte slovo do vstupného poľa zo schránky. V tomto prípade sa vykoná rýchly prechod na slovo, ktoré sa najviac zhoduje so zadaným slovom;
  • vyberte predtým preložené slovo z okna histórie vstupného poľa, po ktorom sa vykoná rýchly prechod na slovo, ktoré má maximálnu možnú zhodu so zadaným slovom;
  • Vyberte slovo v inej aplikácii a podržte stlačený kláves Shift a kliknite pravým tlačidlom myši na výber. Preklad vybraného slova sa zobrazí v kontextovom okne;

použite kombináciu klávesových skratiek po umiestnení požadovaného slova do schránky.

Systém Socrates Personal 4.0 poskytuje možnosť pracovať s prekladačom a slovníkom v iných aplikáciách bez toho, aby ste ich opustili. Preklad sa vykonáva vo vyskakovacom okne.

Ak chcete získať preklad textu z inej aplikácie (napríklad textového editora), musíte vybrať text, ktorý chcete preložiť, a pri stlačenom klávese Shift kliknúť pravým tlačidlom myši na výber. Zobrazí sa vyskakovacie okno obsahujúce preklad vybraného fragmentu.

Ak chcete získať preklad slova z inej aplikácie, musíte vybrať slovo, ktoré vás zaujíma, a podržte stlačený kláves Shift a kliknite pravým tlačidlom myši na výber. Vyskakovacie okno, ktoré sa objaví, bude obsahovať preklad zvýrazneného slova.

Ak je to potrebné, z tohto okna môžete prejsť priamo na kartu „Slovník“ pomocou hypertextového prepojenia kontextového okna.

Systémové požiadavky

Minimálna konfigurácia počítača:

  • Počítač kompatibilný s IBM PC s procesorom Pentium 90 alebo vyšším;
  • Operačný systém Windows 98/Me alebo Windows NT/2000;
  • 32 MB pamäte RAM;
  • 16 MB voľného miesta na pevnom disku.

Výsledky testov pre PROMT Translation Office 2000 a Socrates Personal 4.0

Pre porovnanie kvality a rýchlosti prekladu oboch systémov bolo vybraných niekoľko fragmentov textov v ruštine a angličtine: jednotlivé frázy, novinky z firiem, pasáže z Biblie, Murphyho zákony, technické, medicínske, právne texty. Hodnotenia sa udeľovali na 10-bodovej škále. Potom sa uskutočnilo porovnanie výsledkov prekladu z angličtiny do ruštiny a naopak (tabuľka 1).

Je potrebné poznamenať, že PROMT Translation Office 2000 a Socrates Personal 4.0 sú produkty určené na riešenie rôznych problémov. PROMT Translation Office 2000 je profesionálny prekladateľský systém, ktorý umožňuje oveľa efektívnejšie prekladať veľké objemy informácií. Okrem toho systém PROMT správne implementuje gramatické pravidlá konkrétneho jazyka. Preto je kvalita prekladu veľmi vysoká. Nevýhodou systému PROMT sú vysoké nároky na hardvérové ​​prostriedky a značný čas prekladu pri pripojení viacerých prídavných slovníkov.

„Socrates Personal 4.0“ je automatický prekladový systém, ktorý vám pomôže rýchlo a jednoducho získať preklad nejasnej frázy alebo výrazu. Jeho hlavným účelom je byť vždy po ruke.

Preklad krátkeho písmena alebo frázy z textu pomocou Socrates Personal 4.0 je oveľa jednoduchší a rýchlejší ako používanie systému PROMT. Na preklad veľkého množstva textu je však vhodné použiť PROMT Translation Office 2000.

Lingvo 7.0

Lingvo 7.0 je výkonný profesionálny slovník, ktorý je veľmi užívateľsky prívetivý.

Stlačte klávesovú skratku v ľubovoľnej aplikácii Windows – a na obrazovke sa zobrazí najúplnejší preklad slova zo všetkých slovníkov pripojených k systému. Gramatické komentáre k ľubovoľnému slovu, výslovnosť najdôležitejších slov, kontrola pravopisu, možnosť vytvárať si vlastné slovníky – to všetko ponúka ABBYY Lingvo 7.0 (obr. 9). Lingvo 7.0 obsahuje viac ako 1,2 milióna slov a fráz v 18 všeobecných a špecializovaných slovníkoch.

Po spustení Lingvo sa na obrazovke objaví hlavné okno (obr. 10). Používateľ môže do vstupného riadku zadať požadované slovo. Počas písania bude program hľadať najvhodnejšie slovo. Stlačením klávesu Enter alebo ikony „Preložiť text“ sa používateľovi zobrazí okno so slovníkovým záznamom vybraného (nájdeného počas vyhľadávania) slova (obr. 11).

Ak čítate pomocnú časť programu, pracujete s textovým editorom, prehliadačom alebo akoukoľvek inou aplikáciou Windows, vyberte slovo alebo niekoľko slov v texte a stlačte Ctrl+Ins+Ins. Alebo jednoducho presuňte slovo do vstupného riadku. Tým sa aktivuje hlavné okno Lingvo a otvorí sa karta s prekladom zvoleného slova. Ak je takýchto kariet veľa, zobrazí sa okno „Preklad“ obsahujúce slová a frázy z požiadavky.

Ak chcete do upraveného textu vložiť preklad, vyberte preklad na karte a stlačte Ctrl+Ins. Prepnite sa do okna textového editora a vykonajte operáciu „Prilepiť“. Preklad môžete tiež presunúť do okna textového editora.

Pri preklade z ruštiny do angličtiny nie je zvýraznenie kombinácií a gramatických štruktúr ťažké a ak tieto kombinácie nie sú v slovníku, môžete okamžite prejsť na funkciu fulltextového vyhľadávania. Výsledky vyhľadávania vám umožňujú vyhodnotiť, ako sa výraz, ktorý vás zaujíma, prekladá na reálnych príkladoch.

Hlavné vlastnosti Lingvo:

  • preklad 1,2 milióna slov a fráz;
  • 18 všeobecných a odborných slovníkov (2 lekárske a 2 právnické slovníky v Lingvo 7.0 - nové);
  • moderná slovná zásoba;
  • volanie slovníka z ľubovoľnej aplikácie Windows;
  • dokonalý vyhľadávací systém;
  • 5 tisíc anglických slov vyslovil hlásateľ z Oxfordu;
  • schopnosť vytvárať si vlastné slovníky;
  • 23 bezplatných používateľských slovníkov na http://www.lingvo.ru/;
  • podrobné výklady a vysvetlenia používania slov;
  • moderné jazykové technológie;
  • nové aktualizované verzie všeobecných a špecializovaných slovníkov.

Systémové požiadavky

Minimálna konfigurácia počítača:

  • Počítač kompatibilný s IBM PC s procesorom Pentium 133 alebo vyšším;
  • operačný systém Windows 95/98/Me, Windows 2000/Windows NT 4.0 (SP3 alebo vyšší);
  • 16 MB RAM pre Windows 95/98/Me, 32 MB RAM pre Windows 2000/Windows NT 4.0;
  • od 85 do 265 MB voľného miesta na pevnom disku;
  • 3,5” mechanika a CD-ROM mechanika, myš;
  • Microsoft Internet Explorer 5.0 a vyšší (distribúcia ABBYY Lingvo 7.0 obsahuje Microsoft Internet Explorer 5.5 – jeho inštalácia si vyžiada ďalších 27 až 80 MB);
  • zvuková karta kompatibilná s operačným systémom; slúchadlá alebo reproduktory (odporúča sa).

Kontext 4.0

„Context 4.0“ je systém elektronických slovníkov, ktorý zahŕňa vyvinutý softvérový shell a rozsiahlu sadu slovníkov – všeobecných aj špecializovaných.

Kontextové slovníky sú obojsmerné. Program prekladá z jedného jazyka do druhého a späť bez akýchkoľvek špeciálnych nastavení. Hľadanie prekladu je možné vykonať vo všetkých slovníkoch zahrnutých v súprave, ako aj v konkrétnom slovníku. V tomto prípade je možné jednoducho zmeniť množinu aktívnych (zúčastňujúcich sa na vyhľadávaní) slovníkov, ako aj poradie ich vyhľadávania.

S „Kontextom“ môžete pracovať tak, že napíšete slovo alebo frázu, ktorá používateľa zaujíma, do špeciálneho vstupného poľa (obr. 12).

Je pohodlné pracovať s „Kontextom“ z aplikácií Windows. Preklad sa vykonáva metódou drag-and-drop alebo pomocou schránky. V nastaveniach môžete určiť klávesovú skratku alebo povoliť možnosť spustenia prekladu pri umiestnení textu do schránky.

Pre používateľov pracujúcich v editore MS Word bola implementovaná možnosť volať „Kontext“ zo samotného editora. Ak to chcete urobiť, kliknite na ikonu „Kontext“ umiestnenú na paneli nástrojov MS Word a používateľ nemusí v texte vyberať slovo alebo frázu. „Kontext“ preloží slovo, na ktorom je kurzor, a zároveň skontroluje niekoľko slov vpravo a vľavo, aby ste zistili, či nie sú súčasťou frázy.

„Kontext“ je na požiadanie používateľa doplnený o slovníky. Ak si používateľ zakúpil shell a nejaké slovníky, môže si zakúpiť akékoľvek ďalšie slovníky, ktoré potrebuje.

4. verzia Context má množstvo zaujímavých funkcií, ktoré v predchádzajúcich verziách neboli. Napríklad slovník hľadá čiastkové frázy.

V tomto prípade sa v okne prekladu zobrazia všetky frázy, ktorých koeficient relevantnosti vo vzťahu k hľadanému reťazcu je väčší ako zadaná prahová hodnota (obr. 13).

Pribudla nová funkcia rýchleho vytáčania (Fast Typing). Používateľ pri zadávaní slova dostáva rady podobných slov z aktuálneho slovníka s prihliadnutím na už zadané znaky (obr. 15). Potom môže používateľ vybrať zo zoznamu alebo pokračovať vo vytáčaní sám.

Nová verzia má možnosť pridávať a upravovať položky slovníka, vďaka čomu je systém slovníkov flexibilnejší. V predchádzajúcej verzii Context bola implementovaná možnosť práce s užívateľským slovníkom. Nová verzia programu Context umožňuje vytvárať viacero slovníkov a upravovať ich. Používateľské slovníky, štandardné slovníky a používateľské slovníky sú v systéme kontextového slovníka rovnaké. Formát používateľského slovníka je blízky formátu štandardného slovníka, teda bežného formátu knihy.

Článok môže obsahovať slová aj výrazy a príklady použitia slov ako súčasť stanovených výrazov a výkladu (

MultiLex 3.5

„MultiLex 3.5“ je elektronický slovník, ktorý obsahuje elektronické verzie známych tlačených slovníkov. Rôzne anglicko-ruské a rusko-anglické slovníky sa vyrábajú v prostredí „MultiLex 3.5 English“ (nový anglicko-ruský slovník od V.K. Mullera, anglicko-ruský/rusko-anglický slovník od O.S. Akhmanovej, rusko-anglický slovník vyd. . A.I. Plánuje sa vydanie technických, medicínsko-biologických, hospodársko-právnych a iných zbierok.

"MultiLex 3.5 English" umožňuje používateľovi postupne si vybrať optimálnu sadu slovníkov, ktoré budú spolupracovať.

  • Vlastnosti slovníka MultiLex:
  • pohodlie a jednoduchosť použitia;
  • vyjadrovanie veľkého počtu slovníkových hesiel;
  • rýchly prístup k dôležitým článkom: pomocou záložiek môžete označiť položky slovníka, ktoré sú pre vás dôležité, a potom k nim priamo pristupovať;
  • funkcia „rýchla voľba“ - pri písaní slova sa zobrazí zoznam podobných slov, z ktorých si používateľ môže vybrať slovo na preklad bez zadávania celého slova;
  • preklad slova alebo frázy a prenos výsledkov prekladu do aplikácie Windows pomocou schránky alebo presunutia myšou;
  • zadávanie poznámok: pri spolupráci je dôležité zachovať jednotnú terminológiu.

Tu prichádza na pomoc mechanizmus poznámok - môžete si písať vlastné poznámky pre ľubovoľný záznam v slovníku;

užívateľský slovník.

Ľavý panel obsahuje zoznam nadpisov článkov daného slovníka, ktorý sa zobrazuje na paneli slovníka pomocou ikony v podobe otvorenej knihy (používa sa na zobrazenie nadpisov hesiel slovníka). Pravý panel vždy zobrazuje položku slovníka zodpovedajúcu názvu zvýraznenému v pravom paneli. Slovníkové heslo sa začína názvom, za ktorým nasleduje jeho prepis. Ďalej je označená časť reči, sú uvedené možné preklady, vysvetlenia a príklady.

Panel slovníka vám umožňuje vybrať požadovaný slovník. Každý slovník má svoju vlastnú ikonu, ktorá má tri rôzne stavy: zatvorená kniha, polootvorená kniha alebo otvorená kniha. Tvar ikon ukazuje, ktorý slovník je práve otvorený a v ktorých slovníkoch posledné vyhľadávanie niečo našlo.

Ak je na ikone slovníka zobrazená otvorená kniha (poznámkový blok) – tento slovník je teraz otvorený, pootvorená kniha (poznámkový blok) – tento slovník nie je momentálne otvorený, ale obsahuje informácie relevantné pre vašu požiadavku, a ak ikona zobrazuje zatvorený kniha (poznámkový blok) - tento slovník je uzavretý a neobsahuje informácie, ktoré potrebujete.

V júli 2001 bola vydaná nová verzia slovníka „MultiLex 3.5 English Popular“ (anglicko-ruský, rusko-anglický slovník všeobecnej slovnej zásoby vydaný O.S. Akhmanovou a E.A.M. Wilsonom). Obsahuje viac ako 40 tisíc slovníkových hesiel.

Verzia 3.5 má množstvo výhod, ktoré v predchádzajúcej verzii nenájdete:

  • možnosť dodatočnej inštalácie slovníkov. Zakúpením akéhokoľvek anglického slovníka (verzia nie nižšia ako 3.5) ho môžete jednoducho integrovať do svojho MultiLexu. Plánuje sa vydanie technických, medicínsko-biologických, hospodársko-právnych a iných zbierok;
  • pop-up preklad. MultiLex 3.5 poskytuje podporu pre preklad pomocou klávesových skratiek z ľubovoľnej aplikácie, ktorá podporuje schránku. Ak to chcete urobiť, jednoducho zvýraznite slovo, stlačte príslušný funkčný kláves (štandardne F10) - a na obrazovke sa zobrazí okno prekladu. Preklad v okne je hypertextový odkaz. Ak potrebujete úplnejšie informácie o slove, ktoré vás zaujíma, kliknite na ľavé tlačidlo myši a vyvolajte „MultiLex“ s hotovými možnosťami prekladu požadovaného slova. Vyskakovacie okno prekladu je možné nainštalovať nad všetky okná výberom príslušnej položky v kontextovej ponuke, ktorá sa sprístupní po kliknutí pravým tlačidlom myši na ikonu „MultiLex“ (v pravom dolnom rohu obrazovky). Podobnú funkciu vykonáva tlačidlo na ľavej strane okna „vyskakovacieho prekladu“. Pomocou tohto tlačidla môžete „pripnúť“ výsledný preklad kdekoľvek na obrazovke;
  • Zvuková karta kompatibilná s operačným systémom, slúchadlami alebo reproduktormi (odporúča sa).

Obnoviť

Na záver pár slov o osobných skúsenostiach s používaním systémov strojového prekladu a slovníkov.

Pred tromi rokmi som pomocou systému strojového prekladu pripravil správu pre západného zamestnávateľa. Niekoľko ľudí, ktorí sa podieľali na offshore programovaní, napísalo program pre navigačný prijímač. Bohužiaľ, len málo ľudí zo skupiny hovorilo dostatočne anglicky na to, aby opísali výsledky svojej práce v jazyku zákazníka.

V tejto súvislosti bolo potrebné preložiť správy zostavené v ruštine. Vtedy ma napadla myšlienka vyskúšať systém strojového prekladu Stylus (tak sa volali prvé verzie systémov PROMT). Tento pokus dopadol veľmi úspešne: 140-stranový dokument som preložil trikrát rýchlejšie, ako som plánoval. Samozrejme, preklad vykonaný programom nebol dokonalý. Musel som to veľa a dlho upravovať. Ale zisk je zrejmý.

Odvtedy pri prekladoch textov nad 10 strán vždy používam systémy strojového prekladu.

S elektronickými slovníkmi som sa zoznámil ešte skôr, keď som mal potrebu čítať zahraničné knihy a časopisy z technických odborov so špecifickou slovnou zásobou. Technické elektronické slovníky, slovníky z oblasti telekomunikácií a informatiky mi umožnili ušetriť veľa času a úsilia. Ďakujem Lingvo!

Dúfame, že môj príbeh o nových systémoch strojového prekladu a slovníkoch vám pomôže efektívne si zorganizovať prácu a v konečnom dôsledku dosiahnuť úspech.

Redakcia ďakuje za pomoc pri príprave článku: Alexandra Andreeva, spoločnosť PROMT; Andrey Sokolov, informatická spoločnosť; Anastasia Savina, spoločnosť ABBYY;

Konstantin Konin a Natalya Talpa, spoločnosť MediaLingua; Alexey Bukhanov, spoločnosť Arsenal.

ComputerPress 9"2001

×
Pripojte sa ku komunite „koon.ru“!
VKontakte:
Ľalie