Korektor grešaka u kucanju

Za korektor grešaka u kucanju verovatno svi znate i koristite ga. S obzirom na to da je na primer u uređivaču teksta MS Word, tabelarnom programu Excel, programu za prezentacije PowerPoint, programu za prelom teksta Adobe InDesign ili grafičkom programu Photoshop za neke od jezika integrisano upravo rešenje firme Lingea, možda ste čak i vi naši zadovoljni korisnici.

Jezički deo

Struktura rečnika je osnovana na obimnom formalnom opisu morfologije i na detaljnom sistemu paradigmi. Ovaj opis omogućava da se od jedne osnove reči generišu čak desetine izvedenih oblika, npr. u srpskim rečima
voleti: voleti, volim, voliš, volimo, voleo, volela, voleli, voljen, voljena, voljenog...
brat: brat, brata, bratu, brate, bratom, braća, braćom, bratova, bratovo, bratovi, bratov, bratovim...

Bogatu fleksiju imaju pre svega slovenski jezici, no i u romanskim jezicima glagoli imaju mnogo raznih oblika, npr. u francuskom
parler: parle, parles, parlons, parlez, parlent, parlais, parlait, parlions, parliez, parlaient, parlerai, parlé, parlant...

U ruskom opet treba uzeti u obzir povratne zamenice koje se pišu zajedno sa nekim oblicima glagola:
жениться: женюсь, женишься, женится, женись, женилась, женились...
Slična je situacija u španskom gde se zajedno sa glagolom mogu pisati lične zamenice: (poner->ponlo, decir->dime, escuchar->escúchala)

Ekstremne dimenzije dostiže fleksija mađarskog, finskog ili turskog gde se reči grade pomoću nastavaka. Mađarski pored dva broja razlikuje čak 25 padeža i dve vrste prisvajanja (objektu i licu).
ház: házak, házat, háznak, házzal, házig, házé, házéi, házaké, házakéi, házamé, házadé, házáé...

Sve reči koje grade izvedene oblike na isti način spadaju u istu paradigmu, dakle, svaki rečnik se sastoji od dva dela:
lista paradigmi: sadrži lingvističke podatke o građenju oblika, alternacijama korena i opis gramatičkih kategorija
lista osnova: sadrži osnovni fond reči datog jezika i podatke o primeni pojedinih paradigmi za fleksiju pojedinih reči

Opis morfologije jezika na gore navedeni način pored reči sa pravilnom promenom obuhvata i i reči:
s alternacijama u korenu (npr. srp. pas->psa, nem. Bruder->Brüder)
s potpunom promenom osnove (npr. engl. go->went, nem. essen->isst, srp. čovek->ljudi)
nepravilne glagole (biti, jesti, hteti)

Princip opisa jezika je toliko uopšten da omogućava izradu rečnika ne samo za slovenske jezike poput srpskog, nego i za druge evropske jezike. Može lako da savlada npr. povratne glagole u ruskom, perifrastičnu komparaciju u engleskom ili poljskom, sažete oblike u francuskom, odvojive prefikse u nemačkom, spajanje glagolskih oblika sa zamenicama u španskom ili gomilanje nastavaka u ugro-finskim jezicima.

Programsko rešenje

 

S obzirom na efikasan algoritam za komprimaciju i generisanje rečnika, programski interfejs je dosta kratak, dakle lako upotrebljiv u bilo kojem softverskom proizvodu.

Dostupne funkcije

  • Provera da li se data reč nalazi u rečniku. Ova funkcija kontroliše i pravilnu upotrebu velikog slova na početku reči (Beograd, Marija, Ajzenhauer...), velikih slova u celoj reči (SAD, UNESCO) ili završetak reči tačkom (itd., tzv.).
  • Ponuda ispravaka: generiše sve reči od kojih je data reč mogla da nastane greškom u kucanju.
  • Upravljanje korisničkim rečnicima ili specijalnim rečnicima za automatsku zamenu pogrešnih reči.
  • Podešenje parametara, npr. ignorisanje akronima, reči koje sadrže samo jedno slovo, reči koje sadrže brojke i sl.

Trenutno nudimo kontrolu tipfelera za široki spektar jezika (vidi tabelu), implementiranu na većini platformi (vidi pregled).

Reference

Funkcionalnost i brzinu našeg rešenja možete da proverite npr. u programima Microsoft Office od verzije 95, u uređivačima teksta (Corel WordPerfect), sistemima za prelom teksta (Adobe InDesign), OCR programima, CMS sistemima (češke dnevne novine MF Dnes) i npr. u programima firmi Autodesk i Siemens.