Forme flexionare

Scriu rar, dar am mereu ceva important de spus ­čÖé

Ast─âzi am lansat componenta Dex Flex (numit─â ┼či Flex online, ├«nc─â nu ne-am hot─âr├ót asupra unui nume). Aceast─â component─â permite, deocamdat─â:

  • Consultarea formelor flexionare ale oric─ârui cuv├ónt al limbii rom├óne (conjugarea verbelor, declinarea substantivelor, adjectivelor ┼či pronumelor). Pe fiecare pagin─â de rezultate, exist─â un link numit „Flexiuni”. ├Äncerca┼úi-l cu n─âdejde!
  • C─âutarea unui cuv├ónt dup─â o form─â flexionar─â, nu neap─ârat dup─â cea de baz─â (verze).
  • Navigarea ├«ntre defini┼úii printr-un click pe orice cuv├ónt din cadrul oric─ârei defini┼úii. Mecanismul func┼úioneaz─â pentru orice cuv├ónt din orice defini┼úie. Nu mai este nevoie ca moderatorii s─â insereze manual trimiteri pentru cuvintele-cheie dintr-o defini┼úie.
  • Afi┼čarea accentelor ├«n formele flexionare. Deocamdat─â la acest capitol avem doar informa┼úii par┼úiale, dar chiar ┼či a┼ča, un procent semnificativ din formele flexionare con┼úin ┼či informa┼úii despre accent.

Motivul pentru care acest proiect a fost considerabil de dificil este că limba română, spre deosebire de alte limbi (în special engleza) nu se pretează la derivare regresivă (stemming). Dându-se un cuvânt în engleză (shining), este de obicei simplu de aflat forma de bază a cuvântului (shine). În română, dându-se un cuvânt (de exemplu perilor sau străzi), de obicei este imposibil de dedus automat forma de bază (păr sau stradă), deoarece pentru orice regulă găsită există un număr mare de excepţii.

Am optat pentru metoda invers─â: derivarea complet─â a tuturor cuvintelor ┼či stocarea tuturor formelor flexionare ale limbii rom├óne. Pentru aceasta, aveam nevoie de o catalogare a cuvintelor dup─â modul ├«n care se declin─â / conjug─â. De exemplu, cuvintele cas─â, art─â ┼či sonat─â se declin─â la fel (form├ónd pluralul ├«n -e), iar cuvintele via┼ú─â, var─â ┼či iarn─â se declin─â ├«n alt fel (form├ónd pluralul ├«n -i ┼či suferind ┼či transformarea a/e la plural: iarn─â/ierni).

Aceast─â clasificare a fost f─âcut─â pentru prima oar─â ├«n 1981 de Alf Lombard ┼či Constantin G├ódei ├«n Dictionnaire morphologique de la langue roumaine. Matei Gall ┼či Octavian Mocanu de la Federa┼úia Rom├ón─â de Scrabble (care are nevoie de o list─â a formelor flexionare acceptate la jocul de scrabble) au construit ├«n continuarea DMLR, perfec┼úion├ónd ┼či extinz├ónd lista de modele. Aceast─â list─â are acum circa 770 de modele de flexionare. Unele din aceste modele acoper─â mii de cuvinte, iar altele au un singur reprezentant. De exemplu, mai toate participiile verbelor se declin─â la fel (ap─ârut, l─âb─âr┼úat, irizat), dar verbe ca a fi ┼či a avea sau substantive ca staroste ┼či sombrero nu seam─ân─â cu nimic altceva. A┼ča a rezultat LOC4, Lista Oficial─â de Cuvinte admis─â la jocul de scrabble.

Radu Borza ┼či cu mine ne-am ocupat de importarea LOC4 ├«n DEX online. ┼×i acest pas are capcane. Modelele din LOC4 sunt listate desf─â┼čurat, dar a fost treaba noastr─â s─â scriem cod care s─â examineze formele flexionare, s─â ├«┼či dea seama ce se schimb─â fa┼ú─â de forma de baz─â, s─â extrag─â aceste transform─âri ┼či s─â le aplice altor cuvinte etichetate cu acela┼či model. De exemplu, modelul F62 este strad─â, cu pluralul str─âzi. Programul compar─â cele dou─â forme ┼či extrage transform─ârile aÔćĺ─â, dÔćĺz ┼či ─âÔćĺi. C├ónd ├«nt├ólne┼čte un alt cuv├ónt etichetat cu F62, ca gard─â, nad─â sau ograd─â, programul aplic─â aceste transform─âri pentru a ob┼úine formele corecte de plural g─ârzi, n─âzi sau ogr─âzi.

Importarea LOC4 este numai un pas de pornire. Afi┼čarea conjug─ârilor verbelor sau navigarea ├«ntre defini┼úii cu un singur click sunt aplica┼úii interesante care decurg cu un minim de efort din LOC. Dar orizonturile de abia acum se deschid c─âtre alte aplica┼úii ┼či mai utile:

  • Setul de forme flexionare este probabil cel mai complet de p├ón─â acum, el put├ónd fi folosit de aplica┼úii ca OpenOffice pentru a verifica ortografia unui document scris ├«n limba rom├ón─â.
  • C─âutarea prin ├«ntreg corpul defini┼úiilor, nu doar prin cuvintele cheie. Aceast─â aplica┼úie era posibil─â ┼či mai ├«nainte, folosind simple c─âut─âri de sub┼čiruri. Dar, de exemplu, o c─âutare a ┼čirului carte este inutil─â dac─â defini┼úia con┼úine textul c─âr┼úi. Av├ónd informa┼úiile despre flexiune, putem indexa baza de date ┼či c─âuta un cuv├ónt indiferent ├«n ce caz/num─âr/timp/persoan─â se afl─â.
  • Verificarea ├«nchiderii tranzitive a bazei de date a DEX online. Acum putem semnaliza orice defini┼úii care folosesc cuvinte care nu sunt la r├óndul lor definite ├«n DEX online, precum ┼či defini┼úiile circulare. ┼×tim sigur c─â acest gen de erori exist─â, pentru c─â le-am preluat din DEX. ­čÖé De exemplu, exist─â multe perechi de cuvinte care se definesc prin referin┼ú─â unul la altul, f─âr─â ca vreunul din ele s─â enun┼úe ┼či o defini┼úie propriu-zis─â.

Este greu de f─âcut o estimare, dar eu sunt de p─ârere c─â, atunci c├ónd toate aceste func┼úii vor fi implementate, proiectul Dex Flex va avea un impact la fel de mare ┼či va fi la fel de util ca ┼či baza de defini┼úii ├«n sine.

Evident, toate datele ad─âugate ast─âzi la Dex online pot fi copiate ┼či redistribuite, ca ┼či restul bazei de date, sub Licen┼úa Public─â General─â GNU.

Close Menu