Definiții structurate – un exemplu

Structurarea definițiilor ne duce de la

la

Mai avem mult de lucru până să fie gata. Nu în ultimul rând, mai avem de lucru la prezentarea vizuală a diferitelor componente, la adăugarea de exemple și la reconcilierea diferendelor între dicționare asupra anumitor sensuri. Dar, dacă avem ceva, de 15 ani încoace, este muuuultă răbdare. 🙂

Structurarea definițiilor

În prezent, definițiile din dexonline sunt stocate ca simple bucăți de text, cu marcaje pentru text aldin, italic sau alte formatări. De exemplu, definiția pentru föhn:

FÖHN, (2) föhnuri, s. n. 1. Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. 2. Uscător electric pentru păr. [Pr.: fön] – Din fr. foehn, germ. Föhn.

este reprezentată, în baza noastră de date, ca:

@FÖHN,@ (@2@) $föhnuri,$ #s. n.# @1.@ Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. @2.@ Uscător electric pentru păr. [#Pr.#: $fön$] – Din #fr.# @foehn,@ #germ.# @Föhn.@

Structurarea implică și ierarhizarea sensurilor

Acest format este simplu de folosit, dar are un dezavantaj. Componentele definiției sunt toate de-a valma: sensurile, subsensurile, pronunția, silabisirea, morfologia (conjugările de verbe și declinările de substantive), etimologia (originea cuvântului) etc. Lipsa structurării limitează utilitatea bazei noastre de date, căci unele analize sunt greu sau imposibil de făcut. De exemplu, nu este ușor să găsim toate cuvintele care se pronunță altfel decât se scriu, sau toate cuvintele care provin din limba germană.

De aceea, am demarat (de ceva vreme) un efort de structurare a definițiilor, adică de separare și clasificare a tuturor proprietăților sus-menționate. Nu știm sigur cât va dura acest efort; probabil câțiva ani. Nouă ni se pare un proiect foarte interesant. Poate și vouă? În orice caz, vă vom ține la curent ocazional cu evoluția procesului de structurare.

Pentru astăzi, etichetele pe cuvinte. Unele informații sunt relativ ușor de extras automat. Majoritatea verbelor din dexonline sunt acum etichetate cu informații despre grupă și conjugare:

  • a onora este verb de grupa I, conjugarea a II-a;
  • a părea este verb de grupa a II-a, conjugarea a VIII-a.
Am procedat similar și pentru alte părți de vorbire (cu oarece erori):
  • muncitor este adjectiv sau substantiv masculin și feminin;
  • aferim este interjecție.
În timp, vom adăuga și alte etichete de interes pe cuvinte, în special cele din registrul stilistic (familiar, popular, ironic ș.a.m.d.). De exemplu, zbenghi este un substantiv familiar și popular.

Rezultatele chestionarului pentru noul design dexonline

Acum două săptămâni (30 august 2016) lansam primul chestionar organizat pentru dexonline, menit să strângă părerile utilizatorilor despre noul design, lansat în luna august.

Rezultatele pe scurt

1. Ce părere ai despre noul design dexonline.ro?

2. Ce îți place la noul design dexonline.ro?

Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • simplitatea
  • aspectul mai modern, adaptat smartphone-urilor
  • interfața mai aerisită
  • fonturile mai mari, mai ușor de citit
3. Ce îți displace la noul design dexonline.ro?
Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • banner-ul și dimensiunea acestuia*
  • bara de căutare prea lungă
  • logo-ul dexonline*
  • lățimea prea mare a conținutului paginii, pe desktop
* elemente care existau și înainte pe site (nu țin de noul design), dar participanții au simțit nevoia să profite de această ocazie pentru a-și exprima opinia. Mulțumim pentru sinceritate!
4. Ai recomanda dexonline.ro unui prieten/membru de familie?
5. Ce funcții anume folosești cel mai des pe dexonline.ro? (bifează toate opțiunile care ți se aplică)

Reamintesc că opțiunile disponibile aici erau (în ordinea în care apar și în grafic):
  • căutarea definiției unui cuvânt
  • Cuvântul zilei
  • Cuvântul lunii
  • Cuvânt aleator
  • Jocuri (spânzurătoarea, moara cuvintelor)
  • verificare pentru Scrabble
  • Articolul lunii
  • Articole lingvistice
  • Ghid de exprimare
  • Contribuie cu definiții
  • Informații pentru programatori
6. Dacă ai descoperit vreun bug în noul design, care este acela?
Întrebare opțională, la care au fost semnalate două bug-uri. Promitem să investigăm.
7. Cât de des folosești dexonline.ro?


8. Dacă dorești să participi și la alte studii legate de dexonline.ro, te rugăm lasă-ne adresa ta de e-mail (nu vei fi abonat la newslettere, nu vei primi spam din partea noastră).

Întrebare opțională, la care aproximativ o treime din participanți s-a arătat disponibilă pe viitor.

Ce am învățat din acest chestionar?

În primul rând, am aflat care sunt cele mai folosite funcții de pe dexonline – ele vor avea prioritate la dezvoltare/îmbunătățire pe viitor. Pe de altă parte, rămâne ca temă de studiu pentru viitor de ce restul funcțiilor sunt atât de puțin folosite (prea puțin vizibile în interfață? utilitate scăzută pentru vizitatorul de rând? ar merita „pensionate” o parte din ele? etc).
Am aflat ce elemente le displăceau utilizatorilor și înainte de noul design. O parte dintre ele pot fi schimbate (logo-ul în format SVG, de exemplu), altele (nuanța de roșu, de exemplu) țin de branding-ul dexonline și nu vor fi schimbate în viitorul apropiat (rebranding-ul nu este în plan pentru acest proiect).
Am aflat ce elemente le displac utilizatorilor odată cu trecerea la design responsive (interfață adaptabilă la lățimea disponibilă a ecranului, în funcție de dispozitivul de pe care vizitezi: desktop, tabletă, mobil). Avem de retestat anumite elemente pe ecranele foarte mari (peste 1200px lățime).
Design-ul nou a avut în general un feedback pozitiv, mai exact 76.22% dintre participanți sunt de părere că schimbările sunt binevenite. Deși design-ul actual nu diferă foarte mult de cel anterior (nici nu am dorit o tranziție bruscă), pentru oamenii obișnuiți cu interfețe minimaliste schimbarea a fost evidentă; am renunțat la efectul de umbră pentru multe elemente, am introdus mai mult alb drept culoare de fundal, am spațiat mai bine elementele de pe pagina principală. Mai avem de lucru la pagina definițiilor, unde (și noi) și utilizatorii consideră că e nevoie de mai multă structurare.
Faptul că aproape 3 sferturi dintre utilizatorii noștri folosesc dexonline foarte des (zilnic sau de câteva ori pe săptămână) este dovada că munca noastră nu este în zadar, ci chiar necesară.

Relevanța statistică a acestui chestionar

Pasionații de statistică își vor pune întrebarea: În ce măsură aceste rezultate reprezintă întreaga populație de utilizatori dexonline (peste 2 milioane de vizitatori unici pe lună)?

Noțiuni de statistică folosite:
  • marja de eroare descrie cât de aproape este răspunsul eșantionului folosit de valoarea reală a populației. Cu cât marja de eroare este mai mică, cu atât mai aproape suntem de răspunsul exact care ar fi fost măsurat la nivelul întregii populații. În general, cu cât eșantionul este mai mare, cu atât marja de eroare este mai mică.
  • intervalul de încredere ne spune dacă măsurătoarea noastră este de încredere; un interval de încredere de 95% înseamnă că dorim să fim 95% siguri de rezultate și că acceptăm să fi greșit în 5% din cazuri; dacă am repeta acest chestionar de 100 de ori în aceleași condiții, atunci în 95 chestionare am obține rezultate care se încadrează în marja de eroare aleasă.
În cazul nostru, pentru o populație de fix 2.000.000 utilizatori unici lunari, cu un interval de încredere de 95% și un eșantion de 143 participanți, marja de eroare rezultată este de 9% (calculator aici).
Se putea mai bine, se putea mai rău. Sperăm ca la următorul studiu să reușim să mobilizăm mai mulți participanți.

dexonline are un nou design

„Good news, everyone!”, cum ar spune profesorul Farnsworth din serialul Futurama. dexonline are un nou design, mai modern, începând din august 2016.

Vechiul design data din toamna lui 2011 și avea câteva lipsuri: interfață diferită pe desktop versus mobil, ascunderea multor funcții pe interfețele de mobil datorită ecranului mai mic disponibil, mult CSS personalizat care îngreuna contribuirea cu cod etc. Aceste lipsuri nu mai puteau fi ignorate, mai ales în contextul unui trafic mereu în creștere de pe dispozitive mobile.

Părerea voastră contează

Dacă am putea crea din prima un design perfect, atunci cel mai probabil că ne-am culca pe o ureche și nu am mai dezvolta nimic pe viitor pentru dexonline. Diferența dintre platforma noastră și clonele legale ale dexonline (există mai mult de o duzină) este că noi dezvoltăm în permanență acest proiect, adăugând funcții noi sau îmbunătățindu-le pe cele existente.

Scopul nostru nu este să avem un site „care merge și pe care ai unde posta un banner pentru reclame”, scopul nostru este să contribuim activ și constant la învățarea limbii române, o limbă pentru care există prea puține unelte lingvistice online (spre deosebire de limba engleză, de exemplu).

De aceea părerea voastră, a utilizatorilor dexonline, contează pentru noi.
Dacă doriți să ne împărtășiți părerea voastră despre noul design, vă rugăm accesați următorul chestionar http://bit.ly/2bSiXBd (chestionarul va fi deschis pentru o perioadă limitată de timp).

Ce am urmărit cu noul design?

Pentru utilizatorii de rând:

  • în primul rând, crearea unei singure interfețe, unitare, indiferent de dispozitivul electronic folosit pentru vizitarea dexonline (design responsive); această schimbare aduce cu sine folosirea mai eficientă a ecranului pentru dispozitive medii (tablete) și mici (smartphone-uri), precum și eliminarea barei orizontale de scroll pe anume ecrane (inestetică); 
  • afișarea pe mobil a tuturor funcțiilor prezente pe desktop, în special a jocurilor (cine nu dorește să acceseze de pe mobil un joc, când ai câteva minute de pierdut în trafic sau în alt moment al zilei?); 
  • la capitolul „pagina principală”, vechiul design afișa pe mobil doar „Cuvântul zilei”, ceea ce făcea site-ul mult mai puțin atractiv pentru internauții mobili (al căror număr este în creștere de la un an la altul); 
  • afișarea întregului meniu de navigare (vechiul design oferea o variantă mult redusă a acestuia), foarte utilă pentru utilizatorii noi ai dexonline, care nu cunosc bine proiectul și nici funcțiile oferite de această platformă; 
  • o interfață mai modernă, mai minimalistă, care sperăm să fie și mai ușor de folosit (așteptăm părerea voastră în această privință prin intermediul chestionarului de mai sus). 

Pentru programatori:

  • folosirea Bootstrap, o arhitectură foarte populară de CSS/Javascript care ușurează foarte mult scrierea de cod nou și mentenanța codului existent, asigurând totodată și mai multă consecvență pe partea de frontend; 
  • reducerea volumului de cod personalizat CSS, care de asemenea contribuie la consecvență și ușurință în dezvoltare. 

Mulțumiri și pe această cale voluntarilor care au lucrat la noul design: David Bătrânu, Cătălin Frâncu și Sonia Frâncu.

Despre DLRLC și dexonline

    Acest text a fost scris de Laura Gellner, cel mai vechi voluntar al nostru, la rugămintea noastră de a ne spune opinia ei despre ultimul dicționar introdus și finalizat.

    Din anul 2002 ajut la îmbogățirea cu definiții a acestui minunat proiect – dexonline – realizat de un grup de tineri inimoși dar și curajoși, proiect  care acum, după atâția ani a ajuns să fie un instrument de lucru pretutindeni în țară și chiar și peste hotare. Pe atunci dexonline avea cam 25.000 de cuvinte definite, acum acesta are aproape 700.000 și continuă mereu să crească.

    Proiectul a adunat deja și continuă să mai adune numeroase dicționare de prestigiu românești, realizate de-a lungul timpului; a început cu Dicționarul explicativ al limbii române și ultimul dicționar introdus este Dicționarul limbii române literare contemporane (DLRLC) apărut în 1955-1957. Pe mine m-a atras în mod deosebit acest DLRLC, interesant prin exemplificările cu texte literare din literatura studiată în școală în anii copilăriei mele.

    Mi s-a întâmplat de multe ori, în timp ce introduceam definiții din acest dicționar, să redau în scris astfel de texte literare, ajungând la capătul lor fără să mai urmăresc originalul din care le extrăgeam. Acestea îmi veneau în minte automat, fără nici un fel de efort și fără să le fi repetat de-a lungul anilor (NB  nu mă refer, bine-nțeles la exemplele de texte din publicațiile politice ale vremii; altfel, pe atunci, nu era posibil). Dar Eminescu, Creangă, Vlahuță, Ispirescu, Hasdeu și… și… și… rămăseseră în mintea mea, și asta m-a bucurat mult.

    Admir în continuare munca celor ce au inițiat și condus acest proiect,  muncă ce merită să se bucure de mult, de foarte mult respect.

Dicționarul limbii române literare contemporane (1955-1957)

    Acum aproape un an și jumătate dexonline a început lucrul la dicționarul care avea să devină cel mai mare proiect al dexonline: Dicționarul limbii române literare contemporane (DLRLC), care este aproape dublu ca număr de caractere față de DEX, deși are „doar” 50.000 de definiții față de cele aproape 70.000 ale DEX-ului. Diferența provine din numărul mare de citate pe care le oferă acest dicționar în cele 4 volume ale sale, fiind printre puținele dicționare care oferă citate (doar Dicționarul de Cuvinte Recente mai intră la această categorie). În mod cert ne ajută mult în studierea istoriei limbii române și ne poate spune cît de mult a evoluat limba în ultimii 60 de ani! Probabil că acest dicționar va rămîne în frunte pînă cînd vom începe (și finaliza) digitizarea Dicționarului Tezaur al Limbii Române.
    Cum fără voluntarii noștri „de serviciu” – Laura și Laurențiu – nu am fi reușit nimic și cum proiectul a fost unul de lungă durată, ne-am dorit să le dăm cuvîntul:

Iată ce spune Laurențiu:

Proiectul DLRLC s-a derulat pe parcursul a 16 luni. Împreună cu Laura am editat un dicționar important pentru aprofundarea cuvintelor limbii române prin intermediul citatelor din opere literare. De asemenea și echipa logistică ne-a ajutat în această perioadă. Editarea lui a implicat un efort zilnic și, în final, sper să fie de folos tuturor iubitorilor de limba și literatura română.

Laura a scris mai multe, dar iată esențialul:

Pe mine m-a atras în mod deosebit acest DLRLC, interesant prin exemplificările cu texte literare din literatura studiată în școală în anii copilăriei mele. […] Mi s-a întâmplat de multe ori, în timp ce introduceam definiții din acest dicționar, să redau în scris astfel de texte literare, ajungând la capătul lor fără să mai urmăresc originalul din care le extrăgeam. Acestea îmi veneau în minte automat, fără nici un fel de efort și fără să le fi repetat de-a lungul anilor.

Noi avem speranța că acest efort va fi apreciat cum se cuvinte și că utilizatorii noștri se vor bucura să descopere valențe noi în cuvinte vechi!