dexonline participă la greva de 15 minute

Astăzi, între orele 15:00 și 15:15, site-ul dexonline va fi indisponibil pentru căutări, întrucît participăm la protestul față de lipsa infrastructurii. Ne cerem scuze pentru anunțul din scurt. Intenția o avem de la bun început, dar nu era clar dacă avem timp pentru implementare.

De pe urma infrastructurii deplorabile avem toți de suferit. În cel mai fericit caz ne pierdem timpul pe drumurile proaste. În cazuri mai nefericite ne putem pierde sănătatea sau viața, iar la acest capitol stăm considerabil mai rău decît alte țări din Uniunea Europeană.

Nu toți putem construi un metru de autostradă. Ce putem, în schimb, să facem este să tragem la răspundere autoritățile pe care le plătim să facă asta. Și să nu mai votăm oameni care au avut șansa să facă ceva bun și au irosit-o.

Ne mutăm la blog.dexonline.ro

Blogul dexonline se mută la blog.dexonline.ro. Vechea adresă (dexonline.blogspot.com) va fi închisă pentru comentarii și posibil ștearsă complet.

Explicații:

Un principiu de prudență în folosirea Internetului este „calculele mele le fac pe calculatorul meu”. Pentru utilizatori asta înseamnă să-și țină documentele, spreadsheet-urile, imaginile și toate celelalte fișiere numai pe calculatorul propriu, nu pe serverele altcuiva (de exemplu Google Drive). Pentru autorii de site-uri web ca dexonline, principiul înseamnă să nu apeleze la companii intermediare pentru a-și publica informațiile.

În era minunilor tehnologice uităm ocazional de acest principiu. Încredințăm componente ale site-ului unor terțe părți pentru că este simplu. Am creat blogul dexonline la Blogger din cîteva clicuri, economisind acea oră sau două cît ar fi durat instalarea blogului pe calculatorul dexonline. Și de ce nu? Cînd blogul sau contul pe rețeaua socială sînt noi, ele nu generează foarte multă atenție, deci nu se justifică să cheltuim timp pe care nu-l avem pentru o componentă care momentan nu valorează mult.

Dar simplitatea are și fețe nevăzute și costuri ascunse. Un exemplu: calculatorul altuia este sub controlul altuia, nu sub al nostru. Asta înseamnă că pe calculatorul altuia nu vom avea niciodată controlul deplin și libertatea deplină de a publica exact informațiile pe care dorim să le publicăm. Această lecție, învățată și mai apoi uitată, ne-am reamintit-o dureros cînd am pierdut controlul asupra paginii Facebook a dexonline. Să spunem, vorbind eufemistic, că Facebook nu s-a grăbit să ne ajute să recăpătăm controlul paginii (17 zile mai tîrziu, problema încă nu este rezolvată). Pentru Facebook nu este o prioritate faptul că pagina noastră de Facebook este trasă în mizerie de un scelerat care publică zilnic materiale grețoase.

Aceasta ne face să revizuim lista de componente pe care le încredințăm altora spre gestiune. Blogul dexonline este, iată, una dintre componentele ușor de readus sub controlul nostru. Vor urma decizii mai grele în cazuri ca al paginii de Facebook, unde nu există varianta găzduirii pe propriul calculator.

Pagina de Facebook a dexonline a fost spartă

La finalul lui februarie 2019, un atacator a preluat controlul asupra paginii de Facebook a dexonline. Totul a început de la o eroare umană a unui administrator al paginii, facilitată de niște greșeli de ordin tehnic pe care le face Facebook: (1) posibilitatea ca un atacator să-și dea numele Sponsored Ads,  care sună tare mult a phishing, (2) existența unui rol de deținător de pagină (page owner) cu puteri de super-administrator, care este foarte prost documentat și (3) posibilitatea de a transfera acest rol altcuiva, fără vreun avertisment strident despre transferul de putere aferent.

Din păcate, recuperarea controlului asupra paginii se desfășoară extrem, extrem de greu. Considerăm că abuzul este clar ca lumina zilei, dar Facebook ne cere un volum nerezonabil de dovezi, certificate, acte notarizate și traduse.

Ne cerem scuze pentru natura dezgustătoare a materialelor publicate pe pagina noastră. Proiectul dexonline se delimitează complet de aceste materiale. Știm că reputația este cea mai mare avere a noastră și suferim cînd vedem cum o componentă importantă a proiectului nostru este tîrîtă în mocirlă.

În același timp, vă mulțumim tuturor celor care v-ați alarmat și/sau ne-ați trimis sfaturi și mesaje de compasiune. Vă asigurăm că recuperarea controlului are și pentru noi prioritate maximă zilele acestea. Subliniem și că site-ul principal dexonline.ro nu este afectat în niciun fel.

Modul confidențial

De curând am lansat la dexonline o funcție pe care noi o considerăm importantă: modul confidențial.

Ce este modul confidențial?

În mod normal, paginile dexonline încarcă și elemente de pe alte servere, mai exact:

  • caseta de Facebook;
  • scriptul Google Analytics, pe care îl folosim pentru a calcula statistici despre numărul de vizitatori ai dexonline;
  • bannerul publicitar, servit prin Google AdSense sau prin alți furnizori;
  • fonturile încărcate de la Google Fonts.

Dacă activați modul confidențial, paginile dexonline nu mai încarcă elemente de pe alte servere; comunicația se petrece strict între dumneavoastră și serverul dexonline. În plus, deoarece conexiunea este securizată prin HTTPS, nimeni altcineva nu știe ce pagini ați vizitat în cadrul dexonline.

Cum activez modul confidențial?

Modul confidențial este disponibil, timp de un an, utilizatorilor care

  • au donat cel puțin 50 de lei;
  • au un cont pe dexonline.

Concret, puteți activa și dezactiva modul confidențial din pagina de preferințe (după ce ați intrat în contul dumneavoastră). În caseta „Preferințe”, ultima pe listă este cea pentru modul confidențial.

Dacă folosiți dexonline de pe mai multe dispozitive, preferința setată mai sus se aplică tuturor dispozitivelor, dar este nevoie să intrați în cont pe fiecare dispozitiv.

Am lansat definițiile structurate

La dexonline am sărbătorit Ziua Muncii prin muncă (știm, suntem niște dubioși). Astfel că, în weekendul trecut, am lansat o funcție pe care o pregătim de mai bine de un an: definițiile structurate. Vedeți, de exemplu, abate sau talpă, unde am evidențiat separat sensurile, subsensurile, expresiile, exemplele, sinonimele, etimologia etc. Comparați aceasta cu formatul din dicționar (de exemplu pentru talpă), unde aceste informații sunt listate de-a valma.

Structurarea definițiilor are trei componente, din care primele două sunt aproape încheiate:

  1. Programarea sistemului pentru a afișa definițiile în acest format, precum și găsirea unei reprezentări coerente și complete în baza de date a acestor informații.
  2. Redactarea unui Ghid pentru structurare, care tratează diversele categorii de probleme apărute la structurare, astfel încât persoanele implicate în acest efort să poată structura definițiile într-o manieră consecventă.
  3. Parcurgerea efectivă a celor peste 200.000 de intrări din dexonline și structurarea lor.
Până acum am structurat aproape 3.000 de intrări (cam 1,5%), deci nu sunt șanse foarte mari să dați peste ele folosind site-ul în mod uzual. Desigur, în timp acest număr va crește!
Colegul nostru Matei, expertul de facto în domeniu, ocupându-se aproape exclusiv de structurare în ultimul an, a ajuns la un ritm mediu de circa 10 minute pentru structurarea unei intrări. Așadar, estimăm că structurarea tuturor intrărilor va dura peste 33.000 de ore, adică peste 17 ani-om (cu normă întreagă). Și asta presupunând că lexicografii se vor opri din produs dicționare și ediții noi în acest timp. 🙂
Bineînțeles, sperăm să atragem și alți colaboratori interesați de proiect. Rămâne problema costului, care nu este neglijabil. Alegeți-vă un tarif rezonabil pe oră, înmulțiți-l cu 33.000 și veți afla costul structurării tuturor definițiilor. 🙂 Dacă doriți, puteți dona ca să contribuiți la acest efort și la alte proiecte ale dexonline.

Zăresc pretutindeni felonii

Anul trecut am observat că lumea a căutat frenetic pe dexonline răspunsuri la o întrebare din examenul de simulare pentru examenele naționale de la clasa a 8-a. În mod curios, căutările au venit… în timpul examenului, iar câteva chiar înainte de începerea lui!

Lăsăm la o parte stupizenia unor oameni de a trișa la un examen de antrenament. Anul trecut am observat tardiv autofurarea căciulii, dar anul acesta am apucat să ne organizăm nițel. 🙂

Pe durata simulărilor de astăzi, am înlocuit definițiile pentru cuvintele date la subiecte, astfel:

  • pretutindenea, pretutindeni → pururi;
  • a zări, zărit →a zori, zorit;
  • felonie → făloșenie (mai mult despre asta la final).
Deci definițiile prezentate arătau cam așa:

Am dedus aceste cuvinte înainte să apucăm să vedem subiectele, urmărind pur și simplu lista cu cele mai căutate cuvinte, în care acestea se detașau clar. Iar statisticile confirmă că nu ne-am pregătit degeaba! Pentru pretutindeni / pretutindenea și a zări / zărit, căutările au fost distribuite astfel:

  • de la 08:00 la 08:59 au fost 9 căutări;
  • de la 09:00 la 09:59 au fost 143 de căutări;
  • de la 10:00 la 10:59 au fost 171 căutări;
  • de la 11:00 la 11:59 au fost 989 căutări.

Acum așteptăm cu interes rezultatele examenelor. >:-)

În încheiere, două vorbe despre felonie. Tot înainte de 09:00 dimineața, am observat o creștere a interesului pentru acest cuvânt, care a avut 35 de căutări înainte de 09:00. Am presupus că este și el parte din subiecte, așa că i-am „deturnat” și lui definițiile. Între 09:00 și 12:00, cuvântul a mai adunat 335 de căutări. Totuși, nu l-am regăsit nicăieri în enunțul subiectelor!

După amiază, am lămurit și misterul: domnul Andrei Pleșu publicase pe blogul său, chiar azi-dimineață, un articol în care folosea acest cuvânt. Nefericită coincidență!

Îi mulțumim lui David pentru ajutorul dat la implementare. Vă reamintim pe această cale că dexonline este software liber și oricine dorește poate programa pentru noi. Oferim la schimb recunoștință și momente hilare ca acesta. Și, ocazional, tricouri.

Ne revedem la examenele reale!

Definiții structurate – un exemplu

Structurarea definițiilor ne duce de la

la

Mai avem mult de lucru până să fie gata. Nu în ultimul rând, mai avem de lucru la prezentarea vizuală a diferitelor componente, la adăugarea de exemple și la reconcilierea diferendelor între dicționare asupra anumitor sensuri. Dar, dacă avem ceva, de 15 ani încoace, este muuuultă răbdare. 🙂

Structurarea definițiilor

În prezent, definițiile din dexonline sunt stocate ca simple bucăți de text, cu marcaje pentru text aldin, italic sau alte formatări. De exemplu, definiția pentru föhn:

FÖHN, (2) föhnuri, s. n. 1. Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. 2. Uscător electric pentru păr. [Pr.: fön] – Din fr. foehn, germ. Föhn.

este reprezentată, în baza noastră de date, ca:

@FÖHN,@ (@2@) $föhnuri,$ #s. n.# @1.@ Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. @2.@ Uscător electric pentru păr. [#Pr.#: $fön$] – Din #fr.# @foehn,@ #germ.# @Föhn.@

Structurarea implică și ierarhizarea sensurilor

Acest format este simplu de folosit, dar are un dezavantaj. Componentele definiției sunt toate de-a valma: sensurile, subsensurile, pronunția, silabisirea, morfologia (conjugările de verbe și declinările de substantive), etimologia (originea cuvântului) etc. Lipsa structurării limitează utilitatea bazei noastre de date, căci unele analize sunt greu sau imposibil de făcut. De exemplu, nu este ușor să găsim toate cuvintele care se pronunță altfel decât se scriu, sau toate cuvintele care provin din limba germană.

De aceea, am demarat (de ceva vreme) un efort de structurare a definițiilor, adică de separare și clasificare a tuturor proprietăților sus-menționate. Nu știm sigur cât va dura acest efort; probabil câțiva ani. Nouă ni se pare un proiect foarte interesant. Poate și vouă? În orice caz, vă vom ține la curent ocazional cu evoluția procesului de structurare.

Pentru astăzi, etichetele pe cuvinte. Unele informații sunt relativ ușor de extras automat. Majoritatea verbelor din dexonline sunt acum etichetate cu informații despre grupă și conjugare:

  • a onora este verb de grupa I, conjugarea a II-a;
  • a părea este verb de grupa a II-a, conjugarea a VIII-a.
Am procedat similar și pentru alte părți de vorbire (cu oarece erori):
  • muncitor este adjectiv sau substantiv masculin și feminin;
  • aferim este interjecție.
În timp, vom adăuga și alte etichete de interes pe cuvinte, în special cele din registrul stilistic (familiar, popular, ironic ș.a.m.d.). De exemplu, zbenghi este un substantiv familiar și popular.

O mie de poze fac cât un milion de cuvinte

Astăzi se împlinesc 1.000 de zile de când colaborăm cu Carmen Nistor pentru imaginea zilei care însoțește cuvântul zilei. Vă vine să credeți? Au fost 1.000 de poze, câte una pe zi, nu doar în zilele lucrătoare, ci și duminicile, de Crăciun, de Paște, din concediu, fără excepție.

Cheia succesului oricărui proiect este răbdarea. Îți mulțumim, Carmen, pentru răbdare și pentru statornicie. Ne dorim să fii alături de noi încă multe, multe mii de zile!

Te-am păcălit / Cu nasul prăjit

Azi ne-am distrat și noi un pic de 1 aprilie:

Am injectat erori în toate definițiile, precum și pe pagina principală. (Nu vă speriați, definițiile originale au rămas nemodificate; diferențele apar doar superficial și doar azi, 1 aprilie).

Știm că unii din dumneavoastră n-au gustat gluma. Asta este, la anul sperăm să fim pe aceeași lungime de undă!

Ne-a surprins plăcut numărul mare de oameni care au observat greșelile și s-au obosit să ne scrie. Este un compliment pentru dumneavoastră că o astfel de exprimare agramată vă zgârie ochii. Dacă se va întâmpla să observați erori și în zilele obișnuite, vă rugăm să continuați să ne scrieți. Dexonline depinde de vigilența oamenilor cu simț civic pentru corectarea erorilor.

Pentru noi a fost o zi distractivă. Sperăm că și pentru voi!

Close Menu