În plină pandemie, am dorit să facem o mică bucurie fanilor dexonline cărora le place instagramul! De astăzi avem și cont de insta, iar la butoane se va afla Anca, entuziasta noastră colegă, care s-a ocupat de toată „bucătăria” necesară! Sperăm să ajungem în curînd la 10.000 de urmăritori!
De 9 ani paginile dexonline conțin reclame. Nu multe, doar una pe pagină, căci nu am vrut să corupem un site eminamente text cu prea multă grafică stridentă.
Prin definiție, orice reclamă este supărătoare, căci rostul ei este de a spune „Hei, uite aici ceva de vînzare! Nu vrei să dai click pe mine?” Inițial, acesta a fost singurul dezavantaj al reclamelor. În rest, veniturile erau rezonabile și ne-au permis să accelerăm dezvoltarea site-ului.
În timp, lucrurile s-au schimbat. Începînd cu dezvăluirile lui Edward Snowden din 2013 știm că folosirea Internetului este supravegheată în majoritatea țărilor. În paralel, marile corporații IT au devenit tot mai obsedate cu urmărirea utilizatorilor pe Internet, pentru că poți obține profit mai mare de pe urma unui utilizator căruia îi cunoști obiceiurile. Sub deviza „profitul scuză orice”, Facebook, Google și alți giganți au ridicat spionajul la rang de artă. Dar informațiile acumulate despre utilizatori vin cu niște riscuri (în special scurgerea de informații către crackeri sau către guverne). Riscuri pe care companiile le ignoră.
Unde intervine dexonline în această poveste? Implicit, orice site care publică reclame prin Google AdSense se face părtaș la acumularea de dosare. Modul în care aceste reclame sînt publicate implică apeluri către Google, deci Google știe exact ce pagini din cadrul dexonline ați vizitat. Cumulat cu aceleași informații de pe alte site-uri, Google și alți giganți din IT vă cunosc mai bine decît părinții, prietenii, soțul sau soția dumneavoastră.
De aceea, de cîțiva ani la dexonline trăim cu această disonanță cognitivă: publicăm reclame pentru că banii ne ajută să ne servim mai bine utilizatorii, dar în același timp le facem un deserviciu punînd umărul la spionarea lor. O vreme ne-am spus „cu banii facem lucruri bune, deci binele este mai mare ca răul”. Dar acest argument a devenit tot mai greu de crezut pe măsură ce veniturile au scăzut, iar urmărirea utilizatorilor pe Internet a crescut.
Astfel am ajuns la decizia că etica este mai importantă decît banii. Începînd de astăzi, dexonline nu mai publică reclame prin Google AdSense nici prin alte terțe părți. Mai mult, am eliminat orice alte resurse de la terțe părți: fonturi Google, statistici de trafic (Google Analytics), caseta de Facebook. De acum încolo, vizitele dumneavoastră pe dexonline se desfășoară fără nicio terță parte pe fir:
Rămîne deschisă întrebarea cum vom susține proiectele în derulare (în particular introducerea de definiții și structurarea definițiilor) sau cum vom face rost de fonduri pentru alte proiecte. Ca întotdeauna, contăm pe donațiile dumneavoastră generoase. Dar, cu sau fără acestea, am decis că nu putem continua să implicăm finanțele în decizii de ordin etic.
Blogul dexonline se mută la blog.dexonline.ro. Vechea adresă (dexonline.blogspot.com) va fi închisă pentru comentarii și posibil ștearsă complet.
Explicații:
Un principiu de prudență în folosirea Internetului este „calculele mele le fac pe calculatorul meu”. Pentru utilizatori asta înseamnă să-și țină documentele, spreadsheet-urile, imaginile și toate celelalte fișiere numai pe calculatorul propriu, nu pe serverele altcuiva (de exemplu Google Drive). Pentru autorii de site-uri web ca dexonline, principiul înseamnă să nu apeleze la companii intermediare pentru a-și publica informațiile.
În era minunilor tehnologice uităm ocazional de acest principiu. Încredințăm componente ale site-ului unor terțe părți pentru că este simplu. Am creat blogul dexonline la Blogger din cîteva clicuri, economisind acea oră sau două cît ar fi durat instalarea blogului pe calculatorul dexonline. Și de ce nu? Cînd blogul sau contul pe rețeaua socială sînt noi, ele nu generează foarte multă atenție, deci nu se justifică să cheltuim timp pe care nu-l avem pentru o componentă care momentan nu valorează mult.
Dar simplitatea are și fețe nevăzute și costuri ascunse. Un exemplu: calculatorul altuia este sub controlul altuia, nu sub al nostru. Asta înseamnă că pe calculatorul altuia nu vom avea niciodată controlul deplin și libertatea deplină de a publica exact informațiile pe care dorim să le publicăm. Această lecție, învățată și mai apoi uitată, ne-am reamintit-o dureros cînd am pierdut controlul asupra paginii Facebook a dexonline. Să spunem, vorbind eufemistic, că Facebook nu s-a grăbit să ne ajute să recăpătăm controlul paginii (17 zile mai tîrziu, problema încă nu este rezolvată). Pentru Facebook nu este o prioritate faptul că pagina noastră de Facebook este trasă în mizerie de un scelerat care publică zilnic materiale grețoase.
Aceasta ne face să revizuim lista de componente pe care le încredințăm altora spre gestiune. Blogul dexonline este, iată, una dintre componentele ușor de readus sub controlul nostru. Vor urma decizii mai grele în cazuri ca al paginii de Facebook, unde nu există varianta găzduirii pe propriul calculator.
La finalul lui februarie 2019, un atacator a preluat controlul asupra paginii de Facebook a dexonline. Totul a început de la o eroare umană a unui administrator al paginii, facilitată de niște greșeli de ordin tehnic pe care le face Facebook: (1) posibilitatea ca un atacator să-și dea numele Sponsored Ads, care sună tare mult a phishing, (2) existența unui rol de deținător de pagină (page owner) cu puteri de super-administrator, care este foarte prost documentat și (3) posibilitatea de a transfera acest rol altcuiva, fără vreun avertisment strident despre transferul de putere aferent.
Din păcate, recuperarea controlului asupra paginii se desfășoară extrem, extrem de greu. Considerăm că abuzul este clar ca lumina zilei, dar Facebook ne cere un volum nerezonabil de dovezi, certificate, acte notarizate și traduse.
Ne cerem scuze pentru natura dezgustătoare a materialelor publicate pe pagina noastră. Proiectul dexonline se delimitează complet de aceste materiale. Știm că reputația este cea mai mare avere a noastră și suferim cînd vedem cum o componentă importantă a proiectului nostru este tîrîtă în mocirlă.
În același timp, vă mulțumim tuturor celor care v-ați alarmat și/sau ne-ați trimis sfaturi și mesaje de compasiune. Vă asigurăm că recuperarea controlului are și pentru noi prioritate maximă zilele acestea. Subliniem și că site-ul principal dexonline.ro nu este afectat în niciun fel.
Acum 16 ani, dexonline se năștea într-o familie total netradițională formată din Cătălin și computerul lui (mde, America este țara tuturor posibilităților!). Nici nașterea nu a fost tocmai tradițională, Cătălin inseminînd computerul cu roadele minții sale, într-o perversă mixtură între Alien (folosind computerul drept gazdă) și scena nașterii Athenei Pallas din capul lui Zeus. Spre deosebire de Zeus, tatăl a fost lipsit de dureri de cap travaliul lipsind cu desăvîrșire, căci, se știe, procesul de inseminare e mult mai plăcut!
Primul logo
Progenitura a fost înzestrată încă de la naștere cu darul comunicării, primul cuvînt fiind „negativ” – normal în ziua de azi! Cît timp a fost mic dexonline a fost educat în familie, dar, mărindu-se, a început să aibă de-a face cu din ce în ce mai mulți oameni și încă și mai mulți care au profitat de el! Aniversarea vîrstei la care ar fi putut conduce o mașină în SUA a petrecut-o pe drum, mutîndu-se în casă nouă (adică un nou datacenter)!
De curând am lansat la dexonline o funcție pe care noi o considerăm importantă: modul confidențial.
Ce este modul confidențial?
În mod normal, paginile dexonline încarcă și elemente de pe alte servere, mai exact:
caseta de Facebook;
scriptul Google Analytics, pe care îl folosim pentru a calcula statistici despre numărul de vizitatori ai dexonline;
bannerul publicitar, servit prin Google AdSense sau prin alți furnizori;
fonturile încărcate de la Google Fonts.
Dacă activați modul confidențial, paginile dexonline nu mai încarcă elemente de pe alte servere; comunicația se petrece strict între dumneavoastră și serverul dexonline. În plus, deoarece conexiunea este securizată prin HTTPS, nimeni altcineva nu știe ce pagini ați vizitat în cadrul dexonline.
Cum activez modul confidențial?
Modul confidențial este disponibil, timp de un an, utilizatorilor care
Concret, puteți activa și dezactiva modul confidențial din pagina de preferințe (după ce ați intrat în contul dumneavoastră). În caseta „Preferințe”, ultima pe listă este cea pentru modul confidențial.
Dacă folosiți dexonline de pe mai multe dispozitive, preferința setată mai sus se aplică tuturor dispozitivelor, dar este nevoie să intrați în cont pe fiecare dispozitiv.
La dexonline am sărbătorit Ziua Muncii prin muncă (știm, suntem niște dubioși). Astfel că, în weekendul trecut, am lansat o funcție pe care o pregătim de mai bine de un an: definițiile structurate. Vedeți, de exemplu, abate sau talpă, unde am evidențiat separat sensurile, subsensurile, expresiile, exemplele, sinonimele, etimologia etc. Comparați aceasta cu formatul din dicționar (de exemplu pentru talpă), unde aceste informații sunt listate de-a valma.
Structurarea definițiilor are trei componente, din care primele două sunt aproape încheiate:
Programarea sistemului pentru a afișa definițiile în acest format, precum și găsirea unei reprezentări coerente și complete în baza de date a acestor informații.
Redactarea unui Ghid pentru structurare, care tratează diversele categorii de probleme apărute la structurare, astfel încât persoanele implicate în acest efort să poată structura definițiile într-o manieră consecventă.
Parcurgerea efectivă a celor peste 200.000 de intrări din dexonline și structurarea lor.
Până acum am structurat aproape 3.000 de intrări (cam 1,5%), deci nu sunt șanse foarte mari să dați peste ele folosind site-ul în mod uzual. Desigur, în timp acest număr va crește!
Colegul nostru Matei, expertul de facto în domeniu, ocupându-se aproape exclusiv de structurare în ultimul an, a ajuns la un ritm mediu de circa 10 minute pentru structurarea unei intrări. Așadar, estimăm că structurarea tuturor intrărilor va dura peste 33.000 de ore, adică peste 17 ani-om (cu normă întreagă). Și asta presupunând că lexicografii se vor opri din produs dicționare și ediții noi în acest timp. 🙂
Bineînțeles, sperăm să atragem și alți colaboratori interesați de proiect. Rămâne problema costului, care nu este neglijabil. Alegeți-vă un tarif rezonabil pe oră, înmulțiți-l cu 33.000 și veți afla costul structurării tuturor definițiilor. 🙂 Dacă doriți, puteți dona ca să contribuiți la acest efort și la alte proiecte ale dexonline.
Anul trecut am observat că lumea a căutat frenetic pe dexonline răspunsuri la o întrebare din examenul de simulare pentru examenele naționale de la clasa a 8-a. În mod curios, căutările au venit… în timpul examenului, iar câteva chiar înainte de începerea lui!
Lăsăm la o parte stupizenia unor oameni de a trișa la un examen de antrenament. Anul trecut am observat tardiv autofurarea căciulii, dar anul acesta am apucat să ne organizăm nițel. 🙂
Pe durata simulărilor de astăzi, am înlocuit definițiile pentru cuvintele date la subiecte, astfel:
pretutindenea, pretutindeni → pururi;
a zări, zărit →a zori, zorit;
felonie → făloșenie (mai mult despre asta la final).
Deci definițiile prezentate arătau cam așa:
Am dedus aceste cuvinte înainte să apucăm să vedem subiectele, urmărind pur și simplu lista cu cele mai căutate cuvinte, în care acestea se detașau clar. Iar statisticile confirmă că nu ne-am pregătit degeaba! Pentru pretutindeni / pretutindenea și a zări / zărit, căutările au fost distribuite astfel:
de la 08:00 la 08:59 au fost 9 căutări;
de la 09:00 la 09:59 au fost 143 de căutări;
de la 10:00 la 10:59 au fost 171 căutări;
de la 11:00 la 11:59 au fost 989 căutări.
Acum așteptăm cu interes rezultatele examenelor. >:-)
În încheiere, două vorbe despre felonie. Tot înainte de 09:00 dimineața, am observat o creștere a interesului pentru acest cuvânt, care a avut 35 de căutări înainte de 09:00. Am presupus că este și el parte din subiecte, așa că i-am „deturnat” și lui definițiile. Între 09:00 și 12:00, cuvântul a mai adunat 335 de căutări. Totuși, nu l-am regăsit nicăieri în enunțul subiectelor!
După amiază, am lămurit și misterul: domnul Andrei Pleșu publicase pe blogul său, chiar azi-dimineață, un articol în care folosea acest cuvânt. Nefericită coincidență!
Îi mulțumim lui David pentru ajutorul dat la implementare. Vă reamintim pe această cale că dexonline este software liber și oricine dorește poate programa pentru noi. Oferim la schimb recunoștință și momente hilare ca acesta. Și, ocazional, tricouri.
Mai avem mult de lucru până să fie gata. Nu în ultimul rând, mai avem de lucru la prezentarea vizuală a diferitelor componente, la adăugarea de exemple și la reconcilierea diferendelor între dicționare asupra anumitor sensuri. Dar, dacă avem ceva, de 15 ani încoace, este muuuultă răbdare. 🙂
În prezent, definițiile din dexonline sunt stocate ca simple bucăți de text, cu marcaje pentru text aldin, italic sau alte formatări. De exemplu, definiția pentru föhn:
FÖHN, (2) föhnuri,s. n.1. Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. 2. Uscător electric pentru păr. [Pr.: fön] – Din fr.foehn,germ.Föhn.
este reprezentată, în baza noastră de date, ca:
@FÖHN,@ (@2@) $föhnuri,$ #s. n.# @1.@ Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. @2.@ Uscător electric pentru păr. [#Pr.#: $fön$] – Din #fr.# @foehn,@ #germ.# @Föhn.@
Structurarea implică și ierarhizarea sensurilor
Acest format este simplu de folosit, dar are un dezavantaj. Componentele definiției sunt toate de-a valma: sensurile, subsensurile, pronunția, silabisirea, morfologia (conjugările de verbe și declinările de substantive), etimologia (originea cuvântului) etc. Lipsa structurării limitează utilitatea bazei noastre de date, căci unele analize sunt greu sau imposibil de făcut. De exemplu, nu este ușor să găsim toate cuvintele care se pronunță altfel decât se scriu, sau toate cuvintele care provin din limba germană.
De aceea, am demarat (de ceva vreme) un efort de structurare a definițiilor, adică de separare și clasificare a tuturor proprietăților sus-menționate. Nu știm sigur cât va dura acest efort; probabil câțiva ani. Nouă ni se pare un proiect foarte interesant. Poate și vouă? În orice caz, vă vom ține la curent ocazional cu evoluția procesului de structurare.
Pentru astăzi, etichetele pe cuvinte. Unele informații sunt relativ ușor de extras automat. Majoritatea verbelor din dexonline sunt acum etichetate cu informații despre grupă și conjugare:
În timp, vom adăuga și alte etichete de interes pe cuvinte, în special cele din registrul stilistic (familiar, popular, ironic ș.a.m.d.). De exemplu, zbenghi este un substantiv familiar și popular.