dexonline renunță la reclame

De 9 ani paginile dexonline conțin reclame. Nu multe, doar una pe pagină, căci nu am vrut să corupem un site eminamente text cu prea multă grafică stridentă.

Prin definiție, orice reclamă este supărătoare, căci rostul ei este de a spune „Hei, uite aici ceva de vînzare! Nu vrei să dai click pe mine?” Inițial, acesta a fost singurul dezavantaj al reclamelor. În rest, veniturile erau rezonabile și ne-au permis să accelerăm dezvoltarea site-ului.

În timp, lucrurile s-au schimbat. Începînd cu dezvăluirile lui Edward Snowden din 2013 știm că folosirea Internetului este supravegheată în majoritatea țărilor. În paralel, marile corporații IT au devenit tot mai obsedate cu urmărirea utilizatorilor pe Internet, pentru că poți obține profit mai mare de pe urma unui utilizator căruia îi cunoști obiceiurile. Sub deviza „profitul scuză orice”, Facebook, Google și alți giganți au ridicat spionajul la rang de artă. Dar informațiile acumulate despre utilizatori vin cu niște riscuri (în special scurgerea de informații către crackeri sau către guverne). Riscuri pe care companiile le ignoră.

Unde intervine dexonline în această poveste? Implicit, orice site care publică reclame prin Google AdSense se face părtaș la acumularea de dosare. Modul în care aceste reclame sînt publicate implică apeluri către Google, deci Google știe exact ce pagini din cadrul dexonline ați vizitat. Cumulat cu aceleași informații de pe alte site-uri, Google și alți giganți din IT vă cunosc mai bine decît părinții, prietenii, soțul sau soția dumneavoastră.

De aceea, de cîțiva ani la dexonline trăim cu această disonanță cognitivă: publicăm reclame pentru că banii ne ajută să ne servim mai bine utilizatorii, dar în același timp le facem un deserviciu punînd umărul la spionarea lor. O vreme ne-am spus „cu banii facem lucruri bune, deci binele este mai mare ca răul”. Dar acest argument a devenit tot mai greu de crezut pe măsură ce veniturile au scăzut, iar urmărirea utilizatorilor pe Internet a crescut.

Astfel am ajuns la decizia că etica este mai importantă decît banii. Începînd de astăzi, dexonline nu mai publică reclame prin Google AdSense nici prin alte terțe părți. Mai mult, am eliminat orice alte resurse de la terțe părți: fonturi Google, statistici de trafic (Google Analytics), caseta de Facebook. De acum încolo, vizitele dumneavoastră pe dexonline se desfășoară fără nicio terță parte pe fir:

Toate componentele paginilor dexonline vin de pe serverul dexonline.

Rămîne deschisă întrebarea cum vom susține proiectele în derulare (în particular introducerea de definiții și structurarea definițiilor) sau cum vom face rost de fonduri pentru alte proiecte. Ca întotdeauna, contăm pe donațiile dumneavoastră generoase. Dar, cu sau fără acestea, am decis că nu putem continua să implicăm finanțele în decizii de ordin etic.

Ne mutăm la blog.dexonline.ro

Blogul dexonline se mută la blog.dexonline.ro. Vechea adresă (dexonline.blogspot.com) va fi închisă pentru comentarii și posibil ștearsă complet.

Explicații:

Un principiu de prudență în folosirea Internetului este „calculele mele le fac pe calculatorul meu”. Pentru utilizatori asta înseamnă să-și țină documentele, spreadsheet-urile, imaginile și toate celelalte fișiere numai pe calculatorul propriu, nu pe serverele altcuiva (de exemplu Google Drive). Pentru autorii de site-uri web ca dexonline, principiul înseamnă să nu apeleze la companii intermediare pentru a-și publica informațiile.

În era minunilor tehnologice uităm ocazional de acest principiu. Încredințăm componente ale site-ului unor terțe părți pentru că este simplu. Am creat blogul dexonline la Blogger din cîteva clicuri, economisind acea oră sau două cît ar fi durat instalarea blogului pe calculatorul dexonline. Și de ce nu? Cînd blogul sau contul pe rețeaua socială sînt noi, ele nu generează foarte multă atenție, deci nu se justifică să cheltuim timp pe care nu-l avem pentru o componentă care momentan nu valorează mult.

Dar simplitatea are și fețe nevăzute și costuri ascunse. Un exemplu: calculatorul altuia este sub controlul altuia, nu sub al nostru. Asta înseamnă că pe calculatorul altuia nu vom avea niciodată controlul deplin și libertatea deplină de a publica exact informațiile pe care dorim să le publicăm. Această lecție, învățată și mai apoi uitată, ne-am reamintit-o dureros cînd am pierdut controlul asupra paginii Facebook a dexonline. Să spunem, vorbind eufemistic, că Facebook nu s-a grăbit să ne ajute să recăpătăm controlul paginii (17 zile mai tîrziu, problema încă nu este rezolvată). Pentru Facebook nu este o prioritate faptul că pagina noastră de Facebook este trasă în mizerie de un scelerat care publică zilnic materiale grețoase.

Aceasta ne face să revizuim lista de componente pe care le încredințăm altora spre gestiune. Blogul dexonline este, iată, una dintre componentele ușor de readus sub controlul nostru. Vor urma decizii mai grele în cazuri ca al paginii de Facebook, unde nu există varianta găzduirii pe propriul calculator.

Pagina de Facebook a dexonline a fost spartă

La finalul lui februarie 2019, un atacator a preluat controlul asupra paginii de Facebook a dexonline. Totul a început de la o eroare umană a unui administrator al paginii, facilitată de niște greșeli de ordin tehnic pe care le face Facebook: (1) posibilitatea ca un atacator să-și dea numele Sponsored Ads,  care sună tare mult a phishing, (2) existența unui rol de deținător de pagină (page owner) cu puteri de super-administrator, care este foarte prost documentat și (3) posibilitatea de a transfera acest rol altcuiva, fără vreun avertisment strident despre transferul de putere aferent.

Din păcate, recuperarea controlului asupra paginii se desfășoară extrem, extrem de greu. Considerăm că abuzul este clar ca lumina zilei, dar Facebook ne cere un volum nerezonabil de dovezi, certificate, acte notarizate și traduse.

Ne cerem scuze pentru natura dezgustătoare a materialelor publicate pe pagina noastră. Proiectul dexonline se delimitează complet de aceste materiale. Știm că reputația este cea mai mare avere a noastră și suferim cînd vedem cum o componentă importantă a proiectului nostru este tîrîtă în mocirlă.

În același timp, vă mulțumim tuturor celor care v-ați alarmat și/sau ne-ați trimis sfaturi și mesaje de compasiune. Vă asigurăm că recuperarea controlului are și pentru noi prioritate maximă zilele acestea. Subliniem și că site-ul principal dexonline.ro nu este afectat în niciun fel.

Aniversare 16 ani!

Acum 16 ani, dexonline se năștea într-o familie total netradițională formată din Cătălin și computerul lui (mde, America este țara tuturor posibilităților!). Nici nașterea nu a fost tocmai tradițională, Cătălin inseminînd computerul cu roadele minții sale, într-o perversă mixtură între Alien (folosind computerul drept gazdă) și scena nașterii Athenei Pallas din capul lui Zeus. Spre deosebire de Zeus, tatăl a fost lipsit de dureri de cap travaliul lipsind cu desăvîrșire, căci, se știe, procesul de inseminare e mult mai plăcut!

Primul logo

Progenitura a fost înzestrată încă de la naștere cu darul comunicării, primul cuvînt fiind „negativ– normal în ziua de azi! Cît timp a fost mic dexonline a fost educat în familie, dar, mărindu-se, a început să aibă de-a face cu din ce în ce mai mulți oameni și încă și mai mulți care au profitat de el!
Aniversarea vîrstei la care ar fi putut conduce o mașină în SUA a petrecut-o pe drum, mutîndu-se în casă nouă (adică un nou datacenter)!

Modul confidențial

De curând am lansat la dexonline o funcție pe care noi o considerăm importantă: modul confidențial.

Ce este modul confidențial?

În mod normal, paginile dexonline încarcă și elemente de pe alte servere, mai exact:

  • caseta de Facebook;
  • scriptul Google Analytics, pe care îl folosim pentru a calcula statistici despre numărul de vizitatori ai dexonline;
  • bannerul publicitar, servit prin Google AdSense sau prin alți furnizori;
  • fonturile încărcate de la Google Fonts.

Dacă activați modul confidențial, paginile dexonline nu mai încarcă elemente de pe alte servere; comunicația se petrece strict între dumneavoastră și serverul dexonline. În plus, deoarece conexiunea este securizată prin HTTPS, nimeni altcineva nu știe ce pagini ați vizitat în cadrul dexonline.

Cum activez modul confidențial?

Modul confidențial este disponibil, timp de un an, utilizatorilor care

  • au donat cel puțin 50 de lei;
  • au un cont pe dexonline.

Concret, puteți activa și dezactiva modul confidențial din pagina de preferințe (după ce ați intrat în contul dumneavoastră). În caseta „Preferințe”, ultima pe listă este cea pentru modul confidențial.

Dacă folosiți dexonline de pe mai multe dispozitive, preferința setată mai sus se aplică tuturor dispozitivelor, dar este nevoie să intrați în cont pe fiecare dispozitiv.

Am lansat definițiile structurate

La dexonline am sărbătorit Ziua Muncii prin muncă (știm, suntem niște dubioși). Astfel că, în weekendul trecut, am lansat o funcție pe care o pregătim de mai bine de un an: definițiile structurate. Vedeți, de exemplu, abate sau talpă, unde am evidențiat separat sensurile, subsensurile, expresiile, exemplele, sinonimele, etimologia etc. Comparați aceasta cu formatul din dicționar (de exemplu pentru talpă), unde aceste informații sunt listate de-a valma.

Structurarea definițiilor are trei componente, din care primele două sunt aproape încheiate:

  1. Programarea sistemului pentru a afișa definițiile în acest format, precum și găsirea unei reprezentări coerente și complete în baza de date a acestor informații.
  2. Redactarea unui Ghid pentru structurare, care tratează diversele categorii de probleme apărute la structurare, astfel încât persoanele implicate în acest efort să poată structura definițiile într-o manieră consecventă.
  3. Parcurgerea efectivă a celor peste 200.000 de intrări din dexonline și structurarea lor.
Până acum am structurat aproape 3.000 de intrări (cam 1,5%), deci nu sunt șanse foarte mari să dați peste ele folosind site-ul în mod uzual. Desigur, în timp acest număr va crește!
Colegul nostru Matei, expertul de facto în domeniu, ocupându-se aproape exclusiv de structurare în ultimul an, a ajuns la un ritm mediu de circa 10 minute pentru structurarea unei intrări. Așadar, estimăm că structurarea tuturor intrărilor va dura peste 33.000 de ore, adică peste 17 ani-om (cu normă întreagă). Și asta presupunând că lexicografii se vor opri din produs dicționare și ediții noi în acest timp. 🙂
Bineînțeles, sperăm să atragem și alți colaboratori interesați de proiect. Rămâne problema costului, care nu este neglijabil. Alegeți-vă un tarif rezonabil pe oră, înmulțiți-l cu 33.000 și veți afla costul structurării tuturor definițiilor. 🙂 Dacă doriți, puteți dona ca să contribuiți la acest efort și la alte proiecte ale dexonline.

Zăresc pretutindeni felonii

Anul trecut am observat că lumea a căutat frenetic pe dexonline răspunsuri la o întrebare din examenul de simulare pentru examenele naționale de la clasa a 8-a. În mod curios, căutările au venit… în timpul examenului, iar câteva chiar înainte de începerea lui!

Lăsăm la o parte stupizenia unor oameni de a trișa la un examen de antrenament. Anul trecut am observat tardiv autofurarea căciulii, dar anul acesta am apucat să ne organizăm nițel. 🙂

Pe durata simulărilor de astăzi, am înlocuit definițiile pentru cuvintele date la subiecte, astfel:

  • pretutindenea, pretutindeni → pururi;
  • a zări, zărit →a zori, zorit;
  • felonie → făloșenie (mai mult despre asta la final).
Deci definițiile prezentate arătau cam așa:

Am dedus aceste cuvinte înainte să apucăm să vedem subiectele, urmărind pur și simplu lista cu cele mai căutate cuvinte, în care acestea se detașau clar. Iar statisticile confirmă că nu ne-am pregătit degeaba! Pentru pretutindeni / pretutindenea și a zări / zărit, căutările au fost distribuite astfel:

  • de la 08:00 la 08:59 au fost 9 căutări;
  • de la 09:00 la 09:59 au fost 143 de căutări;
  • de la 10:00 la 10:59 au fost 171 căutări;
  • de la 11:00 la 11:59 au fost 989 căutări.

Acum așteptăm cu interes rezultatele examenelor. >:-)

În încheiere, două vorbe despre felonie. Tot înainte de 09:00 dimineața, am observat o creștere a interesului pentru acest cuvânt, care a avut 35 de căutări înainte de 09:00. Am presupus că este și el parte din subiecte, așa că i-am „deturnat” și lui definițiile. Între 09:00 și 12:00, cuvântul a mai adunat 335 de căutări. Totuși, nu l-am regăsit nicăieri în enunțul subiectelor!

După amiază, am lămurit și misterul: domnul Andrei Pleșu publicase pe blogul său, chiar azi-dimineață, un articol în care folosea acest cuvânt. Nefericită coincidență!

Îi mulțumim lui David pentru ajutorul dat la implementare. Vă reamintim pe această cale că dexonline este software liber și oricine dorește poate programa pentru noi. Oferim la schimb recunoștință și momente hilare ca acesta. Și, ocazional, tricouri.

Ne revedem la examenele reale!

Definiții structurate – un exemplu

Structurarea definițiilor ne duce de la

la

Mai avem mult de lucru până să fie gata. Nu în ultimul rând, mai avem de lucru la prezentarea vizuală a diferitelor componente, la adăugarea de exemple și la reconcilierea diferendelor între dicționare asupra anumitor sensuri. Dar, dacă avem ceva, de 15 ani încoace, este muuuultă răbdare. 🙂

Structurarea definițiilor

În prezent, definițiile din dexonline sunt stocate ca simple bucăți de text, cu marcaje pentru text aldin, italic sau alte formatări. De exemplu, definiția pentru föhn:

FÖHN, (2) föhnuri, s. n. 1. Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. 2. Uscător electric pentru păr. [Pr.: fön] – Din fr. foehn, germ. Föhn.

este reprezentată, în baza noastră de date, ca:

@FÖHN,@ (@2@) $föhnuri,$ #s. n.# @1.@ Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. @2.@ Uscător electric pentru păr. [#Pr.#: $fön$] – Din #fr.# @foehn,@ #germ.# @Föhn.@

Structurarea implică și ierarhizarea sensurilor

Acest format este simplu de folosit, dar are un dezavantaj. Componentele definiției sunt toate de-a valma: sensurile, subsensurile, pronunția, silabisirea, morfologia (conjugările de verbe și declinările de substantive), etimologia (originea cuvântului) etc. Lipsa structurării limitează utilitatea bazei noastre de date, căci unele analize sunt greu sau imposibil de făcut. De exemplu, nu este ușor să găsim toate cuvintele care se pronunță altfel decât se scriu, sau toate cuvintele care provin din limba germană.

De aceea, am demarat (de ceva vreme) un efort de structurare a definițiilor, adică de separare și clasificare a tuturor proprietăților sus-menționate. Nu știm sigur cât va dura acest efort; probabil câțiva ani. Nouă ni se pare un proiect foarte interesant. Poate și vouă? În orice caz, vă vom ține la curent ocazional cu evoluția procesului de structurare.

Pentru astăzi, etichetele pe cuvinte. Unele informații sunt relativ ușor de extras automat. Majoritatea verbelor din dexonline sunt acum etichetate cu informații despre grupă și conjugare:

  • a onora este verb de grupa I, conjugarea a II-a;
  • a părea este verb de grupa a II-a, conjugarea a VIII-a.
Am procedat similar și pentru alte părți de vorbire (cu oarece erori):
  • muncitor este adjectiv sau substantiv masculin și feminin;
  • aferim este interjecție.
În timp, vom adăuga și alte etichete de interes pe cuvinte, în special cele din registrul stilistic (familiar, popular, ironic ș.a.m.d.). De exemplu, zbenghi este un substantiv familiar și popular.

Rezultatele chestionarului pentru noul design dexonline

Acum două săptămâni (30 august 2016) lansam primul chestionar organizat pentru dexonline, menit să strângă părerile utilizatorilor despre noul design, lansat în luna august.

Rezultatele pe scurt

1. Ce părere ai despre noul design dexonline.ro?

2. Ce îți place la noul design dexonline.ro?

Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • simplitatea
  • aspectul mai modern, adaptat smartphone-urilor
  • interfața mai aerisită
  • fonturile mai mari, mai ușor de citit
3. Ce îți displace la noul design dexonline.ro?
Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • banner-ul și dimensiunea acestuia*
  • bara de căutare prea lungă
  • logo-ul dexonline*
  • lățimea prea mare a conținutului paginii, pe desktop
* elemente care existau și înainte pe site (nu țin de noul design), dar participanții au simțit nevoia să profite de această ocazie pentru a-și exprima opinia. Mulțumim pentru sinceritate!
4. Ai recomanda dexonline.ro unui prieten/membru de familie?
5. Ce funcții anume folosești cel mai des pe dexonline.ro? (bifează toate opțiunile care ți se aplică)

Reamintesc că opțiunile disponibile aici erau (în ordinea în care apar și în grafic):
  • căutarea definiției unui cuvânt
  • Cuvântul zilei
  • Cuvântul lunii
  • Cuvânt aleator
  • Jocuri (spânzurătoarea, moara cuvintelor)
  • verificare pentru Scrabble
  • Articolul lunii
  • Articole lingvistice
  • Ghid de exprimare
  • Contribuie cu definiții
  • Informații pentru programatori
6. Dacă ai descoperit vreun bug în noul design, care este acela?
Întrebare opțională, la care au fost semnalate două bug-uri. Promitem să investigăm.
7. Cât de des folosești dexonline.ro?


8. Dacă dorești să participi și la alte studii legate de dexonline.ro, te rugăm lasă-ne adresa ta de e-mail (nu vei fi abonat la newslettere, nu vei primi spam din partea noastră).

Întrebare opțională, la care aproximativ o treime din participanți s-a arătat disponibilă pe viitor.

Ce am învățat din acest chestionar?

În primul rând, am aflat care sunt cele mai folosite funcții de pe dexonline – ele vor avea prioritate la dezvoltare/îmbunătățire pe viitor. Pe de altă parte, rămâne ca temă de studiu pentru viitor de ce restul funcțiilor sunt atât de puțin folosite (prea puțin vizibile în interfață? utilitate scăzută pentru vizitatorul de rând? ar merita „pensionate” o parte din ele? etc).
Am aflat ce elemente le displăceau utilizatorilor și înainte de noul design. O parte dintre ele pot fi schimbate (logo-ul în format SVG, de exemplu), altele (nuanța de roșu, de exemplu) țin de branding-ul dexonline și nu vor fi schimbate în viitorul apropiat (rebranding-ul nu este în plan pentru acest proiect).
Am aflat ce elemente le displac utilizatorilor odată cu trecerea la design responsive (interfață adaptabilă la lățimea disponibilă a ecranului, în funcție de dispozitivul de pe care vizitezi: desktop, tabletă, mobil). Avem de retestat anumite elemente pe ecranele foarte mari (peste 1200px lățime).
Design-ul nou a avut în general un feedback pozitiv, mai exact 76.22% dintre participanți sunt de părere că schimbările sunt binevenite. Deși design-ul actual nu diferă foarte mult de cel anterior (nici nu am dorit o tranziție bruscă), pentru oamenii obișnuiți cu interfețe minimaliste schimbarea a fost evidentă; am renunțat la efectul de umbră pentru multe elemente, am introdus mai mult alb drept culoare de fundal, am spațiat mai bine elementele de pe pagina principală. Mai avem de lucru la pagina definițiilor, unde (și noi) și utilizatorii consideră că e nevoie de mai multă structurare.
Faptul că aproape 3 sferturi dintre utilizatorii noștri folosesc dexonline foarte des (zilnic sau de câteva ori pe săptămână) este dovada că munca noastră nu este în zadar, ci chiar necesară.

Relevanța statistică a acestui chestionar

Pasionații de statistică își vor pune întrebarea: În ce măsură aceste rezultate reprezintă întreaga populație de utilizatori dexonline (peste 2 milioane de vizitatori unici pe lună)?

Noțiuni de statistică folosite:
  • marja de eroare descrie cât de aproape este răspunsul eșantionului folosit de valoarea reală a populației. Cu cât marja de eroare este mai mică, cu atât mai aproape suntem de răspunsul exact care ar fi fost măsurat la nivelul întregii populații. În general, cu cât eșantionul este mai mare, cu atât marja de eroare este mai mică.
  • intervalul de încredere ne spune dacă măsurătoarea noastră este de încredere; un interval de încredere de 95% înseamnă că dorim să fim 95% siguri de rezultate și că acceptăm să fi greșit în 5% din cazuri; dacă am repeta acest chestionar de 100 de ori în aceleași condiții, atunci în 95 chestionare am obține rezultate care se încadrează în marja de eroare aleasă.
În cazul nostru, pentru o populație de fix 2.000.000 utilizatori unici lunari, cu un interval de încredere de 95% și un eșantion de 143 participanți, marja de eroare rezultată este de 9% (calculator aici).
Se putea mai bine, se putea mai rău. Sperăm ca la următorul studiu să reușim să mobilizăm mai mulți participanți.