50.000 de cuvinte! Si, ca de obicei, www.scrabble.ro au fost primii care au consemnat evenimentul.

Am adaugat campuri in tabela si cod pentru contorizarea numarului de afisari ale fiecarei definitii. Sunt contorizate numai cautarile reusite (cand a existat cel putin un rezultat) si cele cu expresii regulate. Pe primele locuri incep sa se detaseze, desigur, obscenitatile 🙂

Ce software foloseste DEX online? Lista a ajuns la dimensiuni impresionante:

Fedora Linux (sistemul de operare)

Apache httpd (serverul de web)

MySQL (baza de date)

PHP (paginile de web)

gcc (compilatorul de C, pentru unele bucati de cod)

emacs (editorul de texte)

Smarty (generatorul de sabloane PHP)

PHP Accelerator (caching; merge de minune in combinatie cu Smarty)

zip/gzip/bzip2 (pentru comprimarea bazei de date)

CVS (pentru intretinerea codului si editarea lui in mai multi clienti simultan)

Galeon, Mozilla (browsere de web, pentru testare)

ABBYY FineReader (OCR – singurul program comercial din lista!)

Aceasta spune multe despre ce inseamna Open Source si care e frumusetea sa.

Gata si cu litera L.

Ma gandesc din ce in ce mai serios sa nu mai accept definitii decat din paginile scanate. Pe de o parte, ar fi pacat pentru ca s-ar pierde spiritul heirupist, „oricine vrea poate sa contribuie”. Acum nu ar mai putea contribui decat cine s-ar angaja sa faca o pagina intreaga. Pe de alta parte, insa, moderarea definitiilor scanate merge mult mai repede (de 5-6 ori).

Câţiva dintre voluntari au introdus sute de mii de caractere, maximul fiind de două milioane. Numărul în sine nu spune mult. Ajută însă dacă ne gândim că două milioane de caractere înseamnă vreo 800 de pagini de carte în format normal (RAO, de exemplu).

Eu unul am introdus vreo 300.000 de caractere în trei ani de zile şi, recunosc, m-am plictisit de moarte. Răbdarea e o virtute rară.

Astăzi am scris prima oară în blog. M-am hotărât să creez acest blog pentru că, la nici trei ani de la înfiinţare, DEX online creşte cu o viteză uluitoare şi capătă ajutor din cele mai neaşteptate surse. Nici în visurile mele cele mai optimiste nu am crezut că atâta lume se va mobiliza. Este impresionant că, pe lângă introducerea de cuvinte, fiecare a ajutat aşa cum s-a priceput mai bine, venind cu idei proprii pentru îmbogăţirea DEX online. Toţi aceşti oameni merită ca efortul lor să fie făcut cunoscut, iar odiseea DEX online să fie consemnată.

Începând de aici, am să încerc să rămân la zi cu evoluţia proiectului, dar şi să completez retroactiv jurnalul cu lucrurile care s-au întâmplat înaintea apariţiei lui. Jurnalul va creşte, deci, în ambele sensuri. Scrisul cu diacritice mă încetineşte mult, mai ales că nu pot scrie decât de pe un calculator cu Windows.

Aplicaţiile off-line încep să prindă contur. Astăzi am adăugat un script pe server cu care clienţii pot comunica pentru a transfera integral sau parţial baza de date. În cazul ideal, un client va transfera prima oară baza de date completă, apoi se va conecta periodic pentru a prelua cele mai noi definiţii adăugate. Avantajele acestei abordări sunt că (1) toţi clienţii vor ocupa foarte puţin loc şi (2) fiecare utilizator îşi poate sincroniza baza de date oricât de des doreşte, fără a fi nevoit să aştepte următoarea versiune a clientului.

A fost nevoie ca Gecko să mă bată în repetate rânduri la cap pentru a mă urni să implementez scriptul ăsta. Problema cea mai mare zilele astea este că, tocmai fiindcă primim atât de mult ajutor şi lumea vine cu atât de multe idei, este nevoie de multă muncă pentru a extinde codul. Lista de cuvinte LOC3 stă şi acum nefolosită…

Mi se pare incredibil că unul dintre cei mai activi voluntari este un austriac care munceşte în Taiwan (Christian). Dânsul vorbeşte alte trei limbi romanice, iar interesul pentru limba română i-l datorează unui coleg şi bun prieten. Christian ne-a semnalat până acum mii de greşeli de tipar şi a început lucrul sistematic la litera C.

Azi am creat o pagina a administratorului accesibila public. Oricine are un cont poate sa modereze definitii. Vor primi conturi doar persoanele care au contribuit cu minim 100 de definitii.

Sper sa ajungem sa avem nevoie de aceasta interfata. Sunt zile in care vin prea multe definitii sau in care eu nu am timp sa le moderez, si atunci ar fi bine sa avem mai multi moderatori.

Din nou discutii cu Academia. Mesajele mele sunt pasate de colo-colo, ideea proiectului DEX online si dorinta mea de a ajuta sunt apreciate, mi se raspunde pe un ton foarte politicos. Concret, nu se intampla nimic.

De undeva am aflat ca adresa Editurii Univers Enciclopedic ar fi univers@fx.ro. Totusi, nu este. Mesajele mi se intorc cu eroare.

Azi am facut rost de NODEX. L-am si spart, pentru ca datele de pe CD au doar un surogat de codificare. Conversia la formatul DEX online a durat cateva ore. 38.730 cuvinte, in vreme ce noi, muncind de aproape un an, avem 5847 cu totul. Ma zgarii pe ochi 🙁 Din pacate, am purtat deja convorbiri cu Editura Litera (editorii NODEX-ului) si nu sunt interesati de o colaborare.

In ultima vreme am luat ceva viteza. Adunam cam 1000-1500 de definitii pe luna. S-ar putea sa avem mai multe sanse singuri.