Nova verzija je dostupna za preuzimanje sa http://srpski.org/aspell/ ili sa ftp://ftp.gnu.org/gnu/aspell/dict/sr/.
Početkom avgusta sam premijerno objavio paket za podršku srpskog jezika u programu GNU aspell. Iako mnogi to nisu znali, u međuvremenu sam ispravio neke nedostatke u samoj infrastrukturi paketa, a nije izostao ni rad na kvalitetnijoj listi reči.
Do sada nisam indeksirao srpsku Vikipediju (Odličan projekat, koji se brzo razvija! Čestitke ekipi.) prvenstveno jer sam želeo da tu veću količinu pogodnog teksta ostavim za kasnije doterivanje.
Večeras sam učitao arhivu 20051012_pages_articles.xml. Dokument sadrži oko 3,5 miliona reči od čega do sada nisam imao manje od 50 000 reči, uglavnom pogrešnih. Dakle, manje od 1,5% što je odlična pokrivenost ako se uzme u obzir da srpska Vikipedija pokriva i uzorke tehničkog i naučnog teksta iz različitih oblasti.
Sada imam oko 800 000 reči, koje su pronađene u različitim izvorima sa različitim frekfencijama, gde za oko 250 000 reči mogu sa velikom verovatnoćom tvrditi da su ispravne. Sledeći korak je da pronađem pogodan donji limit broja pojavljianja u preseku različitih izvora kako bih mogao još neke reče označiti kao potencijalno ispravne.
Nadam se da ću uspeti da do kraja sledeće nedelje uspeti da kompletiram novo izdanje rečnika koje bi trebalo biti kompletnije, i što je još važnije - tačnije od prethodnog.
Još jednom da budem dosadan i da pozovem sve koji imaju višak vremena da se jave. Pomoć u kontroli spiska reči mi je više nego potrebna, baš kao i neke fancy ideje kako se neke grupe čestih grešaka u postojećem spisku mogu lako odstraniti (poput suglasničkih promena, latiničnih digrafa, dupliranja slova, slepljenih reči sa izgubljenim samoglasnicima itd...)
Danas sam objavio prvo javno izdanje paketa za podršku srpskog jezika u programu GNU aspell (verzija 0.60). Paket sadrži tri rečnika (ćirilični, latinični i kombinovani) i dve liste reči (ćirilica i latinica) dužine 229239 reči i njihovih oblika.
Više informacija kao i sam paket, možete pronaći na adresi http://srpski.org/aspell
Datum prethodnog upisa na Mojoj Škrabalici je 15. maj 2005. godine ili pre više od četrdeset dana.
Od tada sam imao nekoliko kolokvijuma i usmenih ispita na fakultetu i danas, uz položenu Analizu 1, završio sa svim ispitima iz prve godine. Jedna od prvih stvari koju planiram da uradim nakon nekoliko stresnih sedmica jeste da se lepo odmorim desetak dana.
Od ostalih stvari, nedavno je Danilo Šegan na svom blogu objavio informacije o neočekivanom podsticaju lokalizacije GNU/Linux korisničkog sistema. Radi se o projektu koji će finansirati Novell preko svog domaćeg predstavnika a čiji je cilj formiranje potpune korisničke lokalizacije sledećeg izdanja SuSE distribucije. Potrebno je uklopiti i načiniti kompatibilnim različite komponente korisničkog okruženja tako da srpski jezik bude u potpunosti podržan. Osnovu će činiti Gnome okruženje uz Gnome Office paket dopunjen novim izdanjem OpenOffice.org paketa. Naravno, potrebno je dodati i ostale stvarčice poput ispravnih slobodnih fontova, lokaliteta, definicija tastatura, podršku za srpski jezik u aspell,...
Veliki deo posla je već urađen (spisak na www.srpski.org) među njima možda i najobimniji posao lokalizacije Gnome okruženja (vidi prevod.org), a postoji i prevod starije verzije OOo-a. Danilovim ranijim angažovanjem takođe danas postoje i tastatura Dunav, Bepa fontovi i CS lokaliteti. Naravno, sve ovo treba ponovo pregledati i prekontrolisati. Sam prevod Gnoma je, uprkos prisustva jedinstvenog rečnika dosta šarenolik što treba ispraviti.
Ovo je meni interesantno iz dva razloga. Prvi, iako je podršku za srpski jezik moguće namestiti u večini distribucija (sa izuzetkom stvari koje trenutno ne postoje poput podrške u aspell-u) to često nije nimalo zahvalno. Rezultat ovog projekta če biti jedno funkcionalno GNU/Linux okruženje koje je spremno za korišćenje na našem jeziku. Uz aktivniji nastup Novell-a na našem tržištu u budućnosti rezultat ovog projekta će omogućiti dalje prodor GNU/Linux-a i ideje slobodnog softvera uopšte.
Drugi, ličniji razlog je to što sam ja lično bio zaintersovan da nešto uradim povodom aspell-a tokom ovog leta, tako da ovo predstavlja samo još veći podsticaj da to stvarno i uradim.