
Turbūt daugelis pamenate, jog dar spaudos priešistorėje svarbų vaidmenį vaidino knygų perrašinėtojai (skriptoriai), kuriuos šiuo metu gali atstoti net ir paprasčiausias skeneris. Trumpai tariant, skriptoriai padėjo didinti literatūros tiražus, kai kito būdo kopijuoti kūrinį nebuvo galimybių. Šiuo metu pasaulyje vyksta panaši situacija, tik dabar visa literatūra perrašoma į skaitmeninį formatą (tuo ypač atkakliai užsiiema Google korporacija). Tai atliekama pasitelkiant įvairias programas (OCR), kurios sugeba atpažinti daugybės kalbų raštą bei suskaitmeninti jį. Vis dėlto, šios programos nėra labai efektyvios ir gana dažnai klysta, ypač jei knygos puslapiai yra nusidevėję ar neryškiai atspausdinti.


Puikus pavyzdys, jog kompiuteris nevisada sugeba „įskaityti" mūsų raštą
Galbūt dabar savęs klausiate - „o kas ištaiso šias kompiuterio klaidas?" Atsakymas daugeliui gali būti netikėtas - mes, besinaudojantys internetu ir dažnai patys to net nežinantys.
Ko gero daugelis esate susidūrę su panašia situacija: norite prisiregistruoti kokiame nors tinklapyje, o registracijos forma pareikalauja jūsų įrodyti, jog esate žmogus - užrašyti paveikslėlyje pavaizduotą tekstą ar simbolius (dažniausiai tai būna „reCaptcha" forma). Būtent tada, kai suvedate porą šių žodžių, jūs padedate skaitmeninti mažą atsitiktinai parinktos knygos dalį, kurios nesugebėjo įveikti kompiuteris. Turbūt dabar savęs klausiate, ar toks jūsų laiko gaišinimas kažko vertas -juk tai tik pora įvestų žodžių. Atsakymui galiu jums pateikti paprastą statistiką:
- Kiekvieną dieną užpildoma apie 200 milijonų „reCaptcha" formų
- Per metus suskaitmeninamas žodžių kiekis atitinka apie 2,5 mln. knygų
- „reCaptcha" formą yra pildęs kas dešimtas pasaulio žmogus
Iš šių statistinių duomenų galima įsivaizduoti, kokį milžinišką darbą kiekvienas mūsų padedame nudirbti tiesiog pildydami registracijos formą eiliniame naujienų portale ar socialiniame tinkle. Maža to, „reCaptcha" sukūrusi kompanija (ji šiuo metu priklauso Google Inc.) yra užsimojusi dar didesniems darbams - išversti internetą į daugybę kalbų (pradedant nuo Vikipedijoje esančių angliškų tekstų, kurių vertimo kainą siektų bent 15 mln. dolerių).
Vis dėlto, internetą versime ne naudodamiesi nauja „reCaptcha" versija, tačiau visiškai nauju projektu - duolingo.com. Trumpai apie šio projekto veikimo principą - vartotojams, norintiems mokytis užsienio kalbų internetu nemokamai, bus pateikiamas tekstas, kurį reikės išversti. Iš pradžių bus pateikiami trumpi ir paprasti sakiniai, tinkami tik pradėjusiems mokytis kalbos, kol galiausiai palaipsniui bus pereinama prie vis sudėtingesnių tekstų, kuriuos norint išversti teks paplušėti.
Taip pasiekiama dvipusė nauda - žmonėms suteikta galimybė nemokamai mokytis užsienio kalbos, už kurią jie atsilygins savo laiku bei išverstu tekstu. Kolkas vienintelė kliūtis pulti mokytis dar šiandien - nestartavęs tinklapis, esantis beta stadijoje. Na, tačiau pasak projekto sumanytojo Luis von Ahn, iki galutinės tinklapio versijos liko laukti visai nedaug.
Justas Pačekajus
