La pinta jaro de Esperanto estis 1983
La firmao Google lastatempe skanas milionojn da libroj kaj nun havas grandegan datumbazon pri la enhavo de libroj el la tuta moderna epoko (kaj eĉ de antaŭ la kreo de la presilo). Oni priskribas la tekstaron en artikolo ĉe la konata revuo Science kaj klarigas ke la tekstaro nun enhavas 4% el la libroj iam ajn eldonitaj. Tiun ĉi datumbazon oni lastatempe malfermis al la publiko ĉe Googlelabs. Eblas ekscii pli pri la esplor-programo "kulturomiko" ĉe culturomics.org.
La termino "n-gram" signifas aron da unuopaj vortoj kiuj aperas kunaj en la tekstaro. Unuopaj vortoj estas "1-gram" kaj frazero kun du vortoj, ekzemple "internacia lingvo", estas "2-gram". Eblas trovi ĉiujn n-gramojn ĝis 5-gram, kondiĉe ke la vortoj aperas almenaŭ 40-foje en la tekstaro.
Per tiu ĉi datumbazo eblas kompari kiom ofte aperas vortkombinoj en libroj ekde la 1500aj jaroj ĝis 2008 en kelkaj lingvoj (sed plej bone ĝi kovras la anglan inter 1800 kaj 2000). Per tiu ĉi sistemo eblas esplori multajn flankojn de kulturo. Kelkaj esplortemoj kiujn la teamo jam studis estas la grandeco de la angla vortostoko, la evoluo de gramatiko, fameco, kaj cenzurado.
Kompreneble, mi tuj esploris pri Esperanto kaj aliaj artefaritaj lingvoj. Oni povas apartigi la rezultojn en la tekstaroj de kelkaj lingvoj.
En la subaj diagramoj mi komparas kiom ofte aperas la n-gramoj "Volapuk", "Ido", "Esperanto", kaj "Basic English". Mi metis Esperanton en tiun lokon por ke ĝi estu verda. La rezultoj estis interesaj.
Notu unue ke la aksoj estas en malsamaj rangoj unu kontraŭ alia. Surprize, la plej alta pinto (.0004) okazas en la ĉina dum la 1980aj jaroj. La plej alta punkto de la brit-angla diagramo (.0003) estas sesoble pli alta ol la plej alta punkto en la franca (.00005). Verŝajne tiaj simpligaj komparoj ne estas senchavaj inter tekstaroj, tamen la priskribo sube fokusas precipe pri la demando en kiuj jaroj okazas pintoj en diversaj lingvoj.
Eblas klaki la grafikaĵojn por vidi kaj plu esplori la rezultojn rekte ĉe Google Labs.
En la angla literaturo, oni povas vidi ke Volapuko kaj Ido neniel kompareblas rilate al la altecoj de Esperanto. (Iom poste, ni klarigu ĝuste kiom alta ĝi estas.) La tutan bildon de la angla, tamen, oni povas iom klarigi per divido inter la brita kaj la usona tekstaroj.
En la brita, Esperanton oni apenaŭ konas en la 1910aj jaroj, kiam ĝi furoris en kontinenta Eŭropo. La plej alta punkto okazas dum la 1960aj jaroj - supozeble post la 100a datreveno de la naskiĝo de Zamenhof. (Aŭ la studenta aktiveco de Humphrey Tonkin, eble.) Notu ankaŭ ke, kompare, la aliaj lingvoj estas ĉiam sub Esperanto. Volapukon oni apenaŭ notis en Britio. La intereso pri Ido kaj Basic English okazas samtempe kiel ankaŭ pli alta intereso de Esperanto, do supozeble tiam estis ĝenerale pli da intereso pri internacia lingvo.
En la usona tekstaro, la pinto okazas pli frue - dum la 1930aj jaroj. Notu ke oni pli atentis Volapukon kaj Basic English. Idon, tamen, oni tute ne atentis - oni eĉ ne povas trovi altiĝon ie pri Ido. Okazas, same kiel en Britio, pinto ĉe la 1960aj jaroj, verŝajne pro la samaj kialoj. Kaj videblas ankaŭ pinto ĉe la 1990aj jaroj, verŝajne post la 100a datreveno de la eldono de la unua libro.
En la franca, okazis frua altega intereso en Esperanto. La cetera nivelo aspektas tiom malalta pro la grandega intereso okazinta en la fruaj jaroj. Oni povas vidi ke plej granda intereso pri Ido troveblas en Francio, eĉ pli-malpi egala al Esperanto ĝis hodiaŭ.
En la germana, sensurprize, la pinto por Volapuko estas multe pli alta. Ankaŭ interese, la pinto por Esperanto okazas plej frue, jam antaŭ 1910. Nek Ido nek Basic English allogis multe da intereso en Germanio.
Se vi notas zorge, vi vidos ke en la angla tekstaro mi serĉis "Volapuk", dum en la germana mi uzis "Volapük". En mia originala esploro, surprizis min ke pinto por Volapuko tute ne montriĝis. Kiam mi faris la jenan komparon, tamen, mi trovis ke oni literumas la lingvon malsame en la du tekstaroj.
La ngramo "Volapük" (kun tremao) ne okazas el la angla tekstaro. La n-gramo "Volapuk" (sen tremao) ne okazas en la germana. Ne estas klare ĉu tiu ĉi distingo spegulas la verajn preslokojn de la libroj, aŭ ĉu temas pri la uzita liter-rekona softvaro, kiu, en la angla, ne antaŭsupozas ekziston de tremaoj. La volapukistoj povos mem esplori pri tio.
En la hispana, la pintoj por Esperanto similaspektas kiel aliloke en kontinenta Eŭropo. Estis interesa altitremaoo de intereso pri Esperanto ĉe la fino de la 1990aj jaroj, kiuj tamen ne aperas aliloke. Pri la vorto "Ido" en la hispana, mi havas dubon: la esplorilo povis konfuziĝi pri io alia.
En la ĉina, kiel jam dirite supre, la plej alta pinto okazas dum la 1980aj jaroj. Okazis Universala Kongreso en 1986. Aperas ankaŭ altiĝoj dum la 1910aj kaj 1930aj jaroj (kiel en la ceteraj lingvoj), sed la pinto dum la 80aj jaroj nepre meritas pluan esploron. Surprize la sekva Universala Kongreso en Ĉinio, kiu okazis en 2004 montras nenian spuron en la rezultoj.
En la rusa, Esperanto aspektas simile al la aliaj lingvoj krom la granda truo en la mezo. En 1937, laŭ ordonoj de Stalin, Esperanto estis malpermesita kaj la esperantistoj enkarcerigitaj aŭ murditaj. En aliaj lingvoj, ekestis ioma intereso dum la 1950aj kaj 1960aj jaroj kiu simple ne aperas en la rusa. Finfine, en la 1990aj jaroj denove estas altiĝo eble pro la centjara datreveno de Esperanto.
Malfacilas kompari Esperanton al naciaj lingvoj - kontraŭ ili, kutime, Esperanton oni apenaŭ povas distingi de nulo (almenaŭ en la angla). Tamen, kontraŭ du malgrandaj afrikaj lingvoj, oni povas vidi ke Esperanton oni menciis same ofte ĝis la 1960aj jaroj, kiam estis pligrandiĝo de intereso pri Afriko.
Tiu ĉi ilo povas indiki kie indas esplori plu. Pri la altaĵoj en la 1910aj jaroj oni facile komprenas, sed pri la postaj indus plua esploro. Jen interesa projekto por aliaj kiuj volas esplori plu kiel oni pritraktis Esperanton kaj aliajn planlingvojn tra la jaroj.
Tiu ĉi fako, kulturomiko, komenciĝas per libroj, sed eblas pligrandiĝi la fakon per la aldono de ĵurnaloj, mapoj, manuskriptoj, kaj aliaj eroj el la kultura sfero. Kiel Ulrich Becker jam faris pri Esperanto en New York Times, oni povos fari plivastskale en estontaj jaroj.
Kredeble tamen multaj aperoj de "Basic English" vere tute ne temas pri la planlingvo, sed simple pri la ordinara Angla lingvo iele karakterizata de la vorto "Basic". La vorto "Basic" ankaŭ povas rilati al io tute alia en la frazo. Ankaŭ la vorto "Ido" kredeble ne malofte rilatas al io tute alia. (Interalie Ido estas/estis firmao, kiu produktis necesejajn seĝojn k.s. Tial en Svedaj necesejoj oni ne malofte vidas tiun vorton...)