El català, per primer cop entre les 10 millors llengües del món al rànquing de qualitat més exigent de la Viquipèdia

La Viquipèdia en català ja és la primera llengua del món en els 1.000 articles més importants des de fa prop d’una dècada. Ara, s’ha convertit en la desena pel que fa als 10.000 articles essencials.

Xavier Dengra, CC BY-SA 4.0, via la Wikimedia Commons

Des d’aquest diumenge al matí, la Viquipèdia en català ha assolit una nova fita històrica de qualitat lingüística. La versió en català de l’enciclopèdia lliure que tothom pot modificar ha accedit per primer cop a la desena posició del llistat dels 10.000 articles, una selecció de les entrades que es consideren més importants i necessàries en qualsevol de les edicions idiomàtiques d’aquest projecte digital i multilingüe nascut l’any 2001.

En la darrera actualització, que es duu a terme de manera mensual per a les 310 llengües del món que disposen d’una versió lingüística de Viquipèdia, el català ha superat idiomes de pes com l’àrab, el portuguès, el coreà o l’hebreu per situar-se amb 75.83 punts dels 100 que atorga aquest rànquing, a partir de paràmetres com la manca o presència d’aquests articles en una llengua concreta o la seva extensió de caràcters.

De fet, la comunitat de voluntaris catalanoparlants s’ha quedat a només mig punt de l’italià (76.35) i ara aspira, en els propers mesos i seguint l’actual tendència de creixement intermensual (molt superior als idiomes que tenen per davant), a apropar-se a les tres llengües que encapçalen la llista: l’anglès (96.86 punts), el serbi (91.03) i el castellà (87.57).

Alguns dels articles que formen part d’aquesta llista de 10.000 entrades, exigent per la seva diversitat de context i àmbits de coneixement i també font d’algunes crítiques perquè presenta biaixos molt diversos, i en especial l’anglocèntric, són «Història d’Eritrea», «Període Edo», «formatge blau», «escola de música», «agressió sexual», «cel·lulosa» o «capibara». Entre aquests milers de propostes hi ha una minsa presència d’articles relacionats amb el món catalanoparlant com ara «Antoni Gaudí», «Andorra», «Barcelona», «València» o «Regne d’Aragó».

Per bé que és el primer cop que la versió en català accedeix a les posicions nobles d’aquesta llista, la seva comunitat d’editors ja gaudeix d’un bon prestigi històric dins el món viquipedista atès que ha liderat durant els darrers 10 anys, de manera pràcticament ininterrompuda i frec a frec amb el serbi i el rus, la llista dels 1.000 articles essencials. Aquest altre rànquing, quantitativament més reduït però que inclou els articles més cabdals i sovint més llegits en cada llengua, ha contribuït a establir un reconeixement sòlid al llarg dels anys per a la Viquipèdia en català com a llengua minoritzada però de gran vitalitat, qualitat i compromís digital.

Aquesta trajectòria de mèrits ve de lluny: l’article «Àbac» fou el primer de la història de la Viquipèdia en llengua no anglesa, el català fou la primera llengua en tenir catalogats tots els mamífers amb article propi i, en el 20è aniversari del projecte, l’any passat The Economist destacà en un reportatge que la comunitat en català està consolidada com la cinquena més activa del món pel que fa a viquipedistes per milió de parlants.

Aquest text reprodueix una nota de premsa escrita col·laborativament per editors de la Viquipèdia en català.

Wikidata fa 10 anys

10è aniversari de Wikidata

El 29 d’octubre d’enguany és el desè aniversari de Wikidata, una base de coneixement de la família Wikimedia.

Es va crear com a pal de paller del conjunt de Wikipèdies que existeixen en més de 280 llengües per tal de compartir aquella informació estructurada i no afectada per les diferències de criteri cultural o lingüístic que existeixen entre articles de diferents llengües. En la meitat d’anys que té Wikipedia, ja ha arribat als 100 milions d’entrades, totes elles multilingües.

Però el més interessant no són les seves magnituds, sinó la seva utilitat. Allò que va començar per reduir errors d’inconsistència entre versions de la Wikipedia, ha esdevingut una eina fonamental per accedir a altres continguts també de fora del món Wikimedia. La seva estructura facilita que els continguts siguin “llegibles” per persones i per màquines, que coneguem l’identificador d’un concepte o element en altres bases de dades obertes, permetent, de facto, enllaçar-les fàcilment.

Aquesta funcionalitat està sent utilitzada per creadors d’aplicacions d’utilitat general que, no només obtenen continguts de Wikidata i Wikipedia, sinó d’altres fonts de contingut lliure. Un cas que tots veiem sovint són els snippets quan fem una consulta en un cercador o als assistents virtuals.

En tractar-se, com la resta de plataformes Wikimedia, d’uns continguts oberts, és alimentada també per institucions i voluntaris aliens a l’entorn Wikipedia, enriquint indirectament molts dels continguts que després fem servir als articles.

És un exemple clar de crowdsourcing.

Autor: Amador Álvarez

Bibliowikis valencianes a la Wikimedia+Libraries International Convention 2022

La primera Wikimedia+Libraries Internacional Convention va tenir lloc el 23 i 24 de juliol a la Biblioteca de la Universitat de Maynooth, prop de Dublín i cap allà que anàrem: Borja, Julia i jo.

El mer fet de viatjar amb amics a parlar dels projectes viquipedistes que duem a terme des de les biblioteques “in the land of València” ja era un bon pla, i passar de 40 graus als 24 de Dublín per a què contar-vos.

El cap de setmana va superar les nostres expectatives: bon ambient, enclavament meravellós, multilingüisme i sobretot “comboi viquipedista” com ens agrada anomenar-lo per terres valencianes.

Durant dos dies intensos prop d’un centenar de bibliotecaris i wikimedistes de tot el món ens reunirem per compartir experiències i aprendre els uns dels altres.

El diumenge a les 14h va arribar el nostre torn: el Workshop: Wikimedia + Libraries in the Land of Valencia. Un projecte elaborat per Francesc Fort, Borja Fuster, Amparo Pons i jo. Francesc no va poder assistir i vam haver de fer alguns canvis, entre ells fer la presentació en castellà (agraïdíssims a l’organització per això) i vam comptar amb David Ramírez-Ordóñez (@hiperterminal), en qualitat de chair. Un autèntic plaer! i mil gràcies pel fil de Twitter.

Font: Juboufer CC-BY-SA 4.0

Al Workshop, Borja Fuster, vocal de formació del Col·legi de Bibliotecaris i Documentalistes de la Comunitat Valenciana (COBDCV) i jo presentarem les activitats wikimedia que es realitzen a la Comunitat Valenciana en col·laboració amb les biblioteques des de 2013. El “model valencià ” es pot dividir en tres sectors, amb les seues característiques pròpies.

  • Biblioteques institucionals: en el nostre cas, una biblioteca especialitzada de museu: la Biblioteca de l’Etno. Museu Valencià d’Etnologia
  • Biblioteca municipals: Biblioteca Pública Municipal de l’Eliana
  • Col·legis professionals: Col·legi Oficial de Bibliotecaris i Documentalistes de la Comunitat Valenciana (COBDCV) i aliances amb altres institucions

El primer model que es va presentar va ser el Wikiprojecte de l’Etno, Museu Valencià d’Etnologia liderat i coordinat per la Biblioteca de l’Etno i en funcionament des del 2016. En paraules d’Amparo Pons, directora de la biblioteca, els objectius de aquest projecte sempre han estat:

  • Alliberar contingut gràfic del museu
  • Millorar el contingut existent sobre la cultura popular valenciana
  • Crear noves dinàmiques de treball en el museu i en la ciutadania
Font: Juboufer CC-BY-SA 4.0

El segon cas, és el de la Biblioteca Pública Municipal de l’Eliana (València), el qual coordine des del començament el 2016. El propòsit del Viquiprojecte l’Eliana és crear i millorar articles de temes relacionats amb la història local del municipi a Wikipedia i els seus projectes germans. Per dur a terme aquest projecte la biblioteca compta amb la col·laboració de l’organització de voluntaris wikipedistes Amical Wikimedia i Wikimedia Espanya, i el Centre d’Estudis Locals de l’Eliana (CEL).

Aquest any celebrarem la cinquena viquimarató dedicada al 25è aniversari de la victòria de la Copa d’Europa de l’equip d’handbol femení l’Osito l’Eliana i així, a més del merescut homenatge, aportem contingut de l’esport femení a Viquipèdia.

En paraules de Francesc: “El que fa especial la viquimarató de l’Eliana, a més de ser l’únic esdeveniment recurrent anual d’aquestes característiques que es fa a Espanya, és precisament la seua regularitat. No és “trobada per editar”, són uns amics reunint-se, que a més gaudeixen editant Viquipèdia. “

I el tercer i darrer model, consisteix en com des del Col·legi de Bibliotecaris i Documentalistes de la Comunitat Valenciana (COBDCV) es creen aliances amb altres institucions per realitzar projectes viquipedistes,  entre ells la formació. Amb la signatura, el 2019, dels convenis amb les associacions viquipedistes, Wikimedia España i Amical Wikimedia es potencia i formalitza la col·laboració entre viquipedistes i professionals de les biblioteques. Entre les activitats coordinades des del Col·legi destaquen:

Una altra activitat, ja més informal, va ser la recollida de paperetes electorals durant les eleccions municipals del 2019, Wikimedia España va fer una crida i allà vam acudir bibliotecaris valencians. Ho podeu comprovar fent una ullada a la categoria de Wikimedia Commons: Ballot papers per a Spanish local elections, 2019.

Font: Bgasco CC-BY-SA 4.0

Al Workshop del #WikiLibCon, mostrarem els projectes que fem i crec que va quedar reflectit el nostre entusiasme. Som bibliotecaris compromesos amb el coneixement lliure, viquipedistes amateurs, i som plenament conscients del potencial de wikimedia a les biblioteques i a l’inrevés. L’esdeveniment de Maynooth va ser perfecte per fer-lo conèixer.

Gràcies a Núria Ferran, Laurie Bridges, Nkem Osuigwe i Rebecca O’Neill per organitzar aquest esdeveniment on s’ha pogut constatar la importància del tàndem wikimedia/biblioteques i tots els projectes que conjuntament es poden realitzar.

Gràcies a Wikimedia España per fer-se càrrec del viatge i a la Fundació Wikimedia per sufragar l’allotjament.

Mil gràcies als viquipedistes i amics valencians per fer d’aquests projectes unes “quedades” en pro del coneixement lliure i la diversió i per crear comunitat: Amparo, Montse, Lluís, Quico, Santi, Nino, Paco, …

I el darrer agraïment per als millors companys de viatge, Julia i Borja.

Autora: Barbara Gascó

Crònica VENI VIDI VIQUI

Personatges: Flamenc, Capsot, Quelet, Mèdol, Sorenike, els del Centre d’Estudis Calongins Colònico i la seva revista i un bon grupet de bona gent.

Ambientació: a Calonge i Sant Antoni, més específicament, Calonge, la Vila del Llibre! Dia confós entre promeses de pluja i sol.

S’aixeca el teló.

Alegre dissabte 27 d’agost del 2022 de trobada, convivència, amistat, bona teca, bon guiatge, i bonhomia en general.

Entrada a Calonge, on ens saluden les obres d’art de les rotondes: primer un enorme globus terraqüi format de braços d’acer articulats, l’anomenat Bola de “Moure el Món” (2004), dissenyat per un espectacle de la Fura dels Baus al Fòrum de les Cultures o Fòrum 2004, on sorgia de l’aigua, que va acabar ancorant a terra ferma a Calonge l’any següent. Després ve el torn de la “pinça” d’acer (2018 o 19), que dic jo, del Manuel Clemente Ochoa.

Arribats a la vila, aparquem al peu d’un gran mural d’art urbà – grafit de KRAM i JLoca (2014), amb un simpàtic gos punxadiscos, una mena d’anguila o barracuda, i més monstres i animalons. Després d’admirar-lo, i els altres murals propers, de seguida ens acoblem amb uns altres viquipedistes / amicalistes que ens guien fins al lloc de la trobada.

Ens endinsem en la bella vila, a peu, seguint els nostres guies improvisats, topant amb escultures i paraules esculpides, arbres monumentals i bells carrers i places…

Arribada a l’Espai Jove de Calonge, amb gent convergint al lloc des de diferents localitats de la contrada i fins i tot des de CatNord, Ponent, Girona, Bcn, etc. (I encara més impressionant, des de Vlaanderen / Flandes i Fryslân / Frísia! de certa manera…). La penya ve de totes bandes, vaja. Allí ens prenem una estona per fer petar la xerrada i esmorzar. Alguns s’escapen momentàniament per anar a visitar el castell des de fora, i els arbres espectaculars que l’acompanyen.

Comencen les breus xerrades i presentacions informals – en Capsot presenta la jornada, seguit d’en Flamenc, que parla de lloc i jornada. Després, des del Centre d’Estudis Calongins Colònico, ens expliquen qui son i el que fan, i un toc d’història local. També parlen en Mèdol, que presenta la Viquipèdia i Amical, i també en Quelet, que esmenta els temes de Viquidata (de fet, Wikidata) i els projectes tipus “més dones”. Després anem passant de persona en persona perquè tothom es presenti.  Una estona d’intercanvi interessant i agradable.

Dinar copiós, deliciós i animat per les converses sobre tot i entre tothom, al jardí – terrassa del restaurant Samal

Visita guiada estel·lar de la vila de la mà de l’amfitrió Flamenc, que ens parla d’història, de rieres i hidrografia, o, com li agrada dir a ell, secografia, :) :) , i també d’arquitectura i arcs torçats, de les llibreries de la Vila del Llibre (oficialment el Poble del Llibre, que li farem) i d’altres moltes coses…

Comencen a caure 4 gotes, tothom corrent…

Visita a casa del Flamenc! Per veure la misteriosa “perola” – tota una instal·lació a l’eixida, on es coïa el suro en temps pretèrits !!! i per xerrar i gaudir de la companyia, del jardí i l’espai arquitectònic interior (volta de canó feta amb la tècnica de la volta catalana, amb maó vist). Petit berenar, amb copa de cava inclòs! Preciós!

De camí cap a can Flamenc, tenim una experiència molt especial. I és que ens trobem amb la veïna nonagenària, una guspira eixerida i centellejant, ella! Xerrem a l’ampit de la finestra – ella per una banda, nosaltres per l’altra.

La desbandada just abans del xàfec, i tothom cap a casa; nosaltres, per exemple, amb un passi de celísties celestials que gaudim des de la finestra del cotxe.

Cau el teló. Fi de l’acte.

Autora: Catgirl

Les dones i la notabilitat a la Viquipèdia

Fa pocs dies ha aparegut un estudi d’una revista del grup de Nature (Laouenan et alA cross-verified database of notable people, 3500BC-2018AD, Scientific Data 9, 290 (2022) ) que proporciona el nom de la persona més notable per a cada indret del planeta (en general, municipis). La determinació de la persona més notable es fa a partir d’un índex relacionat amb diferents característiques de les biografies a les Wikipèdies en diferents llengües, i també en la presència a Wikidata. En l’atractiva aplicació, es pot visibilitzar de forma atractiva el nom de les persones més notables d’una zona d’arreu del planeta, i també anar fent zoom a diferents àrees i veure la persona més notable globalment o en cadascuna de quatre àmbits considerats.

Naturalment, en la zona de Catalunya en Salvador Dalí és molt notable, igual que n’és Joan Miró. Cal tenir en compte que això es refereix a totes les persones al llarg del temps, és a dir, que val per a personatges històrics com l’Abat Oliba, persones dels segles XIX i XX, i persones vives. A part, aquest estudi categoritza aquestes persones notables en quatre grans àmbit:  l’acadèmic-científic, l’esportiu, el cultural i el de lideratge.

El treball de Laouenan et al. ha consistit, a més de l’estudi pròpiament dit, en la (em fa l’efecte que una mica difícil) depuració de les dades obtingudes de les viquipèdies i de Wikidata, que a vegades no són pas gaire coherents. L’article i l’aplicació esmentats es poden obtenir de la xarxa – article: A cross-verified database of notable people, 3500BC-2018AD, https://www.nature.com/articles/s41597-022-01369-4; aplicació de visor: Notable People (https://tjukanovt.github.io/notable-people).

El resum en anglès és aquest:

A new strand of literature aims at building the most comprehensive and accurate database of notable individuals. We collect a massive amount of data from various editions of Wikipediaand Wikidata. Using deduplication techniques over these partially overlapping sources, we cross-verify each retrieved information. For some variables, Wikipedia adds 15% more information when missing in Wikidata. We find very few errors in the part of the database that contains the most documented individuals but nontrivial error rates in the bottom of the notability distribution, due to sparse information and classification errors or ambiguity. Our strategy results in a cross-verified database of 2.29 million individuals (an elite of 1/43,000 of human being having ever lived), including a third who are not present in the English edition of Wikipedia. Data collection is driven by specific social science questions on gender, economic growth, urban and cultural development. We document an Anglo-Saxon bias present in the English edition of Wikipedia, and document when it matters and when not.

Aquest estudi de Scientific Data (ni tampoc el mapa interactiu) no dóna, però, el mapa de la presència de dones segregada de la dels homes. Tal com passa en d’altres casos, però, només fent un cop d’ull als noms notables que propociona l’aplicació esmentada ja es veu clarament que la presència d’homes és molt superior a la de dones. Donada aquesta manca de segregació per gènere, ens ha semblat que seria interessant poder visibilitzar-la. Afortunadament, les persones autores d’aquesta publicació ofereixen els seus resultats de forma oberta. Això ens ha permès descarregar el fitxer i segregar les dades per homes i dones, tot limitant-ho a una àrea geogràfica que conté Catalunya de forma aproximada. Això permet veure en quins llocs (municipis, en general) la persona més notable és un home, i en quins és una dona – i visibilitzar clarament el biaix de gènere existent.

Com a curiositat cal esmentar que entre la informació detallada de l’article i del seu suplement, hi ha la de què la Viquipèdia catalana és la 16a en contribucions a aquest estudi. Cal dir també que aquest treball fa servir d’una foto de Wikipedia (en diferents llengües) i Wikidata de 2018, de tal forma que no té en compte les amplicacions posteriors.

Metodologia

Per tal de poder analitzar el biaix de gènere que manca al mapa, hem partit del fitxer de dades obertes proporcionat en aquest estudi de Laouenan et al. a Scientific Data, i s’ha generat un mapa de notabilitat i gènere, amb l’ajuda d’UMap (https://umap.openstreetmap.fr). L’estudi de la separació per gènere s’ha fet per a l’àrea compresa entre latituds 40,56N i 42,87N , i entre longituds 0,16E i 3,31E, que conté alguns municipis a part dels de Catalunya. Al fitxer de dades obertes, que conté més d’un milió de biografies, s’hi ha aplicat el filtre “cawiki”, per limitar l’anàlisi a les persones que tenen biografia a la Viquipèdia en català. Moltes persones d’aquestes tenen també biografia a eswiki, frwiki i enwiki (castellà, francès i anglès).

Anàlisi

Una anàlisi ràpida (gràcies a un petit programa en Python que fa servir els paquets d’accés a l’API de Wikidata) permet donar quatre números:

Persones notables dins de la zona considerada (amb presència a cawiki)

  • Homes: aprox. 91500 /un 83%)
  • Dones: aprox. 18500 (un 17%)

Llocs referenciats i persones notables:

  • Quantitat de llocs on hi ha persones notables: 640
  • Quantitat de llocs on hi ha homes notables: 590 (92%)
  • Quantitat de llocs on hi ha dones notables: 216 (34%)
  • Quantitat de llocs on només hi ha homes notables: 424 (66%)
  • Quantitat de llocs on només hi ha dones notables: 50 (8%)
  • Llocs amb un home com a més notable: 545 (85%)
  • Llocs amb un dona com a més notable:  95 (15%)

Mapes

Un cop d’ull als dos mapes que hi ha a continuació, elaborats a partir de les dades segregades que hem generat, ja fa palesa la diferència entre número de municipis on hi ha dones notables, i número de municipis on hi ha homes notables: hi ha una bona quantitat de municipis on no hi ha dones, i també una petita quantitat on no hi ha homes.

Mapa de llocs on hi ha al menys una dona notable (en blau)

Mapa de llocs on hi ha al menys un home notable (en vermell).

Una vegada vistos els mapes de municipis on hi ha dones notables i homes notables, ens podem fixar en el mapa conjunt, on s’hi proporciona el gènere de la persona més notable de cada lloc: vermell, municipi on la persona més notable és un home; blau, si és una dona.

És òbvia la diferència entre notabilitat i presència a la Viquipèdia entre dones i homes. Les causes són ben conegudes, però aquest estudi de Scientific Data proporciona una visió interessant quantitativa.

Els dos primers mapes es poden obtenir de https://umap.openstreetmap.fr/ca/map/notab-catalunya-area-aproximada_798292, on s’hi pot fer zoom en una zona determinada, a més de veure el nom de la persona de cada gènere més notable de cada lloc. S’hi pot seleccionar la capa de municipis amb homes notables i de municipis amb dones notables.

El tercer mapa, que proporciona el gènere de la persona més notable de cada lloc, es pot obtenir de https://umap.openstreetmap.fr/ca/map/dones-mes-notables-a-catalunya-per-municipi_798984. Passant el ratolí pel cim de cada punt s’hi veurà el nom de la persona més notable.

Aquesta anàlisi ens ha de permetre millorar el projecte #MesDones, del qual n’hem parlat alguna altra vegada. També contribuirà al projecte #WikiSciW (Dones i Ciència), si només mirem l’apartat acadèmic-científic; d’això, però, en parlarem en una segona part d’aquest estudi que hem efectuat.