Visibilització del domini públic a Wikidata

Per David Ramírez (Hiperterminal)

Cada 1 de gener se celebra el Dia del Domini Públic, en el què els drets d’autor de determinades obres i autors finalitzen i, per tant, entren en el domini públic. Amb els meus amics de la Fundación Conector a Colòmbia vam fer un viquiprojecte per publicar o millorar a Wikidata elements de les persones que passen a domini public cada 1 de gener. El directori del projecte es pot visitar a la Wiki de Wikimedia Colombia.

A la darrera edició de la Viquitrobada, celebrada a Sabadell al novembre, vaig presentar els resultats d’aquest viquiprojecte i ara m’agradaria comentar-ne algunes idees clau. La meva presentació es pot veure en aquest enllaç i el text està penjat a Commons. Aquí explico com el viquiprojecte va trobar només 44 persones de Colòmbia a Wikidata en domini public i com va crear els elements necesaris en Wikidata per publicar els 195 que tenim registrats, gràcies a la celebració anual de la Biblioteca Nacional de Colòmbia.

El viquiprojecte proposa una metodologia amb unes propietats de Wikidata que permeten que pugui ser replicat. D’aquesta manera s’estandaritzen les propietats per identificar una persona que és part del domini públic. Per altra banda, vam crear visualitzacions de dades que ens permetren entendre la composició del domini públic colombià. Per exemple, tenim només un 2,2% de dones al domini públic de la Biblioteca Nacional de Colòmbia i un 4% de dones en domini públic a Wikidata.

Figura 1: Distribució de homes (dalt) i de dones (sota) en domini públic de Colòmbia a Wikidata.

Durant la presentació vaig fer també una revisió de les iniciatives catalanes de la celebració de dia del domini públic. Hi ha articles del 2019 i 2021. La meva proposta es que sigui una celebració regular. Podem fer-ho des de Bibliowikis per vincular a les institucions culturals o GLAM com es diu ara.

Durant el debat obert de la presentació, es va comentar la possibilitat de posar informació a la infotaula de les biografies de Viquipedia quan una persona pasa a domini públic. Per part meva, vaig proposar traduir al català la calculadora de domini públic. El repte aquí no és nomes la traducció, sino que s’hauria de revisar els plaços de protecció de la llei a Catalunya per garantir que les dates son correctes. Entre els enllaços d’interes es va esmentar el Centre d’Estudi del domini públic de l’Universitat de Duke.

Val a dir que el Dia del domini públic 2025 ja té article a la Viquipèdia. El company Lluis tgn ha fet una llista per identificar les persones que pasan a domini públic a Catalunya. Aquesta pot ser una molt bona oportunitat per crear o millorar la documentació oberta que tenim disponible de les seves obres.

El cas “silva”: de com el treball col·laboratiu millora la Viquipèdia… i les enciclopèdies tradicionals

Com de fiable és la Viquipèdia? Aquesta és la pregunta que sovint se’n fan els usuaris. És evident que el funcionament de la Viquipèdia és diferent al d’una enciclopèdia tradicional, en què els continguts són elaborats professionalment per especialistes. A primer cop d’ull, pot semblar que aquesta fórmula ofereix millors garanties que una enciclopèdia participativa, dinàmica i colaborativa com la Viquipèdia. Però això implicaria obviar un factor determinant: la passió que la majoria d’editors senten pel projecte i el seu zel per aconseguir que la Viquipèdia tingui la màxima qualitat. Això fa que no només es detectin i corregeixin errors interns sinó que, a vegades, també pot servir per a millorar el contingut de les enciclopèdies tradicionals. Això és el que ha passat a propòsit de l’entrada referent a la silva, un tipus de composició poètica, i la definició que en feia la Gran Enciclopèdia Catalana (GEC).

Aquesta petita història s’origina, com tantes altres, a La Taverna, l’espai de debat obert de la Viquipèdia, quan fa un parell de setmanaes un editor, Alzinous, apunta una sèrie de dubtes en relació a l’article de la silva, creat fa més d’una dècada: exactament quins tipus de versos s’hi combinen? I realment s’ha fet servir aquesta composició en la literatura catalana? A partir d’aquí s’estableix un diàleg en què hi intervenen sis editors més i que, pas a pas, va aclarint la qüestió. En primer lloc, la silva en català alternaria versos decasíl·labs i hexasíl·labs (a diferència del castellà, en què els versos tindrien una síl·laba més), ja que la mètrica catalana comptabilitza fins la darrera síl·laba tònica. Segon, tot i que és un tipus de composició especialment utilitzada en la poesia en castellà a partir del segle XVII, també l’han conreada autors catalans com Francesc Fontanella o Jacint Verdaguer.

Jacint Verdaguer és un dels poetes que ha fet servir la silva en llengua catalana.

En base a això es complementa l’entrada de la silva, que originàriament només contenia informació sobre aquesta forma poètica en castellà, clarificant-ne la mètrica catalana pròpia i afegint un exemple d’un poema de Francesc Fontanella (l’entrada original només incorporava com a exemple una silva de Miguel de Unamuno). Però, a més, com que en el procés s’ha detectat que l’entrada original feia servir com a font la corresponent de la GEC, que només es referia a la silva en la mètrica castellana, els viquipedistes s’hi posen en contacte assenyalant-los aquesta circumstància (la versió en línia de la GEC permet aquesta opció de contacte directe des de cadascuna de les entrades). En unes poques hores, des de la GEC responien que, efectivament, la seva entrada corresponent a “silva” era “incompleta” i l’ampliaven per incloure la seva caracterització en la mètrica catalana.

Tot plegat, en quatre dies de treball col·lectiu i col·laboratiu per part d’un grup de voluntaris del coneixement lliure.

Com es diu sovint, la Viquipèdia és una idea que només pot funcionar en la pràctica.

L’onzena Viquillengua millora durant una setmana els continguts sobre la ràdio en català a la Viquipèdia

La Viquillengua ha dedicat l’onzena edició a la ràdio en català, coincidint amb la commemoració del centenari de la ràdio a Catalunya. Durant la setmana del 8 al 15 de novembre, una cinquantena de voluntaris van editar 55 articles de la Viquipèdia en català, dels quals 18 eren de nova creació. En conjunt, els 47 usuaris registrats van afegir 92.073 octets en català. A més de la participació individual, la Viquillengua va organitzar trobades presencials en diverses ciutats com Tarragona, Reus, Sabadell, Alcúdia, Perpinyà i Andorra.

La Viquillengua és una activitat organitzada anualment per Amical Wikimedia i per Política Lingüística de la Generalitat de Catalunya des de l’any 2013, a la qual s’hi van sumar tots els territoris de parla catalana l’any 2020. Aquesta edició ha estat organitzada pel Departament de Política Lingüística de la Generalitat de Catalunya i Amical Wikimedia, juntament amb el Govern d’Andorra, l’Institut d’Estudis Baleàrics, l’Oficina Pública de la Llengua Catalana (Catalunya del Nord) i la Delegació del Govern de la Generalitat de Catalunya a Itàlia.

Taller d’edició a la Universitat de Perpinyà el 13 de novembre de 2024. Foto: Xavier Espinet/OPLC

Durant els dies que dura aquesta viquimarató, els voluntaris amplien amb referències fiables els articles de la Viquipèdia en català relacionats amb el tema proposat. Alhora, aquest esdeveniment serveix d’introducció a l’edició de la Viquipèdia a aquells participants que encara no estan avesats al seu funcionament.

(Nota de premsa oficial del departament de Política Lingüística de la Generalitat de Catalunya)

Amical facilita l’enregistrament d’interpretacions de ‘lieder’ de Schubert i altres compositors per tal d’incorporar-les a Commons

Per segon any consecutiu, Amical Wikimedia ha col·laborat amb l’Associació Franz Schubert I l’Escola Superior de Música de Catalunya (ESMUC) en l’enregistrament de les interpretacions de diversos lieder (composicions breus en alemany per a veu i piano), que posteriorment seran dipositats a Wikimedia Commons de manera que es puguin fer servir lliurement a la Viquipèdia i la resta de projectes germans, entre d’altres usos. Els intèrprets d’aquests lieder són els alumnes del Curs Internacional d’Interpretació de Lied Wolfram Rieger, que s’ha celebrat al llarg de la setmana passada a Barcelona.

Els participants en el curs, provinents de Catalunya, Espanya, Alemanya i Suïssa, han treballat un total de 80 lieder. Finalment, en el concert de tancament del curs, diumenge, cadascun dels nou duos (veu i piano) va interpretar dues peces d’autors com Franz Schubert, Richard Strauss, Johannes Brahms, Fanny Mendelssohn, Clara Schumann, Hugo Wolf i Victor Ullmann, que van ser enregistrades en directe. El curs l’ha dirigit Wolfram Rieger, professor de la Hochschule für Musik “Hanns Eisler” de Berlin.

Els participants en el curs. Foto: Sílvia Pujalte Piñán

Aquesta col·laboració amb l’Associació Franz Schubert i l’ESMUC es va iniciar el 2023, impulsada per la junta anterior d’Amical. En aquella ocasió es van enregistrar una quinzena de lieder composats per Franz Liszt i Gustav Mahler, a més de Schubert, Schumann i Wolf. Una mostra de resultat final és l’entrada del lied An Silvia de Franz Schubert, que ja incorpora la interpretació musical enregistrada l’any passat.

Un moment del concert. Foto: Sílvia Pujalte Piñán

El projecte és un exemple de l’acció que Amical desenvolupa per afavorir el coneixement lliure. Es tracta de composicions que ja no estan condicionades pels drets d’autor dels seus compositors donat que ja han entrat al domini públic (excepte en algun cas, de manera que seran catorze els lieder que es pujaran a Commons). Quant a les interpretacions, els participants en el curs les autoritzen sota una llicència Creative Commons compatible amb els projectes Wikimedia. A canvi, ells també poden fer servir els enregistraments com una mostra de la seva feina i capacitats.

Viquipèdia i Intel·ligència artificial, a casa i amb gasosa

Per Cataleirxs

Ja fa uns anys que sentim a parlar de la intel·ligència artificial (IA) i la relació que ha de tenir amb els projectes de la Wikimedia Foundation. Com a usuari, crec que l’IA ens ajudarà a automatitzar tasques de manteniment i facilitarà l’edició d’articles, permetent-nos crear i ampliar entrades de qualitat amb més rapidesa. També tindrem l’oportunitat de generar imatges o crear gràfics per a il·lustrar els nostres articles. Tanmateix, això planteja un repte per als patrullaires, que podran trobar-se amb centenars o milers d’articles creats en pocs minuts per robots amb conflicte d’interessos, traduccions poc precises i referències potser inventades.

Considero que hem de permetre l’ús de la IA però amb la condició que sigui obligatòria una validació humana abans de publicar els articles. Fa gairebé un parell d’anys vaig utilitzar ChatGPT per millorar un parell d’articles sobre dos expresidents, un asiàtic i un americà. Eren articles en català amb poques frases, però que disposaven de fitxes a Wikidata (WD) amb molta informació i referències. Vaig copiar les dades de WD, les vaig enganxar a GPT i vaig demanar que les transformés en prosa. Tot i que la redacció inicial no era gaire polida, després d’algunes millores vaig aconseguir uns articles curts però acceptables.

Des de llavors, les aplicacions d’IA han millorat considerablement. Recentment, vaig voler provar de crear un article sense proporcionar cap informació a GPT, només els prompts. Vaig triar l’article aranzel, que apareix en la llista dels 10.000 articles essencials, que aleshores tan sols contenia el text que ara n’és la introducció (només he retocat un pèl el text i substituït un parell de referències).

Una IA escriu un text sobre la IA (imatge generada per IA) | Microsoft Designer, CC0, via Wikimedia Commons.

A la pàgina de discussió trobareu els 8 prompts que vaig introduir al GPT, per si sentiu curiositat. Els 4 primers els vaig fer servir per crear les seccions “Història dels aranzels” i “Arguments a favor i en contra”, mentre que els altres 4 van servir per a la secció “Aranzels als Països Catalans”. Em va semblar curiós que el redactat de la primera meitat de respostes va ser molt més clara que la segona, on el text divagava i inclús repetia alguns conceptes. Potser les fonts que va consultar la màquina eren limitades i va haver d’improvisar? També vaig haver de fer una mica de purga per eliminar l’excés d’americocentrisme. D’altra banda, no em vaig atrevir a aprofundir més en conceptes de teoria econòmica , ja que penso que el text que n’hauria sorgit requeriria la revisió d’algú amb coneixements avançats en aquest tema.

Quan vaig tenir el text complet, vaig incorporar enllaços interns, imatges i una norantena de referències que validaven el text final. En la meva opinió, el resultat és satisfactori i pot servir com a mostra de les avantatges que podem trobar en una IA tutelada. M’agradaria saber les vostres opinions sobre aquest experiment, què us sembla com ha quedat l’article, si ja havíeu fet alguna prova i de quin abast, o com veieu el futur de Wikimedia en el món de la IA.