La darrera setmana he treballat en solucionar un error que afectava als suggeriments d’imatge (T193132). Quan un usuari seleccionava una imatge i decidia canviar-la per una altra, automàticament es carregaven suggeriments per facilitar-li la feina. Tanmateix, aquestes propostes que apareixien no tenien res a veure amb el tema sobre el qual s’estava escrivint, sinó que per defecte apareixia sempre «Content Translation».
Inicialment, creia que –per lògica– l’error es trobaria en alguna part del codi de l’eina de traducció de contingut. Anava errat, però: finalment, el meu mentor va trobar l’error al codi de l’editor visual. Això és degut a les dependències que té el traductor de contingut: recicla certes parts del codi d’altres extensions, i de vegades n’adapta altres per acomodar les seves necessitats.
Van
aparèixer tres enfocaments per resoldre la qüestió. D’una banda,
atacar el problema des de l’editor visual tenint en compte el cas
per l’eina de traducció de contingut, que vaig proposar. De
l’altra, adaptar el codi des de l’eina de traducció de
contingut, que va proposar el meu mentor. Finalment, un altre usuari
va trobar una variable que sempre servia com a títol de la pàgina
que s’està traduint, sense necessitat de diferenciar els dos
casos.
De la mateixa manera, ara toca decidir des d’on apareixerà l’avís per traduir imatges a través de l’eina SVG Translate. Espero haver enllestit tot això abans de la següent entrada al blog.
Des d’Amical Wikimedia ens ocupem de promoure i difondre la cultura catalana mitjançant els diversos projectes Wikimedia. Sovint s’associa Amical amb la Viquipèdia, però la realitat és que la Viquipèdia és només un dels projectes de coneixement lliure que abastem (si bé el més conegut). Un d’ells és el Viccionari, el diccionari lliure i multilingüe en català.
També se sol associar Amical amb la llengua catalana, però en realitat ens ocupem de qualsevol aspecte relacionat amb la nostra cultura. I la llengua de signes catalana, tot i no estar lingüísticament relacionada amb el català oral, sí que forma part de la nostra cultura. En aquest sentit, durant les últimes setmanes hem estat engegant un projecte per ampliar els continguts en llengua de signes catalana al Viccionari.
La llengua de signes catalana (LSC) és una llengua natural pròpia de Catalunya parlada per unes 25.000 persones, de les quals aproximadament la meitat són sordes. Tot i estar reconeguda pel Parlament des del 2010, es tracta d’una llengua minoritària però prou viva dins la comunitat sorda; a diferència del que ocorre amb les llengües orals, la LSC és l’única llengua de signes de Catalunya.
A mitjan abril d’aquest any ens vam posar en contacte amb el Centre d’Estudis de la LSC de la Universitat Pompeu Fabra. Donat que ja feia un temps que volíem iniciar un projecte amb aquesta llengua, la institució ens va donar l’assessorament necessari per dur-la a terme. Durant les següents setmanes, vam realitzar un buidatge dels vídeos del vocabulari bàsic de la LSC publicat per la Direcció General de Política Lingüística sota llicència Creative Commons Compartir Igual, perfectament compatible amb la llicència del Viccionari.
Després de dos mesos, hem passat de tenir menys de cent entrades en LSC a tenir-ne prop de 1.000. La llista completa de signes està disponible al següent enllaç: https://ca.wiktionary.org/wiki/Categoria:Glosses_en_llengua_de_signes_catalana. La inclusió de la LSC en un diccionari té una complicació important, i és que no hi ha cap convenció universal per a l’ordenament i la representació escrita d’un signe. Nosaltres, amb l’aprovació de la comunitat de voluntaris que editen el Viccionari, vam decidir utilitzar glosses, és a dir, representar-hi el signe utilitzant la paraula (o paraules) més properes en català. Aquest sistema té els seus problemes, però facilita enormement la cerca de signes.
Si bé estem molt orgullos d’haver arribat fins aquí, això és només el principi. A banda de voler incorporar més signes, també estem preparant un sistema per classificar els signes basant-nos en els paràmetres fonològics propis de la LSC com, per exemple, la configuració manual del signe. Un proper pas natural és també la col·laboració amb institucions del País Valencià per incorporar-hi la llengua de signes valenciana, que té la seva pròpia singularitat i no es considera un dialecte de la LSC.
Sobre el Viccionari
Logo del Viccionari
Actualment aquest projecte Wikimedia en català, constituït com a recull lexicogràfic, té més de 400.000 accepcions de mots en català, però també d’altres llengües, i inclou flexions gramaticals, de gènere i de nombre, etimologies, pronunciacions, locucions, sinònims i antònims, etc. De la mateixa manera que la Viquipèdia, és una plataforma editable per qualsevol persona i està sotmès a les llicències Creative Commons Reconeixement i Compartir Igual.
Si voleu estar a l’aguait sobre el progrés del projecte, seguiu-nos al Twitter del @Viccionari. I si us interessen les llengües de signes i ens voleu ajudar, podeu enviar-nos un correu electrònic a comunicació@wikimedia.cat. Esperem que aquesta tasca sigui un pas més en la obertura a la diversitat lingüística del nostre territori!
Participants a la Wikimedia Hackathon. Fotografia de Pierre-Selim Huard, retocada per Bryan Davis [CC BY 4.0]
Entre el 17 i el 19 de maig es va celebrar a la Biblioteca Tècnica Nacional de Praga la Wikimedia Hackathon 2019. En aquest esdeveniment hi van assistir més de 200 participants, principalment de perfil tècnic, de més de 20 nacionalitats diferents.
Entre els projectes més interessants que vam conèixer hi ha l’Scribe, un projecte d’una investigadora de la Universitat de Southampton per facilitar la creació d’articles. La manera de facilitar-ho és a través de col·leccions de referències que l’eina troba sola, i a partir de les dades que hi ha sobre el tema a Wikidata. Durant la Hackathon es van posar les primeres pedres d’aquesta eina, que veurem com evoluciona.
Vam assistir també a la sessió sobre l’Outreach Dashboard, una eina que permet crear campanyes i cursos on s’hi poden inscriure professors i alumnes, amb l’avantatge de poder veure les dades quantitatives més fàcilment. Sembla que encara ara l’eina té força problemes, i que els professors no s’han adaptat bé a les diverses interfícies amb què han de treballar.
D’altra banda, vam anar a la trobada que hi havia d’estratègia del moviment, on hi havia una forta presència de membres de la Fundació Wikimedia i de Wikimedia Deutschland (tant a la sessió com a la Hackathon). Sembla ser que el grup de treball sobre tecnologia no ha funcionat gaire bé, i la quantitat de respostes que han rebut és pràcticament nul·la.
Interior de la Biblioteca Tècnica Nacional de Praga
A nivell tècnic, les sessions més interessants han estat la de Kubernetes i la de Pywikibot. Mitjançant Kubernetes es pot facilitar molt el procés d’instal·lació de Mediawiki, i facilitar així l’entrada de nous desenvolupadors. Pel que fa a Pywikibot, és la llibreria principal per programar robots per la Viquipèdia, i automatitzar així moltes tasques. Tots dos projectes tenen molt de potencial, però sembla ser que s’hi estan invertint pocs recursos, en favor d’altres projectes que sovint acaben tenint menys impacte.
Precisament, una tònica al llarg de la Hackathon ha estat el finançament. Cada cop es fa més èmfasi en aquest aspecte, i expliquen que han posposat projectes si els semblava que no es podien fer per falta de recursos.
Abans, semblava que l’única cosa que podia aturar els desenvolupadors era la falta de ganes. Sempre hi havia alguna persona disposada a treballar molt, a canvi de res, per fer un projecte que li interessés. El món dels desenvolupadors s’ha començat a professionalitzar a un ritme frenètic, i la filosofia que havia imperat als projectes, i que ens havia portat on érem, s’està perdent.
Alhora, però, no estem notant els avantatges d’alliberar gent de perfil tècnic: el suport que vam rebre a la Hackathon sovint es va reduir a “obre una tasca a Phabricator” (l’eina de coordinació per resoldre problemes tècnics), que encara esperen resposta. I no són pas problemes menors: hem detectat que hi ha gent que encara veu l’avís del tancament de la Viquipèdia del passat 24 de març, i malgrat saber la font de l’error, encara no s’han posat a esmenar-ho.
En conclusió, va ser una Hackathon interessant, tant per alguns projectes que vam conèixer com pels contactes que vam fer, però que ens va deixar un regust amarg per com s’estan fent les coses a nivell internacional.
Segona entrada al blog sobre el meu progrés en marc del Google Summer of Code! A la primera vaig parlar sobre l’àmbit del treball, que és, resumidament, millorar l’eina de traducció automàtica que hi ha per als projectes Wikimedia. Oficialment, el període de desenvolupament va començar el 27 de maig; ara bé, per solapament amb el curs acadèmic he hagut d’endarrerir el moment de centrar-hi tots els meus esforços. Així, recuperaré aquest parell de setmanes a partir de l’agost, i espero seguir participant en l’eina de traducció acabat l’estiu.
Discussions
L’eina de traducció de contingut ha arribat per quedar-s’hi. Recentment, des de la Fundació Wikimedia van proposar treure-la de les funcionalitats beta i incorporar-la per defecte a tots els usuaris. Aquesta proposta no va tenir massa bona acollida entre els viquipedistes, que creuen que hi ha problemes massa grans per fer aquest salt. Precisament miraré de solucionar alguna de les queixes que ha aparegut durant aquest estiu.
Instal·lacions
Fa uns mesos, en preparació per començar a desenvolupar, em vaig instal·lar tot el programari necessari, inclosa l’extensió de Content Translation i les dependències necessàries, seguint la documentació que hi havia a la pàgina de Mediawiki. Aparentment, la instal·lació —molt feixuga— s’havia completat satisfactòriament.
Tanmateix, després de jugar-hi una mica, vaig veure que certes parts no es carregaven totalment bé. Després de mirar-nos-ho amb el meu mentor, Petar Petković, vam adonar-nos que la versió que t’acabaves instal·lant si seguies el procediment de la documentació era la de fa dos anys. Vam trobar una solució temporal, a l’espera de reinstal·lar-ho tot i, posteriorment, actualitzar la documentació.
Propers passos
Ara, alliberat ja d’exàmens, començo a familiaritzar-me més amb el flux de l’eina, per començar a treballar en afegir traduccions d’imatges vectorials.
Sempre havia estat molt crític amb l’eina de traducció de contingut per diverses raons. La qualitat de les traduccions deixava molt a desitjar, sovint deixava coses sense traduir i traduïa el que no feia falta, i provocava destrosses a nivell de codi. Sovint, les traduccions que feia amb aquesta eina em portaven més feina que traduir-lo a la manera clàssica.
Durant l’estiu, treballaré en resoldre molts problemes amb els quals m’havia topat com a usuari, en marc del programa Google Summer of Code. No era la meva intenció inicial, de fet, dedicar-me a la traducció de contingut.
Havia vist que, a partir d’una proposta de la llista de desitjos d’eines de fa un parell d’anys, s’havia creat una eina anomenada SVG Translate, que permetia traduir imatges fàcilment amb aquest format. Amb una interfície molt senzilla, doncs, és possible fer el que es fa en el triple de temps amb programari com Inkscape. Dins de la llista de tasques d’aquest projecte, n’hi havia una que em va cridar molt l’atenció: integrar aquesta eina dins del Content Translator. Així, no caldria sortir de la pròpia Viquipèdia per traduir aquestes imatges.
La proposta va agradar a qui portava la traducció de fitxers SVG, però les persones que tallen el bacallà del Content Translator no ho van veure tant clar. Així, van proposar com a alternativa que aparegués una caixa al costat de les imatges a l’eina de traducció, amb un enllaç cap a l’SVG Translate. Personalment, no em sembla la millor solució: crec que hauríem de, en la mesura que sigui possible, integrar les eines del Labs a la pròpia Viquipèdia.
Vaig comentar que
per resoldre aquesta tasca no calien tres mesos, i vaig demanar més
feina. En Pau Giner em va suggerir treballar en altres tasques de
l’eina de traducció de contingut: d’una banda, arreglar els
problemes mencionats al principi amb les referències; de l’altra,
arreglar les traduccions d’enllaços (és a dir, que no es
tradueixi San Francisco a Sant Francesc, especialment si està
enllaçat a la pàgina «San Francisco»).
Malauradament, ningú
que treballés en l’eina de traducció va assistir a la Hackathon
de Praga, així que allà vaig aprofitar per fer altres contactes i
explorar altres projectes. Sí que em va semblar molt interessant el
progrés que s’ha fet per instal·lar MediaWiki a través de
Kubernetes. Quan ho vaig instal·lar fa un temps, per començar a
jugar amb el codi de l’eina de traducció, vaig estar-m’hi ben bé
un parell d’hores; amb Kubernetes, amb deu minuts ja ho tenia tot
solucionat.