OpenRefine introduction talk

Just over two weeks ago, I got the chance to give my first OpenRefine talk in Wikimedia Portugal’s celebrations of the Wikidata tenth birthday. Although Zoom gave me some technical troubles in the start, I think the actual talk went pretty well. You can judge for yourself because the video is published on their YouTube channel (where my struggles luckily has been taken out). It’s a quick walkthrough of the interface and some of the strategies you might have when using OpenRefine. In it, I am doing some cleaning of a dataset and reconcile it with Wikidata and make upload some of the data.

Mentor on Hack for Earth 2022

Earlier this week, I had the honor to be a mentor in the Hack for Earth hackathon. I had signed up to be a mentor for open source, open data and anything related to Wikimedia. Unfortunately, I didn’t get any questions that were related to this, but I did get the chance to help some of the participants to find their way around the challenges and the formalities of the contest. And I did get to record a tiny “Hello!” video that got a small spot in the closing ceremony of the hackathon.

Govdirectory recognized as Digital Public Goods

I have mentioned Govdirectory before, and even told about the Wikidata community award it received. But today I think I am even a bit prouder, as it was recognized by the Digital Public Goods Alliance by being added to their Digital Public Goods registry. Read our full announcement here.

T-shirtdesign för Wikidatas 10-årsdag

English below.

Planering pågår världen över för Wikidata tioårsdag (29 oktober) och det har annonserats om möjligheter att ansöka om medel för att arrangera lokala evenemang i samband med detta. Det var när ytterligare en sådan påminnelse kom sm jag började fundera om jag skulle dra ihop något här där jag bor, och vad jag i så fall skulle behöva pengar för. En sak som nämndes var att de inte skulle göra någon merchandise centralt och skicka runt i världen, utan istället hade satt ihop grafik så att man skulle kunna göra det själv istället. Eftersom att det fanns fina SVG filer tänkte jag att man skulle kunna göra något snyggt t-shirttryck.

WD10 – landscape background – light.svg, av Lea Lacroix (WMDE), CC BY-SA 4.0

Och då en av bakgrundbilderna hade ett synnerligen grafiskt mönster väcktes idén om en t-shirt med “all over print”. Sagt och gjort, jag laddade också ner loggan, började knåpa och leta leverantörer. Efter en del slit, SVG-filerna var krångligt konstruerade, hade jag i alla fall både print-filer och leverantör. 33 euro och en vecka senare, voilá! Filerna jag använde för att trycka finns på Wikimedia Commons.

T-shirt design for Wikidata’s 10th anniversary

Planning is underway worldwide for Wikidata’s tenth anniversary (October 29) and opportunities to apply for funding to host local events have been announced. It was when another such reminder came that I started thinking about whether I should pull something together here where I live, and if so, what I would need money for. One thing that was mentioned was that they would not make any merchandise centrally and send it around the world, but instead had put together graphics so that you could do it yourself instead. Since there were nice SVG files, I thought it would be possible to make some nice t-shirt printing.

And when one of the background images had a particularly graphic pattern, the idea of a t-shirt with “all over print” sprung to mind. All said and done, I also downloaded the logo, started tinkering and looking for suppliers. After some hard work, the SVG files were complexly constructed, I at least had both print files and supplier. 33 euros and a week later, voilá! The files I used for the print can be found on Wikimedia Commons.

Två kortkurser på EU Academy

Jag såg häromdagen att EU har en utbildningssajt, EU Academy, och blev nyfiken på vad de erbjöd. Till min glädje fann jag snabbt två kurser som var intressanta. En relevant för jobbet, Digital-ready policymaking och en som tangerar mina hobbys väl, Wikibase and Semantic MediaWiki for data-driven semantics. Jag tänkte att jag skulle testa på dem för att se vad nivån på kurserna.

Digital-ready policymaking

Den här kursen gick igenom ett antal grundläggande aspekter och jag kände igen en del sedan tidigare. Innehållet är bra och inspirerande, men det är en ganska kort kurs, så man får nog kalla det en introduktionskurs. För den som precis ska börja jobba med digitala policies så är det här en utmärkt start. Om alla riksdagsledamöter tog kursen så skulle det nog bli ett stort lyft för samhället i stort då principerna är övergripande och kan appliceras på frågor i de flesta utskott.

Wikibase and Semantic MediaWiki for data-driven semantics

Här blev det istället en hel del djupare ämneskunskap, och det är ju såklart ett smalare fält om specifik mjukvara. Innehållet var rikare, med långa pedagogiska videolektioner av experter i området. För mig som hållit på med Wikidata i snart tio år var det inte mycket nytt, men det var kul att se hur även EU:s institutioner använder sig av Wikibase och hur omfattande arbete de har gjort.

Certifiering

Båda kurserna avslutas med quiz, och sedan kan man ladda ner ett certifikat, det var en fin touch.

Slutsats

Kurserna var pedagogiska och välgjorda så jag kommer nog att kika på fler. Om någon presenterar ett certifikat kan det vara värt att kolla upp kursen, för även om det finns veckolånga kurser och certifikaten ser pampiga ut så kan de representera så lite som några timmars insats.

Det svenska språket

I våras såg jag att en känd Wikimedian, Asaf Bartov, hade översatt en dikt från hebreiska till engelska. Titeln “The Swedish tounge” gjorde mig nyfiken och jag blev inte besviken. Dikten var skriven av Nathan Alterman 1943 och var en hyllning till hur Sverige tog emot judiska flyktingar utan onödig byråkrati. Oerhört fin, men samtidigt skar den bjärt mot samtidens migrationsdebatt. Jag sökte, men fann inga svenska översättningar, och det kändes nästan som att det svenska folket hade missunnats denna skatt. Jag påbörjade en översättning och Asaf gav mig även tips om en äldre engelsk översättning som hjälp. Efter att jag hade en första version kopplade Asaf ihop mig med Galit Hasan-Rokem, professor och översättare av bland annat Tranströmer till hebreiska. Tillsammans lyckades vi åstadkomma en översättning som vi var nöjda med. Och nu har den för första gången blivit publicerad, i Upsala Nya Tidning (med en liten sidoartikel om hur den kom till). Eftersom att den ligger bakom en betalvägg där parallellpublicerar jag den här.

Det svenska språket

Få känner till det svenska språket
Vem talar det? Kanske ingen utom svenskarna.
För landet är litet och långt ifrån stråket,
nationen glömd mellan bergen och fjärdarna.

Och när Sverige sa: “Av oss skydd ska de få,
alla judar som flyr över gränsen den danska”,
alla världens folk kunde se och förstå
hur fattigt det är språket det svenska.

Många stater hade redan gjort deklarationer,
gömda skatter av retoriska stilfigurer,
orden ‘visum’ och ‘kvot’ och ‘infiltrationer’ …
Men i svenska saknas dessa krumelurer.

När en yngling till Sverige blir jagad,
hon hänvisar ej till kartorna enveten.
Hon tar honom in och till hemmet ledsagar
”migrationskollapsen” helt omedveten.

Det finns stater i världen med sjufaldiga bredder
som kan ge skydd och släcka törst.
Men innan de kunde en drunknande rädda
de älskar att slå i sitt lexikon först.

Deras ordförråd – bevingat och färgsprakande  –
med “kapacitetsbrist” och “integrationskvalitet”.
Bara i Sverige råder en barbarisk sed,
man erbjuder sängplats och en varm kopp te.

Definitioner, därför, gör henne ej valhänt,
ej heller byråkrati och formalitet,
hon skriver helt enkelt “Inträde godkänt” …
Må Gud förlåta hennes stilistiska fattighet.

Sverige, Sverige, sa Gud och en tår föll ner, –
två glömda ord skrev ni på er port.
Men de är värda traktat och encyklopedier,
till och med Britannica om än aldrig så stort.

Och änglarna viskade så man knappt kunde höra.
De sa till varann: vilken avgrund det är
om dessa två enkla ord må beröra
Den Högsta till tårar i sin höga sfär.

Nathan Alterman, 1943
Översättning av Jan Ainali och Galit Hasan-Rokem, 2022

Bilden genererad av Midjourney med prompten “jewish refugees welcomed to sweden ww2 in the style of a political cartoon”. CC BY-NC 4.0

A Wikipedian’s ode

we add letters and words
edit grammar and spelling
you may think we are nerds
that find sharing compelling

add a little fact here
to what started as stubs
builds upon another one there
evolving topical hubs

there are changes in haste
it all goes so quickly
not a minute to waste
that's right, it's a wiki

a citation to add
a statement to check
the laugh that you had
reverted by tech

if you add something wrong
or edit in spite
it won't be for long
undos make it right

you can't add that spice
or the celebrity mock
you have to be nice
or there will be a block

but contribute you can
there's no magic to it
no need to be superman
just press edit and do it

while most people read
only few make an edit
an invisible deed
that rarely gets credit

you come here to know
or just to spend time
we hope that you grow
and you send us a dime

although the knowledge is free
and editors volunteers
tech comes with a fee
and we're not billionaires

we do it with lust
we do it with pleasure
we won't say 'you must'
it's all at your leisure

we try to sum up
what we all understood
we're still just a pup
but we do it for good

Originally published at meta.wikimedia.org.
License: CC BY-SA 4.0

Abstract image showing something that resembles a bookcase and books and a person sitting in front of them.
Image by Midjourney.

In the Advisory Committee of OpenRefine

A couple of weeks back, I joined the Advisory Committee of OpenRefine. I have been a user of OpenRefine for a while, mainly for its superb reconciliation capabilities to Wikidata.

While the name suggests a passive role, the Advisory Committee acts more like a board of trustees in other organizations. As mentioned in the blog post linked above, I hope that my experience from non-profits and grant applications, my recent experience as a codebase steward in the Foundation for Public Code combined by also being an end user might bring something valuable to the table.

💎 Let’s clean up some messy data! 💎

Backing up podcasts

I saw a short and sweet blog post about backing up podcasts by Ed Summers. And since he encouraged people to copy his approach, I gave it a try.

In essence this was just downloading a file from my podcast player, look at how the page from Ed worked and styled it a bit (borrowing from my short link site aina.li) and upload them. Quite easy!

The bonus is of course that you can explore all the podcasts I listen to. If you find something new that interests you that you subscribe to, do leave a comment or ping me on social media.

Mest visade artiklar

För andra året i rad blev jag fascinerad av läsa QZ:s sammanställning av den mest lästa artikeln på engelskspråkiga Wikipedia. Det ger en snabb inblick i vad som folk hade i tankarna den dagen. Det ledde mig till att tänka att det vore kul med en liknande sammanställning för svenskspråkiga Wikipedia. Eftersom det är en wiki behöver vi ju inte vänta till slutet av året heller, utan kunde sätta igång på en gång. Jag gjorde en enkel prototyp och pejlade läget med gemenskapen. Då det var positivt satte jag igång och snyggade till det hela. Med hjälp av de (relativt) nya funktionerna med CSS för enskilda sidor gick det att få till något som ser hyfsat ut. Du kan gå in och beskåda detta på Wikipedia:Mest visade artiklar.

Mest visade artiklar i januari 2022.