Twitter har offentliggjort algoritmene
Fredag kveld delte Twitter to samlinger med datakode som blant annet utgjør algoritmene som bestemmer hvilke tweets brukerne ser i sin For You-feed. Selskapet publiserte også en bloggpost som forklarte hvordan algoritmene fungere.
– Publiseringen av den såkalte algoritmen vil være ganske pinlig, og folk vil finne mange feil, men vi vil fikse dem veldig raskt. Selv om du ikke er enig i noe, vil du i det minste vite hvorfor det er der, og at du ikke blir manipulert i det skjulte, sa Elon Musk i en diskusjon på Twitter Spaces etter publiseringen.
Publiseringen kommer etter at Musk flere ganger har lovet at Twitters algoritmer skal deles som åpen kildekode. Selskapet sier at kode som kan påvirke brukeres sikkerhet, personinformasjon eller selskapets forretningshemmeligheter ikke er offentliggjort.
Twitter sier også at de jobber med å lage verktøy som skal gjøre det mulig for andre å komme med forslag til forbedringer i koden.
Prosessen for å velge ut hvilke tweets en bruker får se består av tre hovedsteg:
Today marks a new era of transparency for Twitter. 🧵
— Twitter Engineering (@TwitterEng) March 31, 2023
We’re sharing much of the source code that powers our platform with the world. Visit our blog to learn more about this initiative: https://t.co/hTHVpuMDz8
1. Et utvalg av de beste tweetene hentes fra ulike kilder blant både kontoer du følger og kontoer du ikke følger.
2. Kunstig intelligens ranger hver enkelt tweet.
3. Filtre fjerner tweets fra blant annet brukere du har blokkert, tweets du allerede har sett og tweets med uønsket innhold.
– Vi forsøker å plukke ut de 1500 beste tweetene fra et utvalg på flere hundre millioner. I dag består For You-feeden i snitt av 50 prosent tweets fra folk du følger og 50 prosent fra folk du ikke følger, skriver de i bloggposten.
I tillegg til koden som er offentliggjort, bruker Twitter kunstig intelligens til å rangere tweetene i utvalget. Den kunstige intelligensen er en modell med over 48 millioner parametere, som kontinuerlig trenes på hva som skaper positivt engasjement, altså likes, retweets og kommentarer. Modellen gir hver enkelt tweet en poengsum, basert på tusenvis av signaler om tweeten, innholdet og avsenderen.
Our “algorithm” is overly complex & not fully understood internally. People will discover many silly things , but we’ll patch issues as soon as they’re found!
— Elon Musk (@elonmusk) March 17, 2023
We’re developing a simplified approach to serve more compelling tweets, but it’s still a work in progress. That’ll also…
Det første kommentarene fra eksperter som har studert koden som er offentliggjort sier at algoritmene er veldig komplekse, men at de ikke har funnet noen overraskelser foreløpig. De har imidlertid funnet funksjoner som identifiserer om tweets er fra Elon Musk, ‘power users’, demokrater og republikanere. En Twitter-utvikler sa i diskusjonen på Twitter Spaces at disse kun ble brukt til statistikkformål.
Digital Services Act, EUs reguleringspakke for digitale tjenester, stiller krav til at plattformene skal være åpne om hvordan algoritmene velger ut innhold for brukerne. Alle de store plattformene har publisert bloggposter som forklarer strukturen i algoritmene, men med publiseringen av selve datakoden tar Twitter åpenheten til et nytt nivå.