Como había prometido, en nombre de la transparencia, Elon Musk publicó en GitHub gran parte del código fuente que utiliza la compañía para hacer andar Twitter.
El CEO de Twitter, Elon Musk, hizo historia este viernes, en favor de la transparencia. A partir de abril, Twitter ha hecho público una parte de su código fuente para la inspección pública, incluido el polémico algoritmo que utiliza para recomendar tweets en las líneas de tiempo de los usuarios.
En GitHub, Twitter publicó dos repositorios que contienen gran parte del código que la empresa utiliza para que muchas partes de la red social funcionen, incluido el mecanismo que Twitter usa para controlar los tweets que los usuarios ven en la línea de tiempo “For You”/”Para Vos”.
En el pasado, este algoritmo fue duramente criticado por los usuarios de la red social debido a que suprimía los tweets y las tendencias de derecha, y promovía las de izquierda. Obviamente, eran puras especulaciones hasta que Elon Musk compró la compañía y confirmó, a través de los #TwitterFiles, que este era el caso.
Según el también CEO de Tesla y SpaceX, a las pocas semanas de tomar control de Twitter, cambió completamente el código fuente. Ahora, para demostrar que verdaderamente lo hizo y para dar un histórico paso hacia la transparencia, lo hará público para que cualquiera pueda entrar y comprobarlo.
En una sesión de Twitter Spaces este viernes, Musk aclaró: “Nuestro lanzamiento inicial del llamado algoritmo será bastante vergonzoso, y la gente encontrará muchos errores, pero los corregiremos muy rápidamente”.
“Incluso si no estás de acuerdo con algo, al menos sabrás por qué está ahí y que no estás siendo manipulado en secreto… El análogo, aquí, al que aspiramos es el gran ejemplo de Linux como un sistema operativo de código abierto… Uno puede, en teoría, descubrir muchos exploits para Linux. En realidad, lo que sucede es que la comunidad identifica y corrige esos exploits”, explicó el magnate.
Por su parte, aclaró que estas publicaciones no incluyen el código que impulsa las recomendaciones de anuncios de Twitter, debido a que esto es información que debe mantenerse confidencial por cuestiones contractuales con los clientes que compran publicidad en la red social.
Además, si bien se muestra cómo el algoritmo opera para crear la página de recomendación, por el momento, Twitter no publicó los datos utilizados para entrenar el algoritmo, ya que podría comprometer información personal de los usuarios.
“Excluimos cualquier código que comprometiera la seguridad y la privacidad del usuario o la capacidad de proteger nuestra plataforma de los malos actores, lo que incluye socavar nuestros esfuerzos para combatir la explotación y manipulación sexual infantil”, aseguró.
“Vamos a buscar sugerencias, no solo sobre errores, sino también sobre cómo debería funcionar el algoritmo”, dijo Musk en la sesión de Spaces. “Va a ser un proceso en evolución. No esperaría que fuera un movimiento ascendente continuo… pero estamos muy abiertos a lo que podría mejorar la experiencia del usuario“, concluyó.
A primera vista, el algoritmo es bastante complejo, pero no necesariamente sorprendente desde un punto de vista técnico. Se compone de múltiples modelos, incluido uno que detecta contenido “Not Safe For Work“, violento o abusivo, luego determina la probabilidad de que un usuario de Twitter interactúe con otro usuario en base a ese tweet y calcula la “reputación” que esa publicación tendrá para aparecer o no entre las recomendaciones que uno lee en su página principal.
La página “For You”/”Para Vos” está populada por tweets de personas que uno sigue, pero también por tweets que ellos han likeado, retuiteado o incluso, tweets de personas que son seguidas por las personas que uno sigue. Esta masa de publicaciones es ordenada por esta “reputación”.
Siempre se supo que los tweets eran clasificados en base a algún puntaje, pero ahora sabemos en qué se basa. El algoritmo inspecciona el contenido del tweet, busca palabras clave como “muerte”, “matar”, “pornografía”, “suicidio”, entre otras, también tiene un sofisticado código que permite “leer en contexto” e interpretar si el tweet es abusivo contra otra persona.
No hay hallazgos de palabras clave relacionadas con cuestiones extremistas o con las vacunas o con el COVID-19, algo que definitivamente fue eliminado por Elon Musk porque antes era imposible publicar un tweet sobre estos temas sin que desapareciera de la faz de Twitter.
Pero si hay “etiquetas” que se usan para identificar un tweet como proveniente de un “demócrata“, un “republicano“, o un usuario “importante” (“power“). Incluso hay una etiqueta que indica si un tweet proviene de Elon Musk o no.
El magnate mencionó en el space que están buscando un reemplazo para esta parte del algoritmo. “No me gusta ponerle etiquetas a los tweets de la gente, estamos viendo como no hacerlo más“, mencionó.
Varias redes neuronales son responsables de clasificar los tweets y recomendar cuentas a seguir, mientras que un componente de filtrado oculta los tweets para, según la propia explicación de Twitter, “apoyar el cumplimiento legal, mejorar la calidad del producto, aumentar la confianza del usuario, proteger los ingresos mediante el uso de tratamientos de productos visibles y filtrados duros y una clasificación descendente de granularidad gruesa“.
Según se puede ver en el algoritmo, Twitter intenta extraer los “mejores” 1.500 tweets de los millones que clasifican para aparecer en la página “For You”/”Para Vos”. Además, esta línea de tiempo consiste en un 50% de tweets de personas que seguís, y otro 50% de personas que no seguís, con un énfasis puesto en las noticias, sin preferencia de qué medio, solo se prioriza a las cuentas verificadas o blue.
La clasificación se logra con una red neuronal de casi 48 millones de parámetros que se capacita continuamente en las interacciones de los tweets para optimizar la participación positiva. Por ejemplo, los likes, los retweets y las respuestas, pero también tiempo que tardas en leer un tweet, si después de ver ese tweet vas a ver el usuario, el tiempo que pasa entre que likeas dos tweets de un mismo usuario, o hasta la cantidad de tiempo que pasas viendo sus imágenes y videos.
The post Paso histórico: Elon Musk hizo público el algoritmo de recomendación de Twitter first appeared on La Derecha Diario.