
Los algoritmos de código abierto de Twitter son más complejos de lo que sugiere Musk
abril 28, 2022
De todas las grandes ideas que tiene Elon Musk para Twitter, la que ha lanzado con más fervor es hacer que los algoritmos de la plataforma sean de código abierto.
El magnate Tesla propuso el plan antes de que se revelara su oferta de adquisición, la reiteró el día en que se reveló su oferta y la volvió a presentar después de que se confirmó el trato.
Musk presentó su propuesta durante una Charla TED el 14 de abril:
Simplemente es muy importante que las personas tengan tanto la realidad como la percepción de que pueden expresarse libremente dentro de los límites de la ley. Entonces, una de las cosas que creo que debería hacer Twitter es abrir el algoritmo.
Musk argumentó que revelar lo que amplifica o degrada los tuits reduciría el riesgo de «manipulación tras bambalinas».
¿Cómo cambiaría Elon Musk Twitter si lo comprara? Primero, lo haría de código abierto. Mirar @Elon Muskes muy variado vivir #TED2022 entrevista con @TEDChris seguro @YouTube aquí: https://t.co/dFFUxNqLZe pic.twitter.com/Okm3y5HpEy
— Charlas TED (@TEDTalks) 14 de abril de 2022
El enfoque ha ganado el apoyo de algunos defensores de la transparencia y críticos de la moderación de contenido de Twitter. Argumentan que esta decisión revelará cómo Twitter determina lo que ves en tu línea de tiempo y lo que no.
«Tiene el potencial de convertir a Twitter en una plataforma verdaderamente confiable, donde los usuarios entienden por qué ciertos tweets aparecen en la parte superior de la lista y se elimina cualquier preocupación sobre el secreto o el sesgo detrás de escena», dijo Marc Linster, CTO. de la empresa de bases de datos de código abierto EDB.
«Estas preocupaciones han sido endémicas con Google y Facebook. Este movimiento hacia el código abierto podría cambiar las reglas del juego para las redes sociales en general».
Los escépticos, sin embargo, cuestionaron la viabilidad del plan. Señalan que Twitter se compone de varias fuentes, desde la sección Tendencias hasta la línea de tiempo de su hogar, cada una controlada por una combinación compleja de sistemas de recomendación y decisiones humanas.
Estos procesos producen resultados que incluso sus desarrolladores no entienden completamente. Algunos de ellos se hubiera burlado de Musk agregando un repositorio público (ahora eliminado) a la plataforma GitHub de la empresa, sin código.
SOLO EN – Los empleados de Twitter aparentemente agregaron un repositorio público llamado «el algoritmo» a la cuenta de Github de la plataforma poco antes del bloqueo del código fuente.
Musk dijo que quería que el algoritmo de Twitter fuera de código abierto. pic.twitter.com/cKNmwh6iuT
— Divulgar.tv (@disclosetv) 25 de abril de 2022
Otro problema es que los algoritmos por sí solos ofrecen información limitada.
Hay varios otros factores detrás de la clasificación de un tweet. Incluyen el contenido que ingresa a la plataforma, el perfil de cada usuario, los datos de entrenamiento del algoritmo, las reglas de moderación y el código que entrenó a los modelos.
Estos constituyen una enorme reserva de datos, difíciles de explorar y costosos de difundir.
«No puedes simplemente abrir un ML [machine learning] modelo como si fuera una implementación tipo burbuja”, dijo Steve Teixeira, vicepresidente de producto de Twitter.
Por supuesto, dejamos de lado por ahora que muchas personas que dicen esto ya entienden que no se puede simplemente abrir un modelo ML como si fuera una implementación tipo burbuja.
—Steve Teixeira 🦇 (@stevetex) 17 de abril de 2022
Otras complejidades surgen de la mutabilidad del sistema.
«Por lo general, los patrones de recomendación se reciclan con bastante frecuencia y seguirán cambiando con el tiempo», dijo a TNW Bindu Reddy, director ejecutivo y cofundador de Abacus.AI, una empresa emergente de inteligencia artificial.
«Si bien también es posible publicar todos los modelos entrenados continuamente, eso tampoco será muy útil a menos que comprenda exactamente qué entradas y salidas entran en el modelo para las predicciones».
También existen los peligros potenciales de la propuesta de código abierto.
Los competidores podrían copiar la información, ser un objetivo tentador para los ciberdelincuentes y violar la privacidad del usuario. También podría obstaculizar otra de las ambiciones de Musk: «derrotar a los spambots».
Por otro lado, el código abierto ofrece nuevas oportunidades para encontrar vulnerabilidades y lagunas.
Si hace algo de código abierto, ¿no será más fácil encontrar vulnerabilidades?
Sí, pero también hará que sea más fácil depurar, auditar, bifurcar, confiar, probar y construir.
— cdixon.eth (@cdixon) 26 de abril de 2022
Reddy es optimista sobre los beneficios potenciales. Ella argumenta que el algoritmo de clasificación de código abierto será útil para investigar y evaluar cualquier sesgo.
También espera encontrar más información sobre los componentes de la infraestructura que influyen en lo que se informa y se filtra en los feeds.
«Abrir obtener estos algoritmos, y lo que es más importante, estos modelos, contribuirá en gran medida a la transparencia”, dijo.
Otro destacado defensor del enfoque es el cofundador de Twitter, Jack Dorsey.
El ex director ejecutivo de la compañía sugirió dejar que los usuarios elijan qué algoritmo usan, si es que usan alguno.
Elegir qué algoritmo usar (o no) debería estar abierto a todos https://t.co/o2DkSTWW0O
— jack⚡️ (@jack) 25 de marzo de 2022
Dorsey planea crear un mercado abierto para algoritmos.
Los usuarios elegirían el que mejor se adapte a sus deseos, desde priorizar conversaciones matizadas hasta resaltar un flujo constante de trampas de sed.
Eso suena potencialmente idílico, especialmente si puede evitar que mi feed muestre constantemente tweets odiosos de Elon Musk.