Twitter no alertará del lenguaje ofensivo en contextos coloquiales

A partir de ahora, Twitter advertirá a los usuarios que van a publicar un tuit ofensivo o desagradable con un pantallazo que les invita a pensar dos veces lo que están escribiendo antes de publicarlo. El sistema lleva probándose desde el pasado verano y desde hoy ya está disponible para todos los usuarios de la app de iOS de Twitter.
Los pantallazos se mostrarán en principio a todos los usuarios de Twitter en inglés
Según ha confirmado Twitter a través de un tuit en su cuenta oficial, la herramienta también estará disponible muy pronto para los usuarios de la red social en Android. De momento se desconoce si se implementará también en la versión de escritorio. Eso sí, en un principio estos pantallazos solo se mostrarán a los usuarios que emplean la red social en inglés, aunque el objetivo es lanzarlo para todos los 193 millones de usuarios de la red social en los próximos meses.
After testing and improving prompts that ask you to review a potentially harmful or offensive reply, we learned that this feature can help encourage more meaningful convos.
We’re now rolling out these prompts on iOS and soon Android. https://t.co/GdnEGrIvfM pic.twitter.com/5hrK0mrd8f
— Twitter Support (@TwitterSupport) May 5, 2021
Durante la fase de pruebas de la herramienta, Twitter ha estado mejorando la manera en la que su algoritmo detecta el contenido que pueda resultar ofensivo o desagradable. Para ello, se ha perfeccionado el algoritmo de Twitter para que tenga en cuenta variables como el tipo de relación que el usuario mantiene con la persona a la que va a responder.
En este sentido, si se suele interactuar con la persona a la que se va a escribir, Twitter será más permisivo, al entender que se pueden estar empleando ciertas expresiones coloquiales en un tono de comunicación amistoso que en otro contexto podrían ser consideradas un insulto.
De la misma manera, también se ha refinado el algoritmo para detectar con éxito el lenguaje ofensivo cuando no se utiliza de forma despectiva, en un contexto por ejemplo de humor, y es más sensible a aquellos términos utilizados por minorías o determinados grupos de población.
Según los resultados de los tests realizados por Twitter en los últimos meses con esta herramienta, el 34% de los usuarios que recibe un pantallazo invitándoles a pensarse dos veces lo que van a escribir matizan sus palabras o deciden no enviar el mensaje. Los usuarios que ya han sido advertidos en una ocasión registran luego hasta un 11% menos de respuestas ofensivas.