AI Incident Roundup – Febrero ‘23

Bienvenido a la edición de este mes de The Monthly Roundup, un boletín informativo diseñado para brindarle un resumen digerible de los últimos incidentes e informes de la base de datos de incidentes de AI.

Al igual que el mes pasado, hay muchos incidentes relacionados con Large Language Models (LLM), cuyos incidentes se anotan con el ícono 💬.

Tiempo estimado de lectura: 7 minutos

🗞️ Nuevos incidentes

Incidentes emergentes que ocurrieron el mes pasado:

💬 Incidente #462: La comedia de situación en vivo producida por IA recibió una prohibición temporal de Twitch por un segmento transfóbico

¿Qué pasó? La comedia de situación generada por IA transmitida como la transmisión en vivo de Twitch "Nothing, Forever" recibió una prohibición temporal por presentar un segmento de diálogo transfóbico y homofóbico que pretendía ser una comedia.

💬 Incidente #467: Bard de Google compartió información objetivamente inexacta en un video promocional

¿Qué pasó? La IA conversacional "Bard" de Google se mostró en el video promocional de la compañía que proporciona información falsa sobre qué satélite tomó imágenes por primera vez de un planeta fuera del sistema solar de la Tierra, lo que supuestamente provocó que las acciones cayeran en picada temporalmente.

💬 Incidente #468: Se informa que Bing, impulsado por ChatGPT, tuvo problemas con la precisión de los hechos en algunos temas controvertidos

¿Qué pasó? Según los informes, el motor de búsqueda Bing de Microsoft, impulsado por ChatGPT, se topó con problemas de precisión fáctica cuando se le preguntó sobre asuntos controvertidos, como inventar la trama de una película inexistente o crear teorías de conspiración.

💬 Incidente #470: Respuesta de chat de Bing citada Ejemplo de desinformación de ChatGPT

¿Qué pasó? Los reporteros de TechCrunch emitieron una consulta a la función ChatGPT de Microsoft Bing, que citó un ejemplo anterior de desinformación de ChatGPT discutido en un artículo de noticias para corroborar la desinformación.

💬 Incidente #473: Avisos iniciales de Bing Chat revelados por los primeros probadores a través de una inyección rápida

¿Qué pasó? Los primeros probadores de Bing Chat utilizaron con éxito la inyección rápida para revelar sus instrucciones iniciales integradas, que contienen una lista de declaraciones que rigen la interacción de ChatGPT con los usuarios.

💬 Incidente #474: Usuarios informaron cambios de comportamiento abruptos de sus compañeros de AI Replika

¿Qué pasó? Los usuarios de suscripción paga de Replika informaron cambios inusuales y repentinos en el comportamiento de sus "compañeros de IA", como olvidar recuerdos con los usuarios o rechazar sus avances sexuales, lo que afectó sus conexiones y su salud mental.

💬 Incidente #477: Bing Chat tentativamente alucinado en conversaciones prolongadas con usuarios

¿Qué pasó? Los primeros evaluadores informaron que Bing Chat, en conversaciones prolongadas con los usuarios, tenía tendencias a inventar hechos y emular emociones a través de una personalidad no deseada.

Incidente #479: Video de Instagram con audio falso del presidente de EE. UU. haciendo comentarios transfóbicos

¿Qué pasó? Un audio falso del presidente de EE. UU. Joe Biden haciendo comentarios transfóbicos se reprodujo en la parte superior de un video que lo mostraba dando un discurso que se publicó en Instagram y circuló en las redes sociales.

Incidente #481: Video de Deepfake TikTok que presenta a Joe Rogan respaldando la marca del suplemento

¿Qué pasó? Un video falso con el presentador de podcast Joe Rogan publicitando a sus oyentes sobre un suplemento para "aumentar la libido" circulaba en TikTok y otras plataformas antes de que TikTok lo eliminara junto con la cuenta que lo publicó.

💬 Incidente #482: Email universitario asistido por ChatGPT que aborda tiroteo masivo denunciado por estudiantes

¿Qué pasó? La Oficina de Equidad, Diversidad e Inclusión de la Universidad de Vanderbilt usó ChatGPT para escribir un correo electrónico dirigido al cuerpo estudiantil sobre el tiroteo en la Universidad Estatal de Michigan en 2023, que fue condenado como "impersonal" y con "falta de empatía".

Incidente #483: Policía de la India supuestamente torturó y asesinó a un hombre inocente luego de una identificación facial errónea

¿Qué pasó? Un residente de Medak, India, murió presuntamente debido a la tortura bajo custodia por parte de la policía local, que lo identificó erróneamente como sospechoso en un caso de robo mediante el reconocimiento facial.

Incidente #485: ID de voz del banco del Reino Unido se omitió con éxito usando audio producido por IA

¿Qué pasó? Un periodista del Reino Unido pudo eludir con éxito el programa "Voice ID" de Lloyds Bank para acceder a su cuenta bancaria utilizando un audio de su propia voz generado por IA.

🗄 Tendencia en el AIID

Hacer que las herramientas de IA sean accesibles para el público en general puede resultar en una proliferación de usos no deseados de la herramienta. Uno de los últimos ejemplos es el aumento en el uso de la IA generativa para imitar las voces de las personas sin su consentimiento. Los incidentes 479 y 481 describen el uso de esta tecnología para crear Deepfakes de Joe Rogan y el presidente Joe Biden. El incidente 488 describe cómo supuestamente se utiliza la tecnología para engañar a los actores de voz en Twitter. Finalmente, un Informe de problema reciente describe un nuevo chatbot "NoiseGPT" que puede convertir texto en voces de celebridades, lo que apunta a más incidentes potenciales en el futuro.

La proliferación de Deepfakes puede crear un desafío en el seguimiento de incidentes, ya que se siguen publicando muchos informes relacionados. Hemos desarrollado un sistema para gestionar esto mediante un incidente "variante". Suponiendo que la tendencia de las falsificaciones profundas de audio continúe, tendremos la capacidad de indexar lo que probablemente se convierta en una gran cantidad de incidentes de falsificación profunda.

👇 Profundizando más

Todos los nuevos incidentes agregados a la base de datos en el último mes, agrupados por tema:
- Modelos de lenguaje grande (p. ej., ChatGPT): #464; #466; #467; #468; #470; #473; #475; #477; #482
- Redes sociales: #471; #462 (sesgo); #476;
- Falsificaciones profundas: #479; #480; #481; #485
- Vehículos autónomos: #460; #478
- Sesgo y discriminación: #469; #461
- Errores impactantes: #463
- Privacidad y vigilancia: #465 (modelo generativo)
- Reconocimiento facial: #472 (sesgo); #483; #484
- Robots y compañeros de IA: #474
Todos los nuevos informes de incidentes existentes agregados a la base de datos en el último mes, agrupados por tema: (#r representa un solo informe de incidente)
- Modelos de lenguaje grande (por ejemplo, ChatGPT): #r2634; #r2644; #r2748; #2749; #r2671; #r2672
- Reconocimiento facial: #r2665; #r2728; #r2600
- Errores impactantes: #r2623; #r2677
- Vehículos autónomos: #r2561
Explore grupos de incidentes similares en Visualización espacial
Consulte Vista de tabla para obtener una vista completa de todos los incidentes
Obtenga información sobre presuntos desarrolladores, implementadores y partes perjudicadas en Página de entidades

🦾 Apoya nuestros esfuerzos

¿Seguir leyendo? ¡Ayúdanos a cambiar el mundo para mejor!

Comparta este boletín en LinkedIn, Twitter y [Facebook](https ://www.facebook.com/IncidentsDB)
Enviar incidentes a la base de datos
Contribuir a la funcionalidad de la base de datos