HYDERABAD, India/SAN FRANCISCO (Reuters) - Durante el año pasado, un equipo de hasta 260 trabajadores subcontratados en Hyderabad, India, ha revisado millones de fotos, actualizaciones de estado y otro contenido publicado desde 2014 en Facebook.
Los trabajadores clasifican los elementos según cinco “dimensiones”, como las llama Facebook.
Estos incluyen el tema de la publicación, por ejemplo: ¿Es comida, un selfie, un animal?; la ocasión: ¿Es una actividad diaria o un evento importante de la vida?; y la intención del autor: ¿Planificar un evento, inspirar, hacer una broma?
El trabajo está dirigido a comprender cómo está cambiando el tipo de contenido que los usuarios publican en sus servicios, dijo Facebook. Eso puede ayudar a la compañía a desarrollar nuevas funciones, lo que podría aumentar el uso y los ingresos por publicidad.
Los detalles del trabajo fueron proporcionados por varios empleados de la empresa de externalización de servicios Wipro durante varios meses. Los trabajadores hablaron bajo condición de anonimato por temor a represalias por parte de la firma india. Facebook después confirmó muchos detalles del proyecto. Wipro no quiso hacer comentarios y remitió todas las preguntas a Facebook.
Los trabajos de Wipro se encuentran entre los cerca de 200 proyectos de etiquetado de contenido que Facebook tiene en cualquier momento y emplean a miles de personas en todo el mundo, dijeron responsables de la compañía a Reuters.
Muchos proyectos tienen como objetivo “entrenar” al software que determina lo que aparece en el muro de los usuarios y potencia la inteligencia artificial (IA), que es la base de muchas otras herramientas.
Los trabajos de etiquetado no han sido anunciados anteriormente.
“Es una parte fundamental de lo que necesitas”, dijo Nipun Mathur, director de gestión de productos para IA en Facebook. “No veo que la necesidad desaparezca”.
El programa de etiquetado de contenido podría generar nuevos problemas de privacidad para Facebook, según expertos legales consultados por Reuters. La compañía se enfrenta a investigaciones regulatorias en todo el mundo sobre un conjunto no relacionado de supuestos abusos de privacidad que involucran el intercambio de datos de usuarios con socios comerciales.
Los trabajadores de Wipro dijeron que obtienen mayor acceso a la vida de las personas al ver una foto de vacaciones o una publicación conmemorativa de un familiar fallecido. Facebook reconoció que algunas publicaciones, incluidas capturas de pantalla y las que tienen comentarios, pueden incluir nombres de usuarios.
La compañía dijo que sus equipos legales y de privacidad deben aprobar todos los esfuerzos de etiquetado, y agregó que recientemente introdujo un sistema de auditoría “para garantizar que se cumplan las expectativas de privacidad y que los parámetros estén funcionando como se esperaba”.
Sin embargo, un exdirectivo de privacidad de Facebook, hablando bajo condición de anonimato, expresó su inquietud por el escrutinio de las publicaciones de los usuarios sin su permiso explícito.
El Reglamento General de Protección de Datos (GDPR, por sus siglas en inglés) de la Unión Europea tiene normas estrictas sobre cómo las empresas recopilan y utilizan datos personales y, en muchos casos, requieren un consentimiento específico.
“Una de las piezas clave del GDPR es la limitación del propósito”, dijo John Kennedy, socio de la firma de abogados Wiggin y Dana, que ha trabajado en externalización, privacidad e inteligencia artificial.
Si el propósito es buscar publicaciones para mejorar la precisión de los servicios, eso debería expresarse explícitamente, dijo Kennedy. El uso de un proveedor externo para el trabajo también podría requerir el consentimiento, señaló.
No está claro exactamente cómo se interpretará el GDPR y si los reguladores y los consumidores verían las prácticas de etiquetado interno de Facebook como problemáticas. El principal funcionario de privacidad de datos de Europa se negó a comentar sobre posibles preocupaciones.
Una portavoz de Facebook dijo: “Dejamos claro en nuestra política de datos que usamos la información que la gente proporciona a Facebook para mejorar su experiencia y que podríamos trabajar con proveedores de servicios para ayudar en este proceso”.
El senador estadounidense Mark Warner, un demócrata y uno de los principales críticos de las redes sociales, dijo a Reuters en un comunicado que las grandes plataformas cada vez “están tomando más y más datos de los usuarios, para usos más amplios y de mayor alcance, sin ninguna compensación correspondiente para el usuario”.
Warner dijo que está redactando un proyecto de ley que requeriría que Facebook “revele el valor de los datos de los usuarios y les diga a los usuarios exactamente cómo se están monetizando sus datos”.
EL PROYECTO
El etiquetado de contenido realizado por personas, también conocido como “anotación de datos”, es una industria en crecimiento a medida que las compañías buscan aprovechar los datos para el entrenamiento de la IA y otros fines.
Compañías de vehículos sin conductor, como Waymo, de la conocida Alphabet, tienen etiquetadores que identifican semáforos y peatones en vídeos para fortalecer su IA. Los desarrolladores de asistentes de voz, incluido Amazon, tienen personas que anotan el audio del cliente para mejorar la capacidad de Ia para descifrar el habla.
Facebook lanzó el proyecto Wipro en abril del año pasado. La firma india recibió un contrato de 4 millones de dólares y formó un equipo de unos 260 etiquetadores, según los trabajadores. El año pasado, el trabajo consistió en analizar publicaciones de los cinco años anteriores.
Tras completar esa tarea, el equipo en diciembre se redujo a alrededor de 30 personas y se dedicó a etiquetar cada mes las publicaciones del mes anterior. Se espera que el trabajo dure al menos hasta finales de 2019, dijeron.
Facebook confirmó los cambios de personal, pero se negó a comentar sobre los detalles financieros.
La compañía dijo que su análisis está en curso por lo que no pudo proporcionar ningún resultado del etiquetado o las decisiones resultantes del producto. No les ha dicho a los etiquetadores el propósito o los resultados del proyecto, y los trabajadores dijeron que todo lo que han deducido desde su visión limitada es que los selfies son cada vez más populares.
Los etiquetadores de Wipro y Facebook dijeron que las publicaciones son una muestra aleatoria de actualizaciones de estado basadas en texto, enlaces compartidos, publicaciones de eventos, historias, vídeos y fotos, incluidas capturas de pantalla de chats publicadas por los usuarios en varias aplicaciones de mensajería de Facebook. Las publicaciones provienen de usuarios de Facebook e Instagram de todo el mundo, en idiomas que incluyen inglés, hindi y árabe.
Cada elemento llega a dos etiquetadores para verificar la precisión, y un tercero si no están de acuerdo, dijo Facebook. Los trabajadores dijeron que ven en promedio 700 artículos por día. Facebook dijo que el promedio objetivo es menor. Reuters