Apple desvela el proceso que sigue para entrenar su inteligencia artificial utilizando datos del iPhone

Apple ha introducido una serie de funciones basadas en inteligencia artificial en sus dispositivos iPhone, iPad y Mac, que permiten a los usuarios acceder a herramientas de escritura para editar textos, recibir resúmenes mejorados de notificaciones, crear emojis a partir de descripciones textuales, entre otras características.

En este contexto, la empresa ha comunicado su estrategia para perfeccionar su inteligencia artificial, con el fin de que los usuarios logren resultados más satisfactorios al solicitar, por ejemplo, modificaciones en el tono de un mensaje redactado para un cliente clave o al pedir un emoji de una rana con sombrero de vaquero.

Para ello, Apple necesita acceder, de forma controlada, a los datos de los usuarios que hayan otorgado su consentimiento a través de la opción ‘Compartir análisis del iPhone’, disponible en la sección de ‘Privacidad y Seguridad’ dentro de la Configuración.

Una vez que algunos usuarios conceden este permiso, Apple emplea lo que denomina “datos sintéticos” para comenzar a entrenar sus modelos de inteligencia artificial según las particularidades de cada función.

“Los datos sintéticos se generan para replicar el formato y las características relevantes de los datos de los usuarios, pero no incluyen contenido producido por estos. Al crear datos sintéticos, nuestro propósito es elaborar oraciones o correos electrónicos sintéticos que tengan un tema o estilo suficientemente similar al real para mejorar nuestros modelos de resumen, sin que Apple recoja correos electrónicos del dispositivo”, explican.

En primer lugar, Apple utiliza un modelo de lenguaje avanzado (LLM, por sus siglas en inglés) para crear correos electrónicos sintéticos sobre diversos temas comunes. Por ejemplo, podría generar un mensaje como: “¿Te gustaría jugar al tenis mañana a las 11:30? ”. Este mensaje no corresponde a un usuario real, pero ilustra un tipo de conversación que podría ocurrir en la vida cotidiana.

A continuación, Apple convierte esos mensajes sintéticos en “incrustaciones”, que son representaciones matemáticas que capturan características esenciales del mensaje, como el idioma, el tema y la longitud.

Por ejemplo, en lugar de guardar el correo electrónico completo, la incrustación retiene únicamente una versión simplificada del mensaje, permitiendo analizar patrones sin recurrir a datos personales.

Estas incrustaciones se envían a algunos iPhones, Macs o iPads de usuarios que han habilitado el análisis de dispositivos para comparar los correos electrónicos reales recientes con las incrustaciones sintéticas.

El dispositivo selecciona cuál de las incrustaciones sintéticas se asemeja más a los mensajes reales del usuario, pero sin conocer la identidad exacta de cada correo electrónico. Esto se lleva a cabo utilizando la privacidad diferencial, una técnica que garantiza que los datos personales no se expongan durante el proceso.
Con base en esta información, Apple tiene la capacidad de identificar qué inserciones sintéticas se asemejan más a los correos electrónicos auténticos de los usuarios, utilizando dichos mensajes para perfeccionar sus modelos de inteligencia artificial.

GenEmoji permite a los usuarios crear emojis partiendo de descripciones que ellos mismos proporcionan. Por ejemplo, si el tema de “jugar al tenis” resulta ser popular, Apple podría generar nuevos mensajes sintéticos sustituyendo “tenis” por “fútbol” o “baloncesto”, incorporando estos nuevos ejemplos a su base de datos para optimizar la próxima ronda de entrenamiento de la IA.

“Los datos sintéticos pueden ser empleados para evaluar la eficacia de nuestros modelos con datos que sean más representativos e identificar áreas que requieran mejoras en funciones como el resumen”, señala Apple.

La compañía anticipa que los datos sintéticos potenciarán sus capacidades en inteligencia artificial. La herramienta que crea emojis desde descripciones del usuario se entrena de una forma diferente. Para aquellos usuarios que optan por compartir el Análisis de Dispositivos con Apple, se aplican métodos de privacidad diferencial para detectar patrones y las indicaciones más populares, sin vincularlas a individuos específicos ni revelar sugerencias poco comunes.

Este método permite a Apple analizar las mejoras en los modelos conforme a las indicaciones que representan mejor la interacción real del usuario, como cuando alguien solicita un Genmoji que incluya varias entidades (por ejemplo, “dinosaurio con sombrero de vaquero”).

Según Apple, este proceso garantiza que se reconozcan las indicaciones populares sin relacionarlas a dispositivos concretos ni acceder a sugerencias únicas.

Deja una respuesta Cancelar la respuesta