La Era
Tecnología

GitHub modifica política de datos de Copilot para entrenar modelos de IA

A partir del 24 de abril, GitHub utilizará datos de interacción de usuarios de Copilot para mejorar sus modelos de inteligencia artificial. Los usuarios de versiones gratuitas y Pro podrán optar por no participar en esta recopilación. Los planes empresariales y de empresa permanecen exentos de este cambio.

La Era

2 min de lectura

GitHub Updates Copilot Data Policy to Train AI Models on Free and Pro User Interactions
GitHub Updates Copilot Data Policy to Train AI Models on Free and Pro User Interactions

GitHub ha anunciado oficialmente un cambio en su política de uso de datos para el entrenamiento de modelos de inteligencia artificial a partir del próximo 24 de abril. La plataforma utilizará las interacciones de usuarios de las versiones gratuitas y Pro para mejorar sus herramientas de programación. Los suscriptores de planes empresariales y de empresa no se ven afectados por esta modificación específica.

La recopilación incluirá entradas, salidas, fragmentos de código y el contexto asociado durante el uso activo de Copilot. Los usuarios interesados pueden desactivar esta opción mediante la configuración de privacidad de su cuenta específica. Las preferencias previas de exclusión se mantendrán activas de forma automática y respetadas.

Esta decisión se alinea con las prácticas establecidas en la industria tecnológica para el desarrollo de herramientas de IA avanzadas. Microsoft ha utilizado previamente datos de sus propios empleados para refinar los modelos con resultados medibles positivos. La incorporación de datos reales de desarrolladores externos busca diversificar los casos de uso existentes.

Los datos específicos que podrían utilizarse abarcan desde retroalimentación sobre sugerencias hasta patrones de navegación y nombres de archivos. La empresa aclara explícitamente que no compartirá esta información con proveedores de modelos de IA de terceros o externos. Tampoco se usará contenido de repositorios privados almacenados en reposo bajo ninguna circunstancia.

Mario Rodríguez, director de producto de GitHub, explicó que la participación ayuda a comprender mejor los flujos de trabajo de desarrollo actuales. Según el comunicado oficial, los datos reales permiten entregar sugerencias de código más precisas y seguras para los usuarios. La contribución de los usuarios tiene un impacto directo y medible en la calidad de las herramientas.

Aunque el procesamiento de código es necesario para ejecutar el servicio correctamente, los datos en reposo permanecen protegidos. La información puede compartirse con afiliados dentro del grupo corporativo de Microsoft y sus filiales. Esto incluye empresas de la familia corporativa sin revelar datos sensibles a servicios independientes del ecosistema.

El objetivo final es desarrollar una inteligencia artificial que acelere los flujos de trabajo de los programadores de manera eficiente. Los modelos mejorados deberían ayudar a detectar errores potenciales antes de llegar a producción en entornos reales. La estrategia busca equilibrar el avance tecnológico con la seguridad y privacidad del desarrollador.

Los usuarios que no deseen participar conservarán acceso completo a las funciones de IA conocidas sin restricciones. La plataforma ofrece una sección de preguntas frecuentes para aclarar dudas técnicas sobre la privacidad de los datos. La implementación comenzará a aplicarse inmediatamente tras el anuncio oficial de la empresa.

Este cambio refleja la tendencia global de utilizar datos de interacción para entrenar sistemas generativos en el mercado. La competencia en el sector de inteligencia artificial exige mejoras continuas en la precisión de los algoritmos existentes. Los desarrolladores deben estar atentos a las configuraciones de sus cuentas para proteger su información personal.

Comentarios

Los comentarios se almacenan localmente en tu navegador.