El Salvador se incorporó al programa global Nemotron Personas de NVIDIA, una iniciativa orientada al desarrollo de capacidades de inteligencia artificial soberana mediante conjuntos de datos sintéticos diseñados para representar las características demográficas y culturales de distintos países.

La incorporación del país se concretó mediante el lanzamiento de Nemotron Personas El Salvador, un conjunto de datos desarrollado por WideLabs, empresa brasileña especializada en soluciones de IA soberana, y NVIDIA. 

De acuerdo con NVIDIA y WideLabs,  la iniciativa busca servir como base para la creación y evaluación de asistentes virtuales, copilotos y agentes de inteligencia artificial adaptados al contexto salvadoreño.

De esta forma, el español salvadoreño se incorpora al grupo de idiomas y contextos regionales incluidos en el programa global de NVIDIA, donde ya participan mercados como Estados Unidos, Japón, India, Singapur, Brasil, Francia y Corea del Sur.

Según las compañías, el lanzamiento representa un paso para fortalecer el ecosistema nacional de IA y proporcionar una base estructurada para el desarrollo de aplicaciones alineadas con las características locales del país.

Datos sintéticos para entrenar agentes de IA

Nemotron Personas El Salvador fue construido a partir de estadísticas oficiales, incluyendo información del VII Censo de Población y VI Censo de Vivienda 2024, así como datos públicos sobre frecuencia de nombres del Registro Nacional de las Personas Naturales (RNPN).

Las compañías detallaron que, a partir de estas fuentes, se generaron personas sintéticas, es decir, perfiles ficticios creados mediante inteligencia artificial y datos estadísticos. Estos se usaron para representar distintos segmentos de la población sin utilizar información personal de ciudadanos reales.

El uso de personas sintéticas permite entrenar, probar y someter a pruebas estos sistemas sin depender de datos personales reales, una característica especialmente relevante para entornos regulados y servicios dirigidos a la ciudadanía.

El conjunto de datos fue diseñado para ser utilizado por empresas que desarrollan asistentes virtuales, copilotos y agentes de IA, así como por gobiernos, servicios públicos, universidades e instituciones de investigación que buscan desarrollar sistemas más alineados con el contexto salvadoreño.

De acuerdo con WideLabs y NVIDIA, antes de contar con una base de datos específica para El Salvador, los desarrolladores recurrían a traducciones o contenidos generados para otros mercados hispanohablantes. Esto dificultaba representar de forma consistente expresiones, referencias culturales y características propias del país.

El nuevo conjunto de datos busca cubrir esa necesidad mediante perfiles que representan distintas edades, niveles educativos, ocupaciones y regiones distribuidas en los 14 departamentos salvadoreños.

La iniciativa también permitirá evaluar cómo un asistente digital interactúa con distintos perfiles de usuarios y realizar ajustes graduales en aspectos como tono, claridad y estilo de respuesta en español salvadoreño.

Lídice Nahomi González Aguilar, directora ejecutiva adjunta de la Agencia Nacional de Inteligencia Artificial de El Salvador, señaló que este tipo de conjuntos de datos proporciona una base para desarrollar sistemas de IA adaptados al contexto salvadoreño bajo un enfoque de privacidad desde el diseño (privacy-by-design).

Nemotron Personas El Salvador fue desarrollado para integrarse con el ecosistema de herramientas de inteligencia artificial de NVIDIA y estará disponible bajo la licencia abierta CC BY 4.0.

 

***************************

¡Reciba gratuitamente el boletín de Mobile Time Latinoamérica y manténgase bien informado sobre tecnología móvil y negocios! Regístrese aquí.

Las ilustraciones de los artículos son producidas por Mobile Time con IA.