“El dato es un activo primordial de la organización, y debe normalizarse, clasificarse, y protegerse de manera adecuada”
Entrevista a Juan Camarillo, director técnico del Área Universidad Digital en la Universidad de Sevilla (US)
Juan Camarillo es director técnico del Área Universidad Digital en la Universidad de Sevilla (US) y miembro de la sectorial TIC en CRUE Universidades. En sus 40 años de carrera profesional ha contribuido activamente en el impulso de proyectos tecnológicos de alto calado como son las credenciales digitales, la identidad soberana o la evaluación de las competencias digitales del profesorado.
El pasado 27 de abril usted moderó una interesante mesa redonda sobre “Analítica de Datos en instituciones académicas e investigadoras" en el marco de la edición Nº50 de los Grupos de Trabajo (GGTT) que organiza cada año RedIRIS. ¿Por qué cree que los datos están de moda?
En primer lugar, quisiera agradecer a los participantes en la mesa redonda de los últimos Grupos de Trabajo que, con su conocimiento y aportaciones, han facilitado las respuestas a las preguntas que todos nos hacemos en estos momentos. RedIRIS fue oportuna eligiendo esta temática y dando la oportunidad de acercarnos a ella de manera ordenada.
Quisiera comentar una salvedad importante. Este cuestionario es traslación del usado en la mesa redonda y las respuestas son un resumen que he realizado de las notas que fueron tomadas durante su transcurso.
En cuanto a la pregunta, tenemos la sensación de que es una moda provocada por análisis de consultorías estratégicas que han resaltado la importancia del dato para las organizaciones. Estos análisis están fundamentados en cambios tecnológicos con dos derivadas: un crecimiento exponencial del volumen de datos generados y una capacidad de gestionar adecuadamente estos datos para convertirlo en información. Como consecuencia se ha abierto un mundo de posibilidades que las organizaciones están aprovechando.
¿Por qué creemos que este asunto es estratégico en el entorno de las universidades y los centros de investigación españoles?
La importancia estratégica de los datos en las organizaciones, y en especial en el ámbito de la educación superior y de la investigación, no es algo nuevo. La diferencia es el mayor número de casos de uso fuera de los entornos tradicionales de la gestión corporativa.
En un entorno de volatilidad, incertidumbre, complejidad y ambigüedad (más conocido por las siglas VUCA), que se ha consolidado desde hace años, renunciar a gestionar los datos que generamos y los de nuestro entorno no es aconsejable. El santo grial de alcanzar el “data driven” es viable en todas las organizaciones independientemente de su tamaño. Lograrlo puede marcar la diferencia de poder adoptar recomendaciones que recibimos las universidades como personalizar la docencia, ofrecer formación a lo largo de la vida de los ciudadanos, etc.
¿Qué ha cambiado en los últimos años?
Son cambios que han ido surgiendo en los últimos años, y que han coincidido en su madurez, creando un momentum con un estallido de casos de uso como estamos viendo en todas las organizaciones. Sin ser exhaustivo resaltaríamos:
- Ha cambiado la capacidad de generar y recopilar datos.
- Las grandes plataformas cloud se han consolidado y han democratizado el acceso a tecnologías reservadas en el pasado a grandes organizaciones
- El Internet de las Cosas (IoT por sus siglas en inglés) no solo genera inmensas cantidades de datos mediante una sensorización de nuestro entorno, también facilita una monitorización desconocida hasta hace muy poco.
- Expansión en el uso de las tecnologías asociadas a la Inteligencia Artificial gracias a las capacidades de procesamiento posibles actualmente.
- Percepción del riesgo de los tratamientos de los datos personales por los ciudadanos. El cumplimiento legal y ético es obligado en este ámbito del uso de los datos.
¿Cómo se articula una estrategia del “dato” en una organización? ¿Qué importancia tiene en estos momentos?
La estrategia del dato entiendo que debe estar articulada dentro de la estrategia de la organización, no debe considerarse un tema restringido a los aspectos tecnológicos. Debemos plantearla en términos de cultura que faciliten permear toda la organización.
También debemos enmarcar nuestra estrategia del “dato” en el contexto de transformación digital de las organizaciones. En el informe “TIC360 Transformación digital en la Universidad”, elaborado dentro de los Grupos de Trabajo de la sectorial TIC en CRUE Universidades, ya se resaltaba la importancia del “dato” y dentro de las cinco plataformas recomendadas, una central identificada con los datos y el análisis de información.
Uno de los factores clave es conocer el estadio actual de una organización en referencia a sus capacidades analíticas, y desarrollar internamente la capacitación de recursos tanto tecnológicos como humanos, a fin de ir incrementando dichas capacidades en el seno de la organización.
El dato es un activo primordial de la organización, y debe normalizarse, clasificarse, y protegerse de manera adecuada. Es necesario potenciar a nuestras organizaciones con capacidades predictivas y prescriptivas, y superar el escenario más generalizado que ha estado centrado en evaluar el pasado.
¿Qué perfiles/conocimientos consideras necesarios en los equipos de trabajo para abordar un proyecto institucional del “dato” en una universidad? ¿Es factible el reciclaje de técnicos de los actuales departamentos de informática?
El objetivo de conseguir una organización “data driven” necesita un despliegue de una arquitectura tecnológica estructurada en tres bloques de procesos: generación, gobierno y calidad de los datos; informacional; y capacidad de analítica avanzada.
Cada uno de estos bloques involucran perfiles específicos: administradores de datos, calidad del dato, ingenieros, analista de datos, analista de negocio y científicos de datos. El conjunto debe conseguir una visión de equipo multidisciplinar que facilite alcanzar la figura del unicornio que reúne todos los conocimientos y habilidades necesarias.
En la mesa redonda pudimos escuchar que es viable la adaptación a estos nuevos retos técnicos en los perfiles más tecnológicos que se identificaron. Para los perfiles más ligados con conocimientos matemáticos, el reskilling (reciclaje en el contexto español) es mucho más difícil y requiere un plus de motivación para conseguirlo.
¿Son conocidas/usadas las certificaciones y marcos de calidad del “dato” en el panorama actual muy centrado en la tecnología necesaria?
En la mesa redonda tuvimos oportunidad de obtener una panorámica de la situación y de las opciones posibles que son usadas en estos momentos. Como sabemos las certificaciones profesionales se han consolidado para validar el conocimiento tecnológico de las personas y en este caso también tenemos certificaciones específicas. En la mesa redonda se nos expuso las impulsadas por la asociación “The Global Data Management Community”.
En la calidad de los repositorios de datos las certificaciones buscan que se cumplan cinco características lógicas para garantizar la utilidad del repositorio: exactitud, completitud, consistencia, credibilidad y actualidad.
En cuanto a las capacidades y madurez de una organización se mide la predisposición y la actividad realizada en tres áreas distintas: gobierno, gestión y calidad de los datos. Para ello se parte de modelos internacionales de referencia que facilitan evaluar a la organización y certificar su madurez.
Pero en mi opinión lo más interesante fue la necesidad de que las organizaciones conozcan modelos y certificaciones que aborden la calidad de los repositorios de sus datos, de sus capacidades y de su madurez. Estas certificaciones son un buen punto de partida como primer acercamiento y conocer los procesos necesarios que garantizan la calidad deseada.
¿Por qué son necesarias nuevas regulaciones como la Carta de Derechos Digitales? ¿Cuáles son los argumentos que la justifican? ¿Puede ser que no sea suficiente el marco actual que recogen tanto el reglamento europeo como la legislación nacional en materia de Protección de Datos?
El Reglamento de Protección de datos fija un marco normativo a la hora de tratar datos personales. En la práctica vamos a manejar enormes volúmenes de datos personales, no personales y mediante la analítica de datos vamos a conseguir nuevos tipos de datos que pueden llevar a la generación de perfiles de las personas e injerencias que crearán nuevas repercusiones.
Cuando se introducen nuevos escenarios de tratamiento de datos se observa que el Reglamento General de Protección de Datos (RGPD) ha situado el contexto básico, pero no alcanza a cubrir las especificidades que surgen en los nuevos usos. La nueva Ley de Gobernanza de Datos y la Data Act van a fijar las condiciones básicas para los nuevos tratamientos que están surgiendo. La primera desde el punto material y la segunda desde el punto de vista de la creación de espacios de datos de intermediación en el mercado para la analítica de datos garantizando el derecho a la protección de los datos personales.
La nueva legislación provoca la muerte del concepto “open data” como un simple repositorio de descarga de datos, y abre un nuevo escenario que garantice la trazabilidad y el registro de sus usuarios. Este es un cambio inevitable.
Venimos de una situación que creaba asimetrías en Europa por las regulaciones nacionales aplicadas a la investigación. Que imposibilitaban la colaboración europea en campos como la salud si los datos no estaban anonimizados. Las nuevas regulaciones son oportunas para crear un marco regulatorio global.
¿Qué importancia tienen las aportaciones de universidades y centros de investigación en el mundo de los datos en abierto?
España está desarrollando una estrategia nacional del dato. En el 2020 se crea la oficina del dato para la AAPP y en 2021 el Gobierno nombra al primer Chief Data Officer (CDO) de la Administración General del Estado, Alberto Palomo Lozano, responsable de poner en marcha la Oficina del Dato, dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial.
En las líneas estratégicas de la oficina del dato: diseño, coordinación, seguimiento del modelo de arquitectónico, los datos abiertos juegan un papel relevante. A este respecto tenemos la iniciativa Datos.gob.es, cuyo objetivo principal es el impulso de la economía basada en el dato abierto, facilitando el acceso a los mismos para creación de nuevas empresas y optimización de los modelos de negocio ya existentes.
Las universidades y los centros de investigación están adquiriendo un papel cada vez más relevante en el sector de los datos abiertos, tanto en su rol de publicadores como en su rol como divulgadores, formadores y reutilizadores.
Es desde el ámbito de la investigación desde donde emanan los principios FAIR que guían la publicación y administración datos para que estos resulten Encontrables, Accesibles, Interoperables y Reutilizables (del inglés FAIR – Findable, Accessible, Interoperable, and Reusable)-
Son las universidades y los organismos públicos de investigación ámbitos vitales desde los que responder a los retos tecnológicos y culturales a los que nos enfrentamos al tratar de consolidar los modelos de referencia arquitectónico para fomentar la recolecta, gestión e intercambio de datos que la nueva era del dato precisa, así como el impacto y las consecuencias que los escenarios digitales plantean para la efectividad de los derechos y libertades.
Y son las enseñanzas superiores las que deben seguir guiando la capacitación de las nuevas generaciones y el reciclaje de los perfiles ya existentes para contribuir a que la sociedad en su conjunto transite hacia una verdadera economía del dato.
Con la perspectiva que tienes de proyectos internacionales similares y rápidamente consolidados. ¿Qué recomendación harías a las instituciones afiliadas a RedIRIS en lo relativo a la “Analítica de Datos”?
Antes de nada, recomendaría interiorizar que no hay buena analítica de datos si no tenemos datos de calidad. Es por eso que cada institución, adaptado a su propia idiosincrasia y realidad organizativa, debe desarrollar una estrategia de datos.
En relación con iniciativas internacionales, sin duda una de las primeras referencias directas es la estrategia europea de datos, que emana de la estrategia digital. En ésta, se concibe el dato como un activo, y además como un catalizador del tejido empresarial en la era digital. En esta concepción se prevén cuatro acciones: gobernanza, impulso de facilitadores, competencias profesionales, habilidades del sector productivo, creación de espacios de datos en los sectores.
En la estrategia de datos se prevee la creación de los llamados bancos europeos de datos, que toman como referencia para su creación el trabajo desarrollado en el ámbito de investigación en el European Open-Science Cloud (EOSC). Entre los diferentes bancos de datos sectoriales se encuentra el de educación que, intencionadamente, se llama “European Skills Data Space”.
Además de los bancos de datos, la estrategia de datos establece la necesidad de que los estados miembros establezcan su propia estrategia de credenciales digitales, con mención explícita al ahora llamado European Learning Model.
Más información en www.rediris.es/gt/gt2022