Aunque la personalización de servicios telemáticos no es nueva en Internet, lo cierto es que hasta ahora, esta personalización estaba basada en la ejecución de programas CGI en el servidor que daban el servicio personalizado a quien lo solicitaba. Sin embargo, la ejecución de estos programas CGI suponen un consumo de recursos que pueden limitar el número máximo de accesos simultáneos al servidor, por lo que ha habido tradicionalmente bastantes reservas a utilizar este tipo de solución como método de proporcionar servicios telemáticos a usuarios de forma individual, sobretodo en servidores donde el número de accesos concurrentes es bastante elevado. Conviene por tanto intentar repartir esta carga computacional entre el servidor y el cliente, de forma que las rutinas que deban ser ejecutadas en el servidor sean ejecutadas en el servidor y que las rutinas que puedan ser ejecutadas en el cliente puedan ser ejecutadas en el cliente. Nuestro proyecto consiste en la elaboración de un sistema telemático (un periódico electrónico) que, a diferencia de los actuales, incluya una capacidad de personalización constante y continua y que permita llevar a cabo un aprovechamiento óptimo de recursos haciendo uso de la capacidad computacional del ordenador del cliente y minimizando el trasiego de información redundante por la red.
La personalización no es un requisito imprescindible para usar nuestro periódico. Siempre será posible una lectura del mismo sin personalización. La medida de éxito de nuestro proyecto se basará precisamente en el grado de aceptación que los lectores hagan de nuestro servicio de personalización en lugar de acceder a la información de una forma anónima sin personalizar.
A continuación de la figura 1 se enumeran las características más importantes de los elementos que la integran.
El editor de periodistas consiste en una aplicación Java ejecutable también como applet cuya labor primordial radica en la edición de las noticias del periódico electrónico. Al ser a la vez un applet y una aplicación, es posible ejecutarlo tanto de forma independiente en una máquina con plataforma Java como en un navegador Web. Está compuesta por una ventana de edición y varios botones y menús que permiten insertar de forma cómoda para el periodista las etiquetas de marcado que se consideren oportunas así como sus atributos. Al terminar su edición, la noticia es insertada en una base de datos alojada en el servidor. Durante la redacción de la noticia, el periodista puede ir guardando versiones temporales de su trabajo tanto en el disco duro de su ordenador como en el mismo servidor. El cliente de periodistas se encuentra disponible en cuatro versiones diferentes: una para la gestión de noticias, otra para la gestión de imágenes, otra para la gestión de publicidad y otra última para la gestión de plantillas de presentación. Aparte del interfaz de edición incorporado, el cuerpo de la noticia puede ser editado con cualquier herramienta externa del gusto del periodista.
La base de datos es el repositorio natural de la información publicada por el periódico. En ella se almacenan todos los elementos multimedia que forman parte de las noticias (texto, audio, vídeo, imágenes, ...). Con el fin de permitir un fácil reemplazamiento de este componente, el sistema realiza exclusivamente accesos a través de consultas SQL estándar de bases de datos relacionales mediante conexiones ODBC, lo cual permite a su vez, utilizar un gran número de bases de datos disponibles de diversos fabricantes. Actualmente, nuestro prototipo utiliza una base de datos de libre distribución llamada mysql y que se encuentra disponible en nuestra plataforma de pruebas: una red de estaciones Linux.
El demonio de volcado consiste en una aplicación de ejecución periódica que vuelca los contenidos más recientes de la base de datos a ficheros en formato HTML que puedan ser directamente entregados al cliente por el servidor de Web.
Además de las noticias elaboradas en la redacción del periódico digital mediante el uso de nuestro cliente de periodistas, el lector puede estar interesado en otras fuentes de información, como la que pueden ofrecer a su vez otros periódicos electrónicos de la red. Aunque la idea de hacer referencias bibliográficas de unos periódicos a otros es impensable para las ediciones impresas en papel, lo cierto es que no sólo la tecnología del hipertexto lo hace posible, sino que además lo hace aconsejable. En Internet se dice que tan valioso o más que ofrecer información es ofrecer el camino que lleva hasta ella. Así, uno de nuestras decisiones de diseño consiste en ofrecer al lector la posibilidad, no sólo de profundizar contenidos hilvanando la lectura de noticias relacionadas, sino también de contrastar esos contenidos con las versiones que publican otros medios, agrupando esas referencias en torno a las noticias publicadas por nuestro diario.
Bien sea por la declaración explícita por parte del periodista de la redacción del periódico digital o por la detección automática a través de nuestro agente catalogador (con criterio aceptable, aunque menos fiable que el anterior), las noticias que forman parte del periódico acaban por tanto acompañadas de una lista de temas o palabras clave que permiten, entre otras cosas:
Un periódico está formado por noticias agrupadas por secciones. Cuando el número de secciones que ofrece un periódico es razonable y el número de noticias por sección es relativamente grande, la simple enumeración de titulares con enlaces a las noticias una detrás de otro supone una gran cantidad de información que puede resultar inmanejable si no se proporciona al lector de los mecanismos adecuados. Los índices de nuestro periódico incorporan rutinas de plegado de forma que es posible compactar o expandir la información de cada sección o subsección haciendo visible al lector la información que desea consultar en cada momento. Este índice permitirá además resaltar los titulares de aquellas noticias que el sistema detecte como de mayor relevancia para el lector frente a las noticias que no sean consideradas como importantes.
Pero si bien la primera imagen que recibe un lector acerca de su periódico no es otra cosa que su índice, lo cierto es que la información final, las noticias, son los elementos que finalmente siempre busca el lector. Lo anterior, los índices, no son más que simples cruces de caminos para llegar a la información de la noticia redactada por el periodista, si bien es cierto que también las noticias también pueden estar relacionadas entre sí a través del hipertexto permitiendo una navegación temática sin índices. Las noticias del periódico son ficheros escritos en un lenguaje de marcado basado en XML llamado JML (inicialmente, en nuestro prototipo el lenguaje de marcado de las noticias en HTML) que se conservan publicados durante un periodo de tiempo configurable (una semana, una quincena ...). Al igual que las noticias publicadas en la red por los periódicos electrónicos actuales, las noticias de nuestro prototipo pretenden incluir imágenes ilustrativas, publicidad (personalizada, aunque ficticia en un primer momento) y una bibliografía electrónica generada tanto manual como automáticamente y que intente mejorar la que ya existe en algunos diarios como Cinco Días.
Las noticias que han adquirido cierta antigüedad desde que fueron publicadas son eliminadas del servidor cuando se considera que han perdido interés para el público general. Sin embargo, siempre es posible extraer una versión de esa noticia accediendo directamente a la base de datos donde se almacena. El hecho de abrir la posibilidad de acceder a noticias que han dejado de ser publicadas y de realizar investigaciones en el periódico mediante búsquedas dirigidas por temas otorga al periódico electrónico un valor añadido de importancia tanto o más considerable en la medida en la que los contenidos de esa hemeroteca digital aumenten a lo largo del tiempo. Sin embargo, el acceso a esta base de datos es un proceso que requiere bastante capacidad de procesamiento y que sólo se puede realizar en el servidor (que es donde residen los datos). Nuestra solución para este problema consiste en la implementación de un programa CGI de búsqueda en la base de datos por distintos criterios combinables entre sí (temas, autores, fechas, secciones, lugares, ...).
El encuadernador digital es el encargado de reunir los componentes del periódico que deben formar parte de la edición personalizada de cada lector y realizar su entrega conjunta al cliente. Básicamente se puede considerar a este servicio como un seleccionador de los fascículos que deben formar parte del periódico personalizado. Al contrario de los periódicos digitales actuales, que publican una serie de secciones separadas e interrelacionadas entre sí (los de edición impresa simplemente incluyen una edición completa de todas las secciones repartidas de forma consecutiva por no pocos hectogramos de papel), el encuadernador proporciona el periódico al lector en un único documento en el que sólo se incluyen las secciones que le interesan, de forma que este puede ser visualizado de un vistazo (usando las rutinas de plegado y desplegado) sin necesidad de estar permanentemente conectado a la red. La selección de aquellas secciones a las que está suscrito el lector (y por ende la no inclusión de las secciones a las que no está suscrito) permite que ese único documento no tenga un tamaño extraordinariamente grande como sí lo tendría un periódico que incluyera todas las secciones. Además, el encuadernador digital tiene en cuenta la especificación de un intervalo de fechas, de forma que es posible, por ejemplo, admitir y servir solicitudes del periódico personalizado de los últimos N días o entre dos fechas dadas.
La personalización de un periódico electrónico determina no sólo la forma en la que el lector visualice las noticias que lea, sino también la selección de las noticias que se entregan al lector en función de sus preferencias. Se distingue, por tanto entre una personalización de presentación y una personalización de contenidos.
La personalización de presentación afecta no sólo a los colores de los componentes de las noticias, al tipo y tamaño de letra o la disposición de esos elementos a lo largo y ancho de la pantalla, sino también al grado de resaltación con el que unas noticias aparecen destacadas respecto de otras o también a la forma en la que los titulares de algunas noticias son capaces de mostrar información adicional sobre su contenido (añadiendo una entradilla desplegable, por ejemplo). Para personalizar la presentación de las noticias se utilizan uso de hojas de estilo personalizadas.
La personalización de contenidos o proceso de cribación de noticias comprende una labor que se realiza conjuntamente en el servidor y en el cliente (con un esfuerzo por encaminar la mayor parte posible de esa labor desde el primero hasta el segundo). Con el fin de estimar el grado de interés que un lector pueda tener sobre determinada noticia, se han tenido en cuenta dos formas distintas en las que un lector pueda especificar las preferencias sobre los contenidos que puedan ser interesantes para él.
Parece evidente que una noticia debe aparecer tanto o más resaltada cuanto más grado de interés haya mostrado el lector sobre los temas de esa noticia (lo mismo sería aplicable al nivel de párrafo dentro de una noticia). Cuando el titular de una noticia no resulta seleccionado porque ninguno de sus temas es considerado de interés para el lector, pero esa noticia forma parte de una sección a la que está suscrito, el titular de esa noticia (el titular junto con una posible entradilla más un enlace para profundizar sobre el tema) es incluido en el periódico pero la noticia no aparece como resaltada. Sólo cuando el lector decida desplegar completamente esa sección y haya cuando menos contemplado los titulares de las noticias que le aparecen resaltadas, verá la referencia a esa noticia (junto con su posible entradilla desplegable). Esto se podrá realizar sin interactuar con el servidor de forma que se minimicen las transacciones entre el cliente y el servidor. Finalmente, aquellas secciones a las que no esté suscrito el lector no serán incluidas en la edición personalizada y por lo tanto sus noticias no se mostrarán al lector (salvo aquellas noticias que puedan pertenecer a otras secciones en las que el lector sí está suscrito).
El trabajo en el que se basa este documento ha sido parcialmente financiado por el proyecto TEL97-0788 de la CICYT. Queremos agradecer las aportaciones de nuestros compañeros Peter T. Breuer, Pilar Diezhandino, Tony Hernández, Natividad Martínez, Tomás Nogales, A. Rodríguez de las Heras y Luis Sánchez de la Universidad Carlos III de Madrid. Agradecemos también la ayuda prestada por El PAIS Digital y Fundesco.