MetaWebber 1.0.6 beta

Herramientas útiles sobre Indexacion y el grupo iris-index


Descripción

    MetaWebber es una herramienta desarrollada para el grupo de trabajo iris-index que toma un fichero HTML y le añade metainformación.

    MetaWebber está desarrollada en perl y está en fase de pruebas por el grupo iris-index.

Versión:

    MetaWebber 1.0.5 beta - 20000117

Utilización:

    metawebber [-r ] [-h] [-m (1|2)] [-s] [-d] [-d1] [-f] (dir|fich) [(dir|fich)]

Opciones:

-rPara recorrer directorios recursivamente y procesar los ficheros
-hPara mostrar un mensaje de ayuda
-mPara indicar el formato de metainformación a introducir
-sPara forzar la sustitución de la metainformación que existe en los ficheros
-dPara depuración
-d1Para depuración con un nivel de información más extenso
-fPara forzar una actualización cuando ya existe el fichero html
<fich>Ficheros individuales
<dir>Directorios completos

Funcionamiento:

    MetaWebber se basa en variables que el usuario define en un fichero de plantilla llamado .template.

    Webber recorrerá todos los directorios desde el que se encuentra la página a procesar hasta el directorio raiz del web buscando los ficheros .template.

    • Si encuentra varios ficheros en este camino va obteniendo los valores de las variables que se encuentra en ellos.
    • Si se encuentra variables iguales en diferentes ficheros tomará el valor del fichero .template más profundo.
    • En el caso en que sea la variable #keywords se irán añadiendo todos los valores que se encuentren en los diferentes ficheros.

    Una vez que ha procesado todos los ficheros .template lee la página html y añade información de uno de estos tipos a la cabecera de la página:

    Parámetro: -m 1
    <!-- start metawebber -->
    <meta name="keywords"     content="Boletín de RedIRIS">
    <meta name="description"  content="Versión electrónica del boletín 
                                       40 de RedIRIS">
    <meta name="date"         content="19971027">
    <meta name="reply to"     content="boletin@rediris.es">
    <meta name="organization" content="Centro de Comunicaciones CSIC RedIRIS">
    <meta name="locality"     content="Madrid. España">
    <meta name="author"       content="Servicios de Difusión">
    <meta name="lang"         content="es">
    <!-- end metawebber -->
    

    Parámetro: -m 2
    <!-- start metawebber -->
    <meta name="keywords"       content="Boletín de RedIRIS">
    <meta name="description"    content="Versión electrónica del boletín 
                                         40 de RedIRIS">
    <meta name="DC.Subject"     content="Boletín de RedIRIS">
    <meta name="DC.Creator"     content="Servicios de Difusión, 
                                         boletin@rediris.es">
    <meta name="DC.Description" content="Versión electrónica del boletín 
                                         40 de RedIRIS">
    <meta name="DC.Date"        content="19971027">
    <meta name="DC.Publisher"   content="Centro de Comunicaciones CSIC 
                                         RedIRIS - Madrid. España">
    <meta name="DC.Languaje"    content="es">
    <!-- end metawebber -->
    

Variables:

    #description
    Formato:#description= Texto
    Ejemplo:#description= Descripción
    Descripcion:No se muestra en la página. Se incluye como campo y se usa para el mecanismo de indexación de la página. Será el valor que se muestre cuando una página sea encontrada por el buscador.

    #keywords
    Formato:#keywords= texto1,...,textoN
    Ejemplo:#keywords= x500,indice,directorio
    Descripcion:Claves por las que se podrá encontrar esta página.
    Hay que escribirlas entre comas

    #owner
    Formato:#owner= Texto
    Ejemplo:#owner= x500master
    Descripcion:El texto que introduzcamos aparecerá en la cabecera de la página con el meta author.

    #email
    Formato:#email= dirección de correo
    Ejemplo:#email= javier.masa@rediris.es
    Descripcion:La dirección que pongamos aparecerá en la cabecera de la página dentro del meta reply to

Configuración

    Antes de comenzar a trabajar hay que configurar una serie de variables. Por defecto viene con los valores que se muestran en la siguiente tabla:

    $root      = "/usr/local/WWW";
    
    $webmaster = "Infosystem Mananager";
    $webmail   = "webmaster\@organizacion.es";
    $organiz   = "Centro de Comunicaciones CSIC RedIRIS";
    $direcc    = "Madrid. España";
    $descr     = "Descripción no disponible";
    

Ejemplos

    Fichero .template en /usr/local/WWW/rediris/boletin/

    #owner=         Servicios de Difusión
    
    #email= boletin@rediris.es
    #keywords= Boletín de RedIRIS