www.informatizate.net
www.informatizate.net // informatizate@informatizate.net Ver Artículos Página Inicial

BASES DE DATOS NATIVAS EN XML

Deusdit A. Correa Cornejo

ReTechnical Manager - VOXIVA
Microsoft Certified Database - MCDBA



deusdit_correa(at)informatizate(dot)net
Diciembre 7, del 2002
Introdución

Como primer artículo voy a tratar un tema que desde mi punto de vista puede generar muchos cambios en el mundo de las Tecnologías de la Información.

Es conocido por todos que las bases de datos son una parte fundamental de todas las organizaciones, pues en ellas se almacenan información crucial para el buen desempeño de las mismas. Además de ello sabemos que XML es el presente y futuro de la administración de datos pues este lenguaje ha permitido romper barreras y crear una manera estándar de procesar la información.

Pues bien, XML está provocando la aparición de nuevas tecnologías, entre ellas, la aparición de una nueva generación de bases de datos que si bien se encuentran en una fase de investigación y desarrollo, en un futuro pueden ser una buena alternativa a las ya conocidas bases de datos relacionales. Estos son aquellos basados netamente en XML o "native XML database".

Este tipo de bases de datos son completamente distintas a las relacionales, las cuales en la actualidad tienen soporte para XML, pero aún siguen almacenando toda la información de manera relacional, es decir en forma tabular (tablas, registros y columnas) o caso contrario almacenan todo el documento en formato Binary Large Object (BLOB), pero la principal característica que brindan estas bases de datos es la capacidad de obtener los resultados de las consultas en formato XML; es por ello que dichas bases de datos pertenecen a la categoría de "XML-enabled database"

¿Qué es una Base de Datos nativa en XML?

No existe una definición estándar de una base de datos nativa en XML pero la organización XML:DB Initiative for XML Databases describe una base de datos de este tipo como un: "modelo lógico para documentos XML y almacena y recupera documentos de acuerdo a dicho modelo"

¿Qué es una base de datos centrada en documentos?

Todas las bases de datos relacionales son centradas en los Datos, data-centric databases, pues lo que ellos almacenan en sus campos son datos atómicos. Una base de datos nativa en XML, ni tiene campos, ni almacena datos atómicos, lo que ella almacena es documentos XML, por lo tanto a este tipo de bases de datos se les denomina bases de datos centradas en documentos, data-centric databases.

Características

Diversos productos brindan diferentes características para las bases de datos nativas en XML, pero generalmente tienen las siguientes características:

Almacenamiento
Por deducción lógica, una base de datos nativa en XML almacena la información en formato XML, pero esto es solamente una deducción lógica, pues este tipo de bases de datos tienen repositorios con un formato "tipo XML", como puede ser DOM o Infoset. En este mismo repositorio se almacenan los índices que se generan por cada documento XML almacenado.

Procesamiento de datos
El procesamiento de datos en este tipo de bases de datos parecería ser algo muy beneficioso, pero realmente no es así, debido al formato jerárquico en el que está almacenada la información. Muchas bases de datos necesitan que tu recuperes todo el documento XML, lo actualices con el XML API de tu preferencia y posteriormente vuelvas a almacenar el documento en el repositorio. Esto se debe a que aun no existe un lenguaje estándar que permita la actualización, inserción o eliminación de elementos de un documento XML. Existe un lenguaje que permite realizar actualizaciones en un documento XML pero aun no es un estándar y muchos gestores de este tipo de bases de datos no lo soportan, este lenguaje es Xupdate (http://www.xmldb.org/xupdate)

Búsquedas
Este tipo de bases de datos no utiliza SQL como lenguaje de consulta. En lugar de ello utilizan Xpath. Algunas bases de datos permiten seleccionar los elementos que deberán tener índices mientras que otras bases de datos indexan todo el contenido del documento. El problema que tienen las búsquedas en este tipo de bases de datos es que no permiten realizar búsquedas muy complicadas, como por ejemplo ordenamiento y cross join, debido a que Xpath no fue creada para realmente para búsquedas en bases de datos, sino simplemente para búsquedas en un solo documento.
Muchos bases de datos permiten realizar búsquedas utilizando la tecnología Full-Text Search, de esta manera se pude agilizar la búsqueda de datos en los documentos XML.

Conclusión

En estos momentos, este tipo de base de datos es perfecta para las organizaciones que mantienen su información en diferente formatos, debido a que les permitiría rápidamente pasar su información a un formato XML, utilizando la aplicación de su preferencia, y de esta manera almacenarla en una de estas bases de datos y evitarse el proceso de conversión de un formato a otro. Además, teniendo en cuenta que por ahora aún no existe un lenguaje estándar para el procesamiento de los datos, estas bases de datos son adecuadas para realizar búsquedas sobre los documentos almacenados.

Conforme todas las falencias que tienen estas bases de datos sean superadas, podrán ser una muy buena alternativa para el almacenamiento de la información no solo por que la información estará almacenada en un formato estándar, XML, sino porque facilitará el desarrollo de aplicaciones basadas en XML, como por ejemplo los Web Services.

Recursos

· XML:DB Initiative for XML Databases: http://www.xmldb.org
· XML and Databases: http://www.rpbourret.com/xml/XMLAndDatabases.htm
· XML Database Products: http://www.rpbourret.com/xml/XMLDatabaseProds.htm



© 2002-2005 Grupo informatizate. Derechos Reservados
Prohibida la reproducción total o parcial en cualquier formato sín previa autorización.
En linea, desde el 27 de Noviembre del 2002