HTMLpointHTMLpoint HTMLpoint.com


 Interrogar a la base de datos



En la lección anterior se han examinado los constructos que el lenguaje SQL pone a disposición para incluir los datos en una base de datos relacional. Vamos a ver ahora, sin embargo, las instrucciones necesarias para extraer de ella los datos que nos interesen. La instrucción SQL que se propone para dicho fin es SELECT. Desde el momento en que la interrogación es quizá la función más usada de una base de datos, las opciones de la instrucción SELECT son numerosas y a veces bastante complicadas. Por esta razón vamos a describirlas simplificadas, utilizando ejemplos para la presentación de las características más complejas, en concreto las que se refieren a la especificación de las expresiones condicionales.
La sintaxis con que la instrucción SELECT se tiene que usar es la siguiente:

SELECT [ ALL | DISTINCT ] lista_elementos_selección
FROM lista_referencias_tabla
[ WHERE expresión_condicional ]
[ GROUP BY lista_columnas ]
[ HAVING expresión_condicional ]
[ ORDER BY lista_columnas ]


La instrucción SELECT produce una tabla que se obtiene aplicando el siguiente procedimiento (por lo menos desde el punto de vista lógico, cada DBMS optimiza la ejecución de las interrogaciones según las propias estrategias):

  • produce una tabla que se obtiene como producto cartesiano de las tablas especificadas en la cláusula FROM. Cada elemento de la lista_referencias_tabla sigue la siguiente sintaxis:

    referencia_tabla [ [ AS ] alias_tabla ]

    La referencia puede ser el nombre de una tabla o una expresión (puesta entre paréntesis) cuyo resultado es una tabla, y por lo tanto incluso otra SELECT. El alias es un nombre que sirve para indicar brevemente una referencia de tabla. En el caso en que la referencia de tabla sea una expresión, es obligatorio especificar un alias.

  • de la tabla anterior elimina todas las líneas que no satisfacen la expresión condicional (es decir las líneas por las cuales la expresión condicional devuelve falso como resultado) de la cláusula WHERE.

  • (si está presente la cláusula GROUP BY) las líneas de la tabla resultante del paso 2 se reagrupan según los valores presentes en las columnas especificadas en la cláusula GROUP BY. Líneas con valores iguales se unen en una única línea. Las columnas no comprendidas en la cláusula tienen que comprender expresiones con funciones de agregación (como por ejemplo AVG, que calcula la media) que, por tanto, se calculan produciendo un único valor para cada grupo.

  • (si está presente la cláusula HAVING) del resultado del punto 3 se eliminan las líneas que no satisfacen la expresión condicional de la cláusula HAVING.

  • Se claculan las columnas presentes en la cláusula SELECT (las de la lista_elementos_selección). En concreto, se calculan las columnas con las funciones de agregación que derivan del reagrupamiento que se ha producido en el punto 3. Cada elemento de la lista_elementos_selección sigue la siguiente sintaxis:

    expresión_escalar [ [ AS ] alias_columna ]

    Una expresión escalar es una expresión que produce como resultado un valor escalar. Los tipos de datos escalares del lenguaje SQL son principalmente los descritos en la lección 6 (Crear la base de datos), excepto INTERVAL, DATE, TIME y TIMESTAMP.
    Las expresiones escalares de los elementos de SELECT normalmente afectan a las columnas de la tabla resultante del punto 4. En el caso en que se den ambigüedades, por la presencia de columnas con los mismos nombres en dos o más tablas incluidas en la cláusula FOR, se pueden resolver prefijando el nombre o el alias de la columna con el nombre o el alias de la tabla, separados por un punto. Por ejemplo, T.C indica la columna C de la tabla T. El alias de columna es el nombre que se le da a la columna.
    Toda la lista de las columnas de una tabla puede especificarse usando el carácter '*'.

  • (si está presente la opción DISTINCT) se eliminan las líneas que resultan duplicadas. En el caso en que no estén presentes ni ALL ni DISTINCT, se asume ALL.

  • (si está presente la cláusula ORDER BY) las líneas de la tabla se ordenan según los valores presentes en las columnas especificadas en la cláusula. La sintaxis que hay que usar es la siguiente:

    ORDER BY nombre_columna [ ASC | DESC ] [ , nombre_columna [ ASC | DESC ] ... ]

El orden por defecto es ascendente. En el caso en que se quiera efectuar el decreciente hay que especificar la opción DESC. Si no se especifica la cláusula ORDER BY, hay que considerar la tabla sin ningún orden; de hecho, para la definición de relación del modelo relacional, las líneas de la tabla forman un conjunto: en el sentido matemático y para los elementos de un conjunto no se ha definido ninguna propiedad de orden. En la práctica, sin embargo, el orden que se obtiene no especificando la cláusula de orden es casi siempre el que refleja su memorización física y por tanto, a menudo, al que se debe que las líneas hayan sido incluidas en la tabla.

La secuencia de operaciones que acabamos de presentar hay que considerarla válida sólo desde el punto de vista conceptual. Efectivamente, no está escrito que se ejecuten exactamente de este modo y en este orden, sobre todo desde el momento en que cada DBMS optimizará las interrogaciones según las estrategias más oportunas.

Examinaremos ahora algunos ejemplos de la instrucción SELECT. Se supone que los datos presentes en la base de datos de ejemplo son sólo los que se han incluido gracias al archivo [poblad_biblio.sql] presentado en la lección 7 (Poblar la base de datos). En caso contrario, las interrogaciones ofrecerán resultados diferentes.

EJEMPLO 1

SELECT surname FROM Person
ORDER BY surname


Extrae de la tabla Person los apellidos y los ordena alfabéticamente. En nuestro caso, el resultado es el siguiente:

surname
--------------------------------
Agosti
Batini
Bayer
Benfante
Carey
Cochowsky
DeWitt
Kim
Knuth
Lenzerini
Maryansky
McCreight
McGill
Melucci
Richardson
Salton
Santucci
Shekita
Spaccapietra
de Petra


Véase el orden errado de la última línea, debido a que se ha usado el carácter ASCII minúsculo.
La query anterior devolvería líneas duplicadas en el caso en que en la tabla estuviesen presentes personas con el mismo apellido. Para evitarlo hay que especificar la opción DISTINCT:

SELECT DISTINCT surname FROM Person
ORDER BY surname


ESEMPIO 2

SELECT * FROM Person
WHERE surname LIKE 'B%'




Produce una tabla que tiene todas las columnas de la tabla Person. Las líneas se filtran para que estén presentes sólo las que tienen el apellido que empieza con el carácter 'B'. El operador LIKE permite una comparación entre cadenas de caracteres usando pattern construidos con los caracteres '%' e '_'. El primero sustituye un número no precisado de caracteres (también 0), mientras que el segundo sustituye uno solo.

ESEMPIO 3

SELECT PUB.*, PER.surname AS S, PER.given_names
FROM Publication PUB, Author AUT, Person PER
WHERE PUB.ID = AUT.publicationID
AND AUT.personID = PER.ID
AND PUB.type = 'Book'
ORDER BY S




En este caso, la tabla resultante contiene todas las columnas de la tabla Publication (indicada con el alias PUB definido en la cláusula FROM) y las columnas surname y given_names de la tabla Person. La cláusula FROM genera el producto cartesiano de las tablas Publication, Author y Person, de las que se seleccionan sólo las líneas en que el identificativo de la publicación y el del autor se corresponden. Además, se limita a considerar sólo las publicaciones del tipo 'Book'. Para acabar, la tabla se ordena según los apellidos del autor, indicado mediante el alias S, definido en la cláusula SELECT.

ESEMPIO 4

SELECT title, volume, pub_year
FROM Book
WHERE ID IN
( SELECT PUB.ID
FROM Publication PUB, Author AUT, Person PER
WHERE PUB.ID = AUT.publicationID
AND AUT.personID = PER.ID
AND PUB.type = 'Book'
AND PER.surname = 'Knuth' )




En este ejemplo, se ve el uso de una expresión condicional que contiene el operador IN, que devuelve el valor verdadero si el valor del operando a su izquierda está incluido en la tabla resultado de la expresión a su derecha. La query entre paréntesis produce una tabla de una única columna, que contiene los identificativos de las publicaciones del tipo 'Book' de las que Knuth es autor. La query más externa extrae, por tanto, de la tabla Book las informaciones de los libros con esos identificativos.

EJEMPLO 5

SELECT COUNT(*) FROM Publication

count
-----
12


Cuenta el número de líneas presentes en la tabla Publication.

ESEMPIO 6

SELECT type, COUNT(ID) FROM Publication
GROUP BY type




Cuenta el número de publicaciones presentes en la base de datos subdividiéndolas por tipos.
Las funciones de agregación previstas por el estándar SQL son COUNT, SUM, AVG, MAX y MIN, las cuales calculan respectivamente los números, la suma, la media aritmética, el máximo y el mínimo de los valores escalares presentes en la columna a la que se aplican.


  Torna a inizio pagina