Bases de donn´ees – cours 3 Introduction en SQL

(1)

Bases de donn ´ees – cours 3 Introduction en SQL

Catalin Dima

(2)

Pr ´esentation de SQL

◮ SQL est un LDD :

◮ Cr ´eation/modification/suppression de tables.

◮ Cr ´eation d’utilisateurs et gestion des droits.

◮ Impl ´ementations en architectures client-serveur : MySQL, PostgreSQL.

◮ SQL est un LMD :

◮ Impl ´ementation de l’alg `ebre relationnelle.

◮ Langage de requ ˆetesselect-from-where.

◮ Variables de type tuple et attributs r éf érenc és à la C/Java.

◮

◮ Notre initiation commence par la partie LMD.

◮ SQL est “case-insensitive”.

◮ ... mais nous allons mettre les mots-cl ´e en majuscules pour les diff ´erencier des autres constructions.

(3)

Premi `ere version de SELECT

◮ Partons de notre table “Employ és”, de sch éma Employ és(Id, Nom, Pr énom, Dept, Salaire).

◮ Afficher les tuples correspondant aux employ és du 1er d épartement dont le salaire d épasse les 34kE :

SELECT * FROM Employ´es

WHERE Dept = 1 AND Salaire >= 34;

◮ Forme de requ ˆete de base en SQL,select-from-where:

◮ La clauseFROMdonne la (ou les) relation(s) sur laquelle (lesquelles) la requ ˆete s’applique.

◮ La clauseWHEREest uneconditionjouant le m ême r ôle que la condition d’une op ération de s élection, typeσ_C.

◮ La clauseSELECTpermet d’indiquer quelsattributssont à garder et à afficher lors du calcul du r ésultat, similaire à une op ération de projectionπA₁,...,A_k.

◮ Utiliser*dans unSELECTindique que tous les attributs produits pendant le calcul seront retenus.

◮ R ´esultat pour notre requ ˆete ....

(4)

Projection en SQL

◮ Comme indiqu é, la partieSELECTde toute requ ête de type select-from-where permet d’impl émenter l’op ération de projection.

◮ Attention donc ! La clauseSELECTne correspond pas `a une s ´election !

◮ Afficher les noms et pr énoms des employ és du 1er d épartement dont le salaire d épasse les 34kE :

SELECT Nom, Pr´enom FROM Employ´es

◮ Syntaxe permettant d’impl émenter une projection suivie d’un renommage : afficher les ID des employ és du 1er d épartement dont le salaire d épasse les 34kE, tout en renommant la colonne de la table r ésultat enNoCrt:

SELECT Id AS NoCrt FROM Employ´es

(5)

Projection en SQL (2)

◮ Encore une autre variante de syntaxe, permettant de recalculer un nouvel attribut (iciSalMens) et de cr ´eer un autre nouvel attribut poss ´edant une valeur constante (iciMonnaie) :

◮ Afficher les ID des employ és du 1er d épartement dont le salaire d épasse les 34kE, et afficher aussi leur salaire mensuel (en Euro cette fois-ci) plus une colonne suppl émentaire contenant la chaˆıne

’Euro’:

SELECT Id AS NoCrt, Salaire/12*1000 AS SalMens,

’Euro’ AS Monnaie FROM Employ´es

(6)

S ´election en SQL

◮ La partieWHEREpermet de filtrer des tuples selon la condition d ´eclar ´ee.

◮ Conditions construites `a l’aide d’op ´erateurs sur les types primitifs.

◮ Variables utilis ´ees dans les conditions =noms d’attributsde la (des) relation(s) indiqu ´ee(s) dans la clauseFROM.

◮ D ´esambiguation parfois n ´ecessaire (on en reviendra).

◮ Op érateurs arithm étiques et pr édicats de comparaison comme en C ou Java sur les donn ées de type entier ou flottant.

◮ Particularit é :<>pour repr ésenter le pr édicat “diff érent”, au lieu de!=.

◮ Op ´erateurs bool ´eens pour la construction de contraintes complexes :AND, OR, NOT.

◮ Concat énation de chaˆınes de caract ères : op érateur binaire||.

◮ Comparaisons de chaˆınes de caract `eres : op ´erateurs<, <=, >,

>=faisant r éf érence à l’ordrelexicographique.

(7)

S ´election en SQL

◮ Conditions de typeLIKEdans les comparaisons de chaˆınes de caract `eres :

◮ s LIKE p: la valeur de l’attributsrespecte le patronp.

◮ Patrons de chaˆınes de caract ères :%remplace n’importe quelle chaˆıne de caract ères, remplace un seul caract ère, et’’d énote un seul apostrophe.

◮ Les attributs de typeDATEpeuvent ˆetre compar ´es avec des valeurs constantes de la formeDATE ’2011-12-31’.

◮ Similaire pourTIME.

◮ Exemple pour comparer un attributAttrde typeTIMEavec l’heure 23h45m18s2/10 :

WHERE Attr > TIME ’23:45:18.2’;

(8)

Comparaisons impliquant la valeur NULL et valeur bool ´eenne UNKNOWN

◮ Les attributs peuvent prendre la valeurNULL.

◮ Exemple : jointure externe.

◮ Pour cela,WHEREdoit permettre la manipulation et la comparaison de cette valeur.

◮ Deux r `egles importantes pour la prise en compte de cette valeur :

1. Le r ésultat de chaque op ération devientNULLlorsqu’au moins une op érande estNULL.

2. Le r ´esultat de chaque comparaison devientUNKNOWNlorsqu’au moins une op ´erande estNULL.

3. MaisNULLne peut pas ˆetre utilis ´e en tant que constante !

◮ ValeurUNKNOWN=troisi èmevaleur de v érit é !

(9)

Logique à trois valeurs de v érit é

◮ Tables de v érit é pour les op érateurs bool éens :

x y xANDy xORy NOTx

TRUE TRUE TRUE TRUE FALSE

TRUE UNKNOWN UNKNOWN TRUE FALSE

TRUE FALSE FALSE TRUE FALSE

UNKNOWN TRUE UNKNOWN TRUE UNKNOWN UNKNOWN UNKNOWN UNKNOWN UNKNOWN UNKNOWN UNKNOWN FALSE FALSE UNKNOWN UNKNOWN

FALSE TRUE FALSE TRUE TRUE

FALSE UNKNOWN FALSE UNKNOWN FALSE FALSE FALSE FALSE FALSE FALSE

(10)

Produit cart ´esien et jointure naturelle en SQL

◮ La clauseFROMforce l’utilisation de plus d’une seule table dans le reste de la requ ˆete.

◮ Les param `etres deFROMforment une liste de tables...

◮ ... lesquelles sont combin és parproduit cart ésien, avant de passer au traitement du reste de la requ ête.

◮ Pour deux relationsAetB, le produit cart ´esienA×Bse calcule en SQL comme suit :

SELECT * FROM A, B;

◮ ClauseWHEREoptionnelle !

◮ Pour calculer la jointure naturelle, il faut utiliser l’impl ´ementation de la projection parSELECTet la s ´election parFROM.

◮ En supposant que les sch ´emas des deux tables sontA(X,Y,Z) etB(U,X,V,Y), leur jointure naturelle se calcule en SQL comme suit :

SELECT A.X, A.Y, Z, U, V FROM A, B

WHERE A.X=B.X AND A.Y=B.Y;

(11)

Utilisation de select-from-where sur plusieurs relations

◮ Prenons notre table “Employ és” de sch éma Employ és(Id, Nom, Pr énom, Dept, Salaire).

◮ Et une deuxi ème table “D épartements”, de sch éma D épartements(NoDept, Nom, Projet, Budget).

◮ Afficher les personnels qui travaillent dans un projet de plus de 500kE et gagnent moins de 34kE :

◮ Il faut rassembler les deux tables pour avoir toutes les informations.

◮ Rassembler = produit cart ´esien.

SELECT Nom, Pr´enom

FROM Employ´es, D´epartements

WHERE Dept=NoDept AND Budget>=500 AND Salaire<=34;

◮ Expression en alg `ebre relationnelle :

πNom,Pr ´enom

σDept=NoDept∧Budget≥500∧Salaire≤34 Employ ´es×D ´epartements

(12)

Op ´erations bool ´eennes en SQL

◮ Intersection :

(SELECT Nom, Pr´enom FROM Employ´es WHERE Dept = 1) INTERSECT

(SELECT Nom, Pr´enom FROM Employ´es

WHERE Salaire >= 34);

◮ Union : similaire, mot-cl ´eUNION.

◮ Diff ´erence : similaire, mot-cl ´eEXCEPT:

◮ Afficher les tuples correspondant aux employ és du 1er d épartement dont le salaire est inf érieur à 34kE : (SELECT Nom, Prénom

FROM Employ´es WHERE Dept = 1) EXCEPT

(SELECT Nom, Pr´enom FROM Employ´es

WHERE Salaire >= 34);

(13)

Variables de type tuple

◮ Parfois on a besoin de r éf érencer la m ême relation deux fois dans la m ême requ ête.

◮ Afficher les personnels qui travaillent dans au moins deux projets.

◮ Il nous faut pouvoir r éf érencer la table “Employ és” deux fois.

◮ La syntaxe deFROMpermet de d éfinir desvariables de type tuple, prenant comme valeur une table et pouvant être r éf érenc ée à l’int érieur de la requ ête :

FROM Employés, Départements Dep1, Départements Dep2 WHERE Dept=Dep1.NoDept AND Dept=Dep2.NoDept

AND Dep1.Projet<>Dep2.Projet;

◮ Petit probl `eme : le personnel qui travaille sur trois ou plusieurs projets apparaˆıt au moins deux fois...

◮ Construire une relation sans duplicats :SELECT DISTINCT

SELECT DISTINCT Nom, Pr´enom

FROM Employés, Départements Dep1, Départements Dep2 WHERE Dept=Dep1.NoDept AND Dept=Dep2.NoDept

AND Dep1.Projet<>Dep2.Projet;

(14)

Imbrication des requ ˆetes dans les conditions WHERE

◮ On peut utiliser des sous-requ ˆetes pour construire des valeurs/tables sur lesquelles on peut v ´erifier certaines conditions.

◮ Retrouver les d épartements qui sont impliqu és dans le d éveloppement du jeu en r éseau peut se faire dans une sous-requ ête, dont le r ésultat peut être utilis é dans la clause WHERE:

SELECT Nom, Pr´enom FROM Employ´es WHERE Id IN

(SELECT NoDept FROM D´epartements

WHERE Projet = ’Jeu en r´eseau’

);

(15)

Conditions dans les clauses WHERE

◮ Autres conditions sur les tables obtenues par sous-requ ˆetes :

◮ Test d’ égalit és = R,erreursi le r ésultatRde la sous-requ ête contient plus d’une seule ligne ou plus d’une seule colonne.

◮ EXISTS R, vrai siRn’est pas vide.

◮ s > ALL R, vrai sisest plus grand que toutes les valeurs de la tableRunaire(c. `a.d.ayant une seule colonne).

◮ ErreursiRcontient deux colonnes ou plus !

◮ Similaire avec toutes les autres pr ´edicats de comparaison,<, <=,

>=, <>.

◮ s > ANY Rvrai s’il existe une valeur dansR(encore une fois relation unaire) qui est plus petite ques. (Aurait d û être nomm é SOME...).

◮ NOTpeut ˆetre employ ´e sur n’importe quelle condition.

(16)

Requ êtes corr él ées

◮ Prenons une table de sch ´ema Projets(PrjId,Nom,Ann ´ee).

◮ On cherche les projets qui se sont d éroul és sur deux ann ées ou plus.

◮ Solution en utilisant desrequ êtes corr él ées:

SELECT DISTINCT PrjId, Nom FROM Projets OldPrj WHERE Ann´ee < ANY

(SELECT Ann´ee FROM Projets

WHERE PrjId=OldPrj.PrjId );

◮ Hypoth `ese :PrjIdest une cl ´e primaire.

◮ La sous-requ ête est évalu éepour toute instance de l’attribut Old.PrjId.

(17)

Sous-requ ˆetes dans les clauses FROM

◮ Revenons aux tables Employ ´es et D ´epartements.

◮ Rajoutons une table RespProj de responsables de projets, de sch ´ema RespProj(Nom, Pr ´enom,Projet).

◮ Afficher les personnels qui travaillent dans les projets dont le responsable est M. Untel Quelqun :

◮ Retrouver d’abord les ProjId dont le responsable est ce monsieur,

◮ ... en mettant le r ´esultat dans une relation.

◮ Construire en parall `ele une relation qui indique qui travaille dans quel projet.

◮ Enfin, combiner les deux relations et afficher le r ´esultat.

FROM RespProj, (SELECT Nom, Prénom, Projet FROM Employés, Départements

WHERE Dept=NoDept) PersProj

WHERE RespProj.Nom=’Quelqun’ AND RespProjet.Pr´enom=’Untel’

AND RespProj.Projet = PersProj.Projet;

◮ Remarquer l’utilisation d’une variable de type tuple r écup érant le r ésultat de la sous-requ ête.

(18)

Construction de nouvelles relations par diff ´erentes variantes de jointure

◮ La clauseFROMest cens ´ee s’appliquer `aune relation.

◮ La virgule remplace le produit cart ´esien.

◮ CROSS JOINest un synonime pour le produit cart ´esien, donc la clause suivante :

FROM Employ´es, D´epartements

est ´equivalente `a :

FROM Employ´es CROSS JOIN D´epartements

(19)

Construction de nouvelles relations par diff ´erentes variantes de jointure (2)

◮ Laθ-jointure est aussi impl ´ement ´ee :

Employ´es JOIN D´epartements ON

Employ´es.Dept = D´epartement.NoDept

◮ Enfin, si on veut calculer la jointure naturelle des deux tables, il suffira de projeter le r ésultat pr éc édent sur les attributs

non-r ´edondants, c. `a.d. :

SELECT Id, Nom, Prénom, Dept, Salaire, Départements.Nom, Budget, Projet FROM Employés JOIN Départements ON

Employ´es.Dept = D´epartement.NoDept;

◮ Et enfin, les jointures externes sont impl ´ement ´ees aussi :

◮ La jointure externe bilat ´erale :NATURAL FULL OUTER JOIN.

◮ La jointure externe gauche :NATURAL LEFT OUTER JOIN.

◮ La jointure externe droite :NATURAL RIGHT OUTER JOIN.

(20)

Aggr ´egation en SQL

◮ SQL offre cinq op ´erateurs d’aggr ´egation :SUM, AVG, MIN, MAXetCOUNT.

◮ Ils sont appliq ´es, habituellement, `a un nom d’attribut (colonne), construisant une table ayant une seule unaire et ayant une seule ligne.

◮ Exception pour l’expressionCOUNT(*), qui calcule le nombre de tuples obtenus par les clausesFROM/WHILEde la requ ˆete.

◮ Afficher la moyenne des salaires et le nombre d’employ ´es : SELECT AVG(Salaire), COUNT(*)

FROM Employ´es;

◮ On peut éliminer les duplicats en mettant le mot-cl éDISTINCT devant l’op érande, comme dansCOUNT(DISTINCT Salary).

(21)

Groupement en SQL

◮ Afficher la liste des salaires dans l’entreprise, et pour chaque valeur de salaire le nombre de salari ´es ayant le salaire respectif.

◮ Il nous faut grouper les tuples par salaire,

◮ ... puis, pour chaque groupe, appliquer un op ´erateurCOUNT.

◮ Solution pour grouper :GROUP BY, suivi par le nom d’attribut sur lequel le groupement se fait.

SELECT Salaire, COUNT(Id) FROM Employ´es

GROUP BY Salaire

◮ Une table “interm ´ediaire” est construite, dans laquelle les lignes sont group ´ees selon la valeur de l’attribut Salaire.

◮ On peut imaginer qu’on aura, dans cette nouvelle table, autant de lignes que de valeurs de salaire diff ´erentes, et, dans chaque ligne, des “sous-lignes” contenant les tuples de notre table initiale.

◮ L’op érateur aggr ég éCOUNTproduira alors un r ésultat pour chaque groupe, donc pour chaque (macro)-ligne.

(22)

Clauses de type HAVING

◮ En groupant, il peut ˆetre utile de filtrer les groupes par une condition.

◮ C’est l’utilit ´e du mot cl ´eHAVING.

◮ Exemple : produire la liste des d épartements avec, pour chacun, la somme des budgets des projets dans lesquels l’employ é respectif participe, le tout seulement pour des budgets sup érieurs à 500kE :

SELECT Nom, SUM(Budget) FROM D´epartements GROUP BY Budget

HAVING MIN(Budget) > 500;

◮ A noter que l’aggr ´egation dans la clause` HAVINGs’applique seulement aux tuples du groupe en cours de construction.

◮ Tout attribute des relations dans la clauseFROMpeut être utilis é dans la clauseHAVING, mais seulement les attributs dans la clauseGROUP BYpeuvent apparaˆıtre non-aggr ég és dans HAVING.

(23)

Trier les r ´esultats

◮ Enfin, on peut trouver parfois utile de trier les r ´esultats d’une requ ˆete.

◮ Mots-cl ´eORDER BY, suivis par la liste d’attributs sur lesquels le tri est fait.

◮ Si plusieurs attributs dans la liste, alors on utilise l’ordre lexicographique sur les tuples :

◮ Si deux tuples t1et t2ont les m êmes valeurs pour les attributs A1,A2, alors le premier à être affich é sera celui qui a la valeur de l’attribut A3la plus petite.

(24)

Ex ´ecution des requ ˆetes SQL

◮ Supposons une requ ˆete simple SQL :

SELECT A, B FROM R1, R2 WHERE C

◮ L’ évaluation et la r éponse à cette requ ête est construite ainsi : 1. On prend chaque tuple dans la relationR1,

2. ... et chaque tuple dans la relationR2, 3. Si les deux tuples satisfont la clauseWHERE,

4. ... alors on ´evalue les expressions dans la clauseSELECT, 5. ... et on construit les tuples de valeurs calcul ´es dans leSELECT.