Modele de date - stadopedia

Concepte de bază ale teoriei bazelor de date

Un obiect este un element al unui sistem informatic, informații despre care sunt stocate în baza de date.

Un atribut este un afișaj de informații al proprietăților unui obiect.





Fiecare obiect este caracterizat de un anumit set de atribute.

Un element de date cheie este un atribut (sau un grup de atribute) care vă permite să definiți valorile altor elemente de date.

O înregistrare de date (echivalentul în engleză a unei înregistrări) este o colecție de valori pentru elementele de date aferente.







O cheie primară este un atribut (sau un grup de atribute) care identifică în mod unic fiecare instanță a unui obiect (înregistrare). O cheie secundară este un atribut (sau un grup de atribute) a cărui valoare poate fi repetată pentru mai multe înregistrări (instanțe de obiecte). Mai întâi, cheile secundare sunt utilizate în operațiile de recuperare a înregistrărilor.

Procedurile de stocare a datelor în baza de date trebuie să respecte anumite principii generale, dintre care, în primul rând, trebuie remarcat:

• Integritatea și consecvența datelor, înțeleasă ca securitatea fizică a datelor și prevenirea utilizării abuzive a datelor, menținerea combinațiilor acceptabile ale valorilor acestora, protecția împotriva distorsiunilor structurale și accesul neautorizat;

• Redundanța minimă a datelor înseamnă că orice element de date ar trebui să fie stocat în baza de date într-o singură formă, evitându-se astfel duplicarea operațiunilor efectuate cu acesta.

Un set de principii care determină organizarea structurii logice a stocării datelor în baza de date se numește modelul de date. Modelele bazei de date sunt definite prin trei componente:

• o organizare acceptabilă a datelor;

• un set de operațiuni admisibile.

În teoria sistemelor de gestionare a bazelor de date se disting trei tipuri de bază: ierarhice, de rețea și relaționale.

Modelul ierarhic vă permite să construiți baze de date cu o structură ierarhică de copaci. Această structură este definită ca un arbore format prin legături pereche. La cel mai înalt nivel al arborelui, există un nod, numit rădăcină. Toate elementele sunt legate prin relații de subordonare și, prin urmare, orice element poate să respecte doar un alt element. Această formă de dependență este reprezentată în mod convenabil de către

Modele de date - stadopedia
un grafic arbore (un circuit format din puncte și săgeți care este conectat și nu are cicluri). Un exemplu de structură de bază de date ierarhică este prezentat în Fig. 2.1.

Principalul avantaj al modelului ierarhic este simplitatea de a descrie structurile ierarhice ale lumii reale.

Un reprezentant tipic al unei familii de baze de date, bazat pe un model ierarhic, este IBM Information Management System (IMS), prima versiune a cărora a apărut în 1968.

Modele de date - stadopedia
Conceptul de model de date de rețea este asociat cu numele lui C. Bachmann. O abordare în rețea a organizării datelor este o extensie a ierarhiei. În structurile ierarhice, înregistrarea descendentă trebuie să aibă exact un strămoș; În structura de date de rețea, descendentul poate avea orice număr de strămoși (Figura 2.2). În el, elementul poate fi legat de oricare altul, fără restricții. Un DB de rețea constă dintr-un set de înregistrări care corespund fiecărei instanțe a obiectului de domeniu și un set de legături între ele. De exemplu, informațiile despre participarea angajaților la proiectele organizației pot fi prezentate în baza de date a rețelei (Figura 2.3). În acest exemplu, modelul de rețea reflectă bine faptul că diferiți angajați pot participa la proiect și, în același timp, angajatul poate participa la diverse proiecte.

Fig. 2.3. Exemplu de structură de rețea a unei baze de date

Un exemplu de sistem de gestionare a datelor cu o organizație în rețea este Sistemul integrat de gestionare a bazelor de date (IDMS) al firmei Cullinet Software Inc. dezvoltat la mijlocul anilor '70. Este proiectat pentru utilizarea pe computere "mari".

Printre avantajele sistemelor de management al datelor bazate pe o modele ierarhice sau de rețea, ele pot fi numite de compact și, în general, de înaltă performanță, iar printre dezavantaje - nonuniversality grad ridicat în funcție de datele specifice.

Conceptele modelului relațional au fost formulate pentru prima dată în lucrările omului de știință american EF Codd. De unde vine numele său secundar - modelul Codd.

Modele de date - stadopedia
În modelul relațional, obiectele și relațiile dintre ele sunt reprezentate folosind tabele (Figura 2.4). Pentru definiția ei formală, se folosește conceptul fundamental al relației. Strict vorbind, termenul "relațional" provine din relația engleză - relația.

Modelul relațional se bazează pe sistemul de concepte de algebră relațională, dintre care cele mai importante sunt: ​​tabel, relație, șir, coloană, cheie primară. Toate operațiile dintr-o bază de date relațională sunt reduse la tabelele de manipulare. Tabelul constă din rânduri și coloane și are un nume unic în baza de date. Tabelul reflectă tipul obiectului (entitate) din lumea reală, iar fiecare dintre liniile sale (tuple) este un obiect specific (Figura 2.5). De exemplu, tabelul "Angajații din departament" conține informații despre toți angajații departamentului, fiecare linie a acestuia - un set de valori pentru atributele unui anumit angajat. Valorile unui atribut specific sunt selectate din domeniul (domeniu) - setul tuturor valorilor posibile ale atributului obiectului. Numele coloanei trebuie să fie unic în tabel. Coloanele sunt situate în tabel în funcție de ordinea numelor la crearea acestora. Orice tabel trebuie să aibă cel puțin o coloană. Spre deosebire de coloane, rândurile nu au nume. Ordinea urmãtoarelor lor în tabel nu este definitã, iar numãrul nu este limitat logic. Din moment ce rândurile din tabel nu sunt ordonate, este imposibil să selectați un rând după poziția sa - nu există "primul" și "ultimul" dintre ele.

Fig. 2.5. Relația bazei de date relaționale

Orice tabelă are una sau mai multe coloane ale căror valori identifică în mod unic fiecare din rândurile sale. O astfel de coloană (sau o combinație de coloane) se numește cheie primară. În tabelul "Angajații departamentului", cheia primară este coloana "Săriți numărul". Nu ar trebui să existe rânduri în tabel care să aibă aceeași valoare a cheii primare. Dacă tabelul îndeplinește această cerință, se numește o relație.

Interconectarea tabelelor în modelul relațional este susținută de chei externe. O cheie străină este o coloană a cărei valori caracterizează fără echivoc entitățile substituite de rândurile unei alte relații, adică ele specifică valorile cheii primare. Se spune că relația în care este definită cheia externă se referă la relația corespunzătoare în care același atribut este cheia primară.

Tabelele nu pot fi stocate și procesate, în cazul în care baza de date lipsă „date despre date“ (metadate), cum ar fi descriptorii de tabele, coloane, și așa mai departe. D. Metadatele este, de asemenea, prezentate sub formă de tabele și stocate în dicționarul de date. În plus față de tabele, alte obiecte pot fi stocate în bază de date, cum ar fi formularele de ecran, șabloanele de rapoarte și programele de aplicații care funcționează cu informațiile bazei de date.

Un avantaj important al modelului relațional este că, în cadrul său, acțiunile asupra datelor pot fi reduse la operațiile de algebră relațională care se realizează pe relații. Acestea sunt operații cum ar fi unirea, intersecția, scăderea, produsul cartezian, proba, proiecția, conexiunea, diviziunea.

Cea mai importantă problemă rezolvată la proiectarea bazelor de date este crearea unei astfel de structuri care să asigure duplicarea minimă a informațiilor, simplificarea procedurilor de procesare și actualizare a datelor. Coddom a propus un set de cerințe formale de natură universală pentru organizarea datelor, care permit soluționarea eficientă a problemelor enumerate. Aceste cerințe pentru starea tabelelor de date se numesc forme normale. Inițial, au fost formulate trei forme normale. Mai târziu, a apărut forma normală a lui Boise-Codd și formele normale de ordine superioare. Cu toate acestea, ele nu au fost utilizate pe scară largă în practică.

În teoria bazelor de date relaționale este comună distingerea următoarei secvențe de forme normale:

1) prima formă normală (1NF);

2) a doua formă normală (2NF);

3) a treia formă normală (3NF);

4) forma normală de Boise-Codd (BCNF);

5) a patra formă normală (4NF);

6) a cincea formă normală (5NF).

Fiecare formă normală corespunde unui anumit set de constrângeri. Raportul este într-o anumită formă normală dacă satisface setul de constrângeri ale acestei forme. Traducând structura relațiilor DB în formele de ordin superior, încercăm să eliminăm din tabele informațiile redundante care nu sunt importante.

Se spune că raportul este în prima formă normală, dacă toate atributele sale sunt simple.

Relația se află în cea de-a doua formă normală dacă satisface cerințele primei forme normale și fiecare atribut non-cheie este complet funcțional dependent de cheie (determinată în mod unic de aceasta).

Raportul este în a treia formă normală dacă satisface cerințele celei de-a doua forme normale și orice atribut non-cheie depinde de cheie netransi tabil. Rețineți că tranziția este o astfel de dependență, în care orice atribut non-cheie depinde de un alt atribut non-cheie și care, la rândul său, depinde de cheie.

Să considerăm un exemplu de a aduce relația la a treia formă normală. Lăsați o firmă mică care vinde accesorii de calculator să stocheze date despre ordine. Aceste date includ:

3) articolul (numărul unic de produs al produsului);

4) denumirea mărfurilor;

5) prețul bunurilor comandate.

Normalizarea relațiilor nu este o pierdere de timp. În exemplul rezultat, este necesar să modificați "Nume" de la "DIMM 32 Mb" pe "DIMM 32 Mb SDRAM". Într-o relație anormală, ar fi necesar să căutați și să editați toate liniile care conțin acest nume, iar în baza de date normalizată se modifică doar o linie a unei relații.

Mai multe detalii cu procesul de normalizare și cu cerințele formularelor normale mai vechi decât al treilea (3NF) pot fi găsite în literatura de specialitate privind teoria
baze de date relaționale.

Principalul avantaj al modelului relațional este simplitatea acestuia. Este datorită faptului că acesta este pus în baza majorității covârșitoare a DBMS cu adevărat funcționale.







Articole similare

Trimiteți-le prietenilor: