3 Stufen der Normalisierung von Daten

Einige der wichtigsten Schritte, die an dem Prozess der Normalisierung von Daten beteiligt sind, sind folgende:

Es gibt verschiedene Möglichkeiten, Datenelemente in Tabellen zu gruppieren. Der Datenbankdesigner wäre daran interessiert, den Weg zu wählen, der keine Anomalien bei der Datengruppierung sicherstellt. Diese Anomalien umfassen Datenredundanz, Datenverlust und falsche Beziehungen in Daten.

Bild mit freundlicher Genehmigung: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalisierung zielt darauf ab, Anomalien in Daten zu beseitigen. Der Normalisierungsprozess umfasst drei Stufen, wobei jede Stufe eine Tabelle in normaler Form erzeugt.

1. Erste Normalform:

Der erste Schritt bei der Normalisierung besteht darin, alle sich wiederholenden Felder in separaten Dateien abzulegen und ihnen die entsprechenden Schlüssel zuzuweisen.

Am Beispiel der Bestellabwicklung können in einer Bestellung folgende Datenelemente identifiziert werden:

Lieferanten ID

Name des Lieferanten

Adresse

Bestellnummer

Datum

Zahlungsbedingungen

Versandbedingungen

S. Nr.

Produktcode

Beschreibung

Maßeinheit

Preis

Bestellmenge

Menge

Wie oben beschrieben, werden die „Versandbedingungen“ für jede S-Nr. Wiederholt und es werden in jeder Bestellung mehrere Datensätze dafür angezeigt. In der ersten Stufe der Normalisierung werden die wiederholten Datenelemente in separaten Tabellen angeordnet. Daher teilen wir die Datenelemente wie unten gezeigt in zwei Tabellen auf:

Die wichtigsten Datenelemente werden in Großbuchstaben dargestellt. Die Tabelle befindet sich jetzt in der ersten Normalform (INF), da sich alle wiederholten Datenelemente (Felder) in einer separaten Tabelle befinden (Tabelle 1.2) und jeder Tabelle die Abrufschlüssel zugewiesen wurden. Da es in beiden Tabellen zwei Schlüsselelemente gibt, kann man sagen, dass jede Tabelle zusammengesetzte / zusammengesetzte Schlüssel hat. Diese Normalisierung hat die Daten vereinfacht.

2. Zweite Normalform:

In dieser Normalisierungsphase werden alle Nicht-Schlüsselelemente, die vollständig durch etwas anderes als den vollständigen Schlüssel angegeben werden, in einer separaten Tabelle platziert. Normalerweise sind diese Nichtschlüsselelemente nur von einem Teil eines zusammengesetzten Schlüssels abhängig.

Berücksichtigen Sie Tabelle 1.1, einen zusammengesetzten Schlüssel, bestehend aus Supplier_ ID und Bestellnummer. wird benutzt. Nicht-Schlüsselelemente wie Name und Adresse des Lieferanten sind jedoch nur von der Lieferanten-ID und nicht von der Bestellnummer abhängig. Daher werden diese Nicht-Schlüsseldatenelemente zusammen mit dem Schlüsseldatenelement lieferant_id in separaten Tabellen angeordnet.

In ähnlicher Weise sind die nicht wichtigen Datenelemente wie Datum, Zahlungsbedingungen und Versandbedingungen nur von der Bestellnummer abhängig. und werden somit zusammen mit der Bestell-Nr. als Schlüsselelement. Jetzt haben wir drei Tabellen anstelle von Tabelle 1.1:

In ähnlicher Weise können wir Tabelle 1.2 aufteilen, indem Nicht-Schlüsselelemente wie Beschreibung, Maßeinheit und Preis getrennt werden, die nur von einem Produktcode in einer Tabelle abhängig sind. Ebenso werden Produktcode, Menge und Menge abhängig von Bestellnummer und S-Nr. In einer separaten Tabelle abgelegt.

Die zweite Normalform (2NF) ist jetzt fertig und es gibt fünf Tabellen.

3. Dritte Normalform:

Durch diese Normalisierungsphase können redundante Datenelemente und Tabellen, die Teilmengen anderer Tabellen sind, eliminiert werden. Die redundanten Elemente sind diejenigen Nicht-Schlüsseldatenelemente, die in mehr als einer Tabelle der virtuellen Datenelemente platziert sind.

Bei den virtuellen Datenelementen handelt es sich um diejenigen Elemente, deren Wert mit anderen Elementen berechnet werden kann, wenn der Wert angefordert wird. Der Wert des Betragsdatenelements in Tabelle 1.2.2 kann durch Multiplizieren der Menge mit dem Preis berechnet werden, wodurch solche redundanten Datenelemente eliminiert werden.

Wenn in der Datenbank auch eine andere Tabelle mit dem Namen Lieferantenmastertabelle verwaltet wird, ist Tabelle 1.1.2 wahrscheinlich eine Teilmenge der Lieferantenmastertabelle. Somit kann diese Tabelle auch weggelassen werden.

Die dritte Normalform (3NF) bietet die Gruppierung von Daten, die einfach, leicht zu pflegen und mit minimaler Redundanz ist.

Somit kann die Normalisierung dazu beitragen, die Redundanz zu reduzieren und andere Anomalien in den Daten zu beseitigen. Der oben diskutierte dreistufige Normalisierungsprozess ist nur andeutungsweise. Beim Entwurf von Datenbanken können weitere Versuche unternommen werden, falls dies aufgrund der Art der Daten erforderlich ist.