Η κανονικοποίηση αποτρέπει τη σπατάλη χώρου στο δίσκο ελαχιστοποιώντας ή εξαλείφοντας τον πλεονασμό.
Συγκριτικό διάγραμμα
Βάση σύγκρισης | Ομαλοποίηση | Αποσυναρμολόγηση |
---|---|---|
Βασικός | Η κανονικοποίηση είναι η διαδικασία δημιουργίας ενός καθορισμένου σχήματος για την αποθήκευση μη περιττών και συνεπών δεδομένων. | Η αποδυνάμωση είναι η διαδικασία συνδυασμού των δεδομένων έτσι ώστε να μπορεί να αναζητηθεί γρήγορα. |
Σκοπός | Για να μειώσετε την πλεονασμό δεδομένων και την ασυνέπεια. | Για να επιτευχθεί η ταχύτερη εκτέλεση των ερωτημάτων μέσω της εισαγωγής πλεονασμού. |
Χρησιμοποιείται σε | OLTP σύστημα, όπου η έμφαση δίνεται στην καθιστώντας την εισαγωγή, τη διαγραφή και την ενημέρωση των ανωμαλιών γρηγορότερα και την αποθήκευση των δεδομένων ποιότητας. | OLAP σύστημα, όπου η έμφαση δίνεται στην ταχύτερη αναζήτηση και ανάλυση. |
Ακεραιότητα δεδομένων | Διατηρείται | Δεν μπορεί να διατηρήσει |
Πλεονασμός | Αποκλείστηκε | Προστέθηκε |
Αριθμός πινάκων | Αυξάνει | Μειώνει |
Χώρος στο δισκο | Βελτιστοποιημένη χρήση | Απώλεια |
Ορισμός της Κανονικοποίησης
Η κανονικοποίηση είναι η μέθοδος της αποτελεσματικής ρύθμισης των δεδομένων στη βάση δεδομένων. Περιλαμβάνει την κατασκευή πινάκων και τη δημιουργία σχέσεων μεταξύ αυτών των πινάκων σύμφωνα με ορισμένους ορισμένους κανόνες. Η απόλυση και η ασυνεπής εξάρτηση μπορούν να καταργηθούν χρησιμοποιώντας αυτούς τους κανόνες προκειμένου να καταστεί πιο ευέλικτη.
Τα πλεονάζοντα δεδομένα σπαταλούν χώρο στο δίσκο, αυξάνουν την ασυνέπεια των δεδομένων και επιβραδύνουν τα ερωτήματα DML. Εάν τα ίδια δεδομένα υπάρχουν σε περισσότερα από ένα μέρη και οποιαδήποτε ενημέρωση έχει δεσμευτεί για αυτά τα δεδομένα, τότε η αλλαγή πρέπει να αντικατοπτρίζεται σε όλες τις τοποθεσίες. Τα ασυνεπή δεδομένα μπορούν να καταστήσουν πιο δύσκολη την αναζήτηση δεδομένων και την πρόσβαση, χάνοντας τη διαδρομή προς αυτήν.
Υπάρχουν διάφοροι λόγοι πίσω από την πραγματοποίηση της ομαλοποίησης, όπως η αποφυγή πλεονασμού, η ενημέρωση των ανωμαλιών, η περιττή κωδικοποίηση, η διατήρηση των δεδομένων στη μορφή που μπορεί να φιλοξενήσει την αλλαγή πιο εύκολα και με ακρίβεια και να επιβάλει τον περιορισμό των δεδομένων.
Η κανονικοποίηση περιλαμβάνει την ανάλυση των λειτουργικών εξαρτήσεων μεταξύ χαρακτηριστικών. Οι σχέσεις (πίνακες) αποσυντίθενται με ανωμαλίες για τη δημιουργία σχέσεων με μια δομή. Βοηθά στη λήψη αποφάσεων ποια χαρακτηριστικά θα πρέπει να ομαδοποιηθούν σε μια σχέση.
Η εξομάλυνση βασίζεται βασικά στις έννοιες των κανονικών μορφών . Ένας πίνακας σχέσεων λέγεται ότι είναι σε κανονική μορφή εάν εκπληρώνει ένα ορισμένο σύνολο περιορισμών. Υπάρχουν 6 καθορισμένες κανονικές μορφές: 1NF, 2NF, 3NF, BCNF, 4NF και 5NF. Η κανονικοποίηση θα πρέπει να εξαλείψει την πλεονασμό αλλά όχι με το κόστος της ακεραιότητας.
Ορισμός της αποτύπωσης
Η αποδυνάμωση είναι η αντίστροφη διαδικασία της κανονικοποίησης, όπου το κανονικοποιημένο σχήμα μετατρέπεται σε σχήμα που έχει περιττές πληροφορίες. Η απόδοση βελτιώνεται με τη χρήση πλεονασμού και διατηρώντας τα πλεονάζοντα δεδομένα συνεπή. Ο λόγος για την εκτέλεση της απομυθοποίησης είναι τα γενικά έξοδα που παράγονται στον επεξεργαστή ερωτήματος από μια υπερ-κανονικοποιημένη δομή.
Η αποδυνάμωση μπορεί επίσης να οριστεί ως η μέθοδος αποθήκευσης της σύνδεσης ανώτερων φυσιολογικών σχέσεων ως βασική σχέση, η οποία είναι σε χαμηλότερη κανονική μορφή. Μειώνει τον αριθμό των πινάκων και τις πολύπλοκες συνδέσεις τραπέζι, επειδή ένας μεγαλύτερος αριθμός συνδέσεων μπορεί να επιβραδύνει τη διαδικασία. Υπάρχουν διάφορες τεχνικές denormalization όπως: Αποθήκευση προερχόμενων τιμών, πίνακες προ-σύνδεσης, σκληρές κωδικοποιημένες τιμές και διατήρηση στοιχείων με τον κύριο κλπ.
Εδώ η προσέγγιση denormalization, δίνει έμφαση στην έννοια ότι με την τοποθέτηση όλων των δεδομένων σε ένα σημείο, θα μπορούσε να εξαλείψει την ανάγκη αναζήτησης αυτών των πολλαπλών αρχείων για τη συλλογή αυτών των δεδομένων. Η βασική στρατηγική ακολουθείται στην αποαναμόρφωση, όπου επιλέγεται η πιο αποφασιστική διαδικασία για να εξετάσει τις τροποποιήσεις που τελικά θα βελτιώσουν την απόδοση. Και η πιο βασική τροποποίηση είναι ότι η προσθήκη πολλαπλών χαρακτηριστικών στον υπάρχοντα πίνακα μειώνει τον αριθμό των συνδέσεων.
Βασικές διαφορές μεταξύ της κανονικοποίησης και της αποδυνάμωσης
- Η κανονικοποίηση είναι η τεχνική της διαίρεσης των δεδομένων σε πολλαπλούς πίνακες για τη μείωση της πλεονασμού δεδομένων και της ασυνέπειας και για την επίτευξη της ακεραιότητας των δεδομένων. Από την άλλη πλευρά, η εξομοίωση είναι η τεχνική συνδυασμού των δεδομένων σε ένα μόνο τραπέζι για την ταχύτερη ανάκτηση δεδομένων.
- Η κανονικοποίηση χρησιμοποιείται στο σύστημα OLTP, το οποίο δίνει έμφαση στην ταχύτερη εισαγωγή, διαγραφή και ενημέρωση των ανωμαλιών. Αντιθέτως, η εξομοίωση χρησιμοποιείται στο σύστημα OLAP, το οποίο δίνει έμφαση στην ταχύτερη αναζήτηση και ανάλυση.
- Η ακεραιότητα των δεδομένων διατηρείται στη διαδικασία κανονικοποίησης, ενώ στην ακεραιότητα των δεδομένων αποτύπωσης δεδομένων είναι πιο δύσκολο να διατηρηθεί.
- Τα πλεονασματικά δεδομένα εξαλείφονται όταν εκτελείται ομαλοποίηση ενώ η αποδυνάμωση αυξάνει τα πλεονάζοντα δεδομένα.
- Η κανονικοποίηση αυξάνει τον αριθμό των πινάκων και των συνδέσεων. Αντίθετα, η απομυθοποίηση μειώνει τον αριθμό των πινάκων και συμμετέχει.
- Ο χώρος στο δίσκο σπαταλιέται στην απομυθοποίηση, επειδή τα ίδια δεδομένα αποθηκεύονται σε διαφορετικά μέρη. Αντίθετα, ο χώρος στο δίσκο βελτιστοποιείται σε έναν κανονικοποιημένο πίνακα.
συμπέρασμα
Η κανονικοποίηση και η απομυθοποίηση είναι χρήσιμες ανάλογα με την κατάσταση. Η κανονικοποίηση χρησιμοποιείται όταν απαιτείται απαραιτήτως η ταχύτερη εισαγωγή, διαγραφή και ενημέρωση των ανωμαλιών και η συνέπεια των δεδομένων. Από την άλλη πλευρά, η εξομοίωση χρησιμοποιείται όταν η ταχύτερη αναζήτηση είναι πιο σημαντική και η βελτιστοποίηση της απόδοσης ανάγνωσης. Μειώνει επίσης τα γενικά έξοδα που δημιουργούνται από υπερβολικά κανονικοποιημένα δεδομένα ή από πολύπλοκες συνδέσεις τραπεζιών.