Το σημείο που διακρίνει τον Πίνακα Δεδομένων και τον Πίνακα Διαστάσεων είναι ότι ο πίνακας διαστάσεων περιέχει ιδιότητες κατά τις οποίες λαμβάνονται τα μέτρα στον πίνακα πραγματικότητας . Υπάρχουν μερικοί άλλοι παράγοντες που δημιουργούν διαφορές μεταξύ του Πίνακα Πίνακα και του Πίνακα διαστάσεων για να τις δείτε, ας ρίξουμε μια ματιά στο παρακάτω διάγραμμα σύγκρισης.
Συγκριτικό διάγραμμα
Βάση σύγκρισης | Πίνακας στοιχείων | Πίνακας διαστάσεων |
---|---|---|
Βασικός | Ο πίνακας στοιχείων περιέχει τη μέτρηση κατά μήκος των χαρακτηριστικών ενός πίνακα διαστάσεων. | Ο πίνακας διαστάσεων περιέχει τα χαρακτηριστικά κατά τα οποία ο πίνακας στοιχείων υπολογίζει τη μέτρηση. |
Χαρακτηριστικά και αρχεία | Ο πίνακας στοιχείων περιέχει λιγότερα χαρακτηριστικά και περισσότερες εγγραφές. | Ο πίνακας διαστάσεων περιέχει περισσότερα χαρακτηριστικά και λιγότερα αρχεία. |
Μέγεθος πίνακα | Ο πίνακας στοιχείων αυξάνεται κάθετα. | Ο πίνακας διαστάσεων αναπτύσσεται οριζόντια. |
Κλειδί | Ο πίνακας στοιχείων περιέχει ένα πρωτεύον κλειδί το οποίο είναι μια αλληλοσύνδεση των πρωτεύοντων πλήκτρων του κάθε πίνακα διαστάσεων. | Κάθε πίνακας διαστάσεων περιέχει το πρωτεύον κλειδί του. |
Δημιουργία | Ο πίνακας στοιχείων μπορεί να δημιουργηθεί μόνο όταν ολοκληρωθούν οι πίνακες διαστάσεων. | Πρέπει πρώτα να δημιουργηθούν πίνακες διαστάσεων. |
Σχήμα | Ένα σχήμα περιέχει μικρότερο αριθμό πινάκων γεγονότων. | Ένα σχήμα περιέχει περισσότερους πίνακες διαστάσεων. |
Γνωρίσματα | Ο πίνακας στοιχείων μπορεί να έχει δεδομένα τόσο σε αριθμητικό όσο και σε μορφή κειμένου. | Ο πίνακας διαστάσεων περιέχει πάντα χαρακτηριστικά σε μορφή κειμένου. |
Ορισμός πίνακα πραγματικών στοιχείων
Ένας πίνακας γεγονότων είναι ένας πίνακας που περιέχει μετρήσεις κατά μήκος των χαρακτηριστικών των πινάκων διαστάσεων. Μπορεί να περιέχει τις πληροφορίες στο χαμηλότερο δυνατό επίπεδο. Ορισμένος πίνακας γεγονότων περιέχει μόνο συνοπτικά δεδομένα, που ονομάζονται Συγκεντρωτικός Πίνακας Γεγονότων . Ο πίνακας γεγονότων περιέχει σχεδόν τα δεδομένα που φέρουν ημερομηνία σφραγίδας . Ας συζητήσουμε τα χαρακτηριστικά ενός πίνακα γεγονότων.
Συνδεδεμένο κλειδί
Ο πίνακας στοιχείων περιέχει το Κλεισμένο κλειδί που είναι η συνένωση των κύριων πλήκτρων όλων των πινάκων διαστάσεων. Ο συνδυασμένος πίνακας γεγονότων πρέπει να προσδιορίζει με μοναδικό τρόπο τη σειρά σε έναν πίνακα γεγονότων.
Δεδομένα Κόκκος
Οι κόκκοι δεδομένων δείχνουν πόσο βαθιά έχουν αποθηκευτεί οι μετρήσεις στον πραγματικό πίνακα. Οι κόκκοι δεδομένων πρέπει να είναι στο υψηλότερο δυνατό επίπεδο.
Πρόσθετα Μέτρα
Τα χαρακτηριστικά του πίνακα γεγονότων μπορούν να είναι πλήρως προσθετικά ή ημι-πρόσθετα . Πλήρως πρόσθετα μέτρα είναι εκείνα που μπορούν εύκολα να συνοψιστούν για όλες τις διαστάσεις στην πραγματικότητα πίνακα. Για παράδειγμα quantity_ordered, είναι ένα χαρακτηριστικό που μπορεί να συνοψιστεί για όλες τις διαστάσεις. Όπως μπορούμε, μπορούμε να πάρουμε το συνολικό quantity_order, για έναν συγκεκριμένο πελάτη, περιοχή, ημερομηνία, μάρκα κλπ. Τα ημι-πρόσθετα μέτρα είναι εκείνα που μπορούν να αθροιστούν σε ορισμένες διαστάσεις του πίνακα γεγονότων αλλά όχι σε όλες τις διαστάσεις. Όπως και στην περίπτωση, το ποσό ισορροπίας δεν μπορεί να συνοψιστεί ως χρονική διάσταση καθώς αλλάζει με την πάροδο του χρόνου.
Αραιά δεδομένα
Μερικές φορές μπορούμε να δούμε τα αρχεία στον πραγματικό πίνακα που έχει ιδιότητες με μηδενικά μέτρα . Για παράδειγμα, ενδέχεται να μην υπάρχει εντολή για διακοπές. Επομένως, τα χαρακτηριστικά για αυτήν την ημερομηνία θα έχουν μηδενικά μέτρα. Δεν χρειάζεται να αποθηκεύουμε μέτρα για τέτοιου είδους αρχεία, καθώς δεν παρέχουν καμία πληροφορία.
Εκφυλισμένες διαστάσεις
Μερικές φορές μπορεί να συναντήσετε μερικές διαστάσεις στην πραγματικότητα πίνακα, οι οποίες δεν είναι καθόλου πρόσθετες. Για παράδειγμα, αριθμός_παραγγελίας, customer_id, δεν μπορείτε να προσθέσετε αυτούς τους τύπους διαστάσεων. Ωστόσο, σε περίπτωση, θα πρέπει να βρείτε εντολή που έχει γίνει από συγκεκριμένο πελάτη σε αυτόν τον μήνα. τότε θα χρειαστείτε το customer_id να συνδέσει την αναζήτησή σας. Αυτοί οι τύποι, αν οι ιδιότητες ή οι διαστάσεις του πίνακα γεγονότων καλούνται Degenerated Dimension .
Ορισμός πίνακα διαστάσεων
Ο πίνακας διαστάσεων είναι ένα βασικό στοιχείο για το αρχικό σχήμα. Ο πίνακας διαστάσεων περιέχει τα χαρακτηριστικά που αντιπροσωπεύουν τις διαστάσεις, κατά μήκος των οποίων η μέτρηση λαμβάνεται στον πραγματικό πίνακα. Περαιτέρω, θα συζητήσουμε ορισμένα χαρακτηριστικά ενός πίνακα διαστάσεων.
Χαρακτηριστικά και κλειδιά
Κάθε πίνακας διαστάσεων πρέπει να έχει ένα πρωτεύον κλειδί που προσδιορίζει με μοναδικό τρόπο κάθε εγγραφή του πίνακα. Παρατηρείται συχνά ότι ο πίνακας διαστάσεων περιέχει πολλά χαρακτηριστικά. Ως εκ τούτου, φαίνεται να είναι ευρεία δηλαδή όταν δημιουργείτε ένα πίνακα διαστάσεων θα το βρείτε να απλώνεται οριζόντια .
Τιμές ιδιοτήτων
Οι τιμές των χαρακτηριστικών στο πίνακα διαστάσεων είναι σπάνια αριθμητικές, οι περισσότερες φορές θα βρείτε ότι οι τιμές στα χαρακτηριστικά είναι σε μορφή κειμένου . Για παράδειγμα όνομα προϊόντος, εμπορικό σήμα, κατηγορία, υποκατηγορία κ.λπ.
Σχέση μεταξύ χαρακτηριστικών
Συχνά μπορείτε να παρατηρήσετε ότι τα χαρακτηριστικά που συναντάτε σε έναν πίνακα διαστάσεων δεν σχετίζονται άμεσα. Όπως, το Product_brand δεν πρέπει να κάνει τίποτα με το package_date, αλλά και τα δύο θα μπορούσαν να είναι τα χαρακτηριστικά του πίνακα dimension των προϊόντων.
Ομαλοποίηση
Ο πίνακας διαστάσεων δεν υποτίθεται ότι είναι κανονικοποιημένος . Αυτό συμβαίνει επειδή η ομαλοποίηση ενός πίνακα θα δημιουργούσε πολλούς ενδιάμεσους πίνακες. Όταν ένα ερώτημα συλλέγει ένα χαρακτηριστικό από τον πίνακα διαστάσεων και ανακτά τις μετρήσεις κατά μήκος αυτού για τον πίνακα γεγονότων, το ερώτημα πρέπει να περάσει από τους ενδιάμεσους πίνακες που καθίστανται αναποτελεσματικοί. Επομένως, οι πίνακες διαστάσεων δεν είναι Κανονικοποιημένοι.
Τρυπώντας κάτω, κυλώντας
Τα χαρακτηριστικά του πίνακα διαστάσεων σάς επιτρέπουν να λάβετε τις λεπτομέρειες είτε μεταβαίνοντας από υψηλότερο επίπεδο συγκεντρωτικών ιδιοτήτων σε ιδιότητες χαμηλότερου επιπέδου. Για παράδειγμα, αν θέλετε να βρείτε τη συνολική πώληση σε μια περιοχή, τότε μπορείτε να βρείτε μια λίστα με τις πωλήσεις ανά κράτος, πόλη, zip. Μπορείτε ακόμη να κυλήσετε για να βρείτε τις συνολικές πωλήσεις πρώτα από το φερμουάρ, στη συνέχεια από την πόλη και μετά το κράτος.
Πολλαπλή ιεραρχία
Συχνά πίνακας διαστάσεων προσφέρει πολλαπλές ιεραρχίες. Για παράδειγμα, έχουμε έναν πίνακα διαστάσεων προϊόντος για ένα κατάστημα. Τώρα, έχουμε δύο τμήματα μάρκετινγκ και λογιστική υπηρεσία.
Το τμήμα μάρκετινγκ θα αναλύσει τις ιδιότητες του πίνακα διαστάσεων του προϊόντος σε μια συγκεκριμένη ιεραρχία για να λάβει μετρήσεις για τον πίνακα γεγονότων.
Σε άλλα χέρια, η λογιστική υπηρεσία θα ασχοληθεί με τις ιδιότητες του πίνακα διαστάσεων του προϊόντος στη διαφορετική ιεραρχία για να λάβει μετρήσεις για τον πίνακα γεγονότων.
Επομένως, ο πίνακας διαστάσεων πρέπει να έχει πολλαπλές ιεραρχίες ή επίπεδο συσσωμάτωσης χαρακτηριστικών για να επιτρέψει στον χρήστη να ασκήσει διάτρηση κατά μήκος οποιασδήποτε από τις πολλαπλές ιεραρχίες.
Εγγραφές
Αν και ένας πίνακας διαστάσεων έχει πάρα πολλά χαρακτηριστικά, έχει λιγότερα αρχεία.
Βασικές διαφορές μεταξύ πίνακα πινάκων και πίνακα διαστάσεων
- Ο πίνακας στοιχείων περιέχει μέτρηση κατά μήκος της διάστασης / χαρακτηριστικών ενός πίνακα διαστάσεων.
- Ο πίνακας στοιχείων περιέχει περισσότερες εγγραφές και μικρότερο χαρακτηριστικό σε σύγκριση με τον πίνακα διαστάσεων ενώ ο πίνακας διαστάσεων περιέχει περισσότερα χαρακτηριστικά και λιγότερες εγγραφές.
- Το μέγεθος του πίνακα του πίνακα γεγονότων αυξάνεται κατακόρυφα, ενώ το μέγεθος πίνακα του πίνακα διαστάσεων αυξάνεται οριζόντια.
- Κάθε πίνακας διαστάσεων περιέχει ένα πρωτεύον κλειδί για την ταυτοποίηση κάθε εγγραφής στον πίνακα, ενώ ο πίνακας γεγονότων περιέχει αλληλένδετο κλειδί που είναι ένας συνδυασμός όλων των πρωτεύοντων πλήκτρων όλων των πίνακα διαστάσεων.
- Ο πίνακας διαστάσεων πρέπει να καταγραφεί πριν από τη δημιουργία πίνακα πινάκων.
- Ένα Σχήμα περιέχει λιγότερους πίνακες γεγονότων αλλά περισσότερους πίνακες διαστάσεων.
- Οι ιδιότητες στον πραγματικό πίνακα είναι αριθμητικές καθώς και κειμενικές, αλλά τα χαρακτηριστικά του πίνακα διαστάσεων έχουν μόνο χαρακτηριστικά κειμένου.
Συμπέρασμα:
Και οι δύο είναι εξίσου σημαντικές για τη δημιουργία σχήματος, αλλά ο πίνακας διαστάσεων πρέπει να καταγράφεται πριν από τον πίνακα γεγονότων. Δεδομένου ότι είναι αδύνατο να δημιουργηθεί πίνακας γεγονότων χωρίς διαστάσεις.