Οργάνωση

Σημαντικό μέρος της καλής διαχείρισης δεδομένων είναι επίσης η μέριμνα για την οργάνωση των δεδομένων. Αυτό περιλαμβάνει, για παράδειγμα, προσεκτική ονομασία αρχείων, σαφή δομή φακέλων, προσβάσιμες μορφές αρχείων και ρητό έλεγχο έκδοσης.

Αρχεία και μορφές αρχείων

Είναι καλή πρακτική να δημιουργείτε ένα σαφές σύστημα ονομασίας αρχείων από την αρχή του έργου. Αυτό σας βοηθά να κατανοήσετε τι περιέχουν τα αρχεία από το όνομα. Διαφορετικά ερευνητικά πεδία μπορεί επίσης να έχουν οδηγίες και οδηγίες για την οργάνωση δεδομένων.

Όλες οι ψηφιακές πληροφορίες είναι δομημένα δεδομένα. Η μορφή αρχείου είναι ένας τυπικός τρόπος με τον οποίο κωδικοποιούνται οι πληροφορίες για αποθήκευση σε ένα αρχείο υπολογιστή. Μια ανοιχτή μορφή είναι μια μορφή αρχείου για την αποθήκευση ψηφιακών δεδομένων, που ορίζεται από μια δημοσιευμένη προδιαγραφή που συνήθως διατηρείται από έναν οργανισμό τυποποίησης, η οποία μπορεί να χρησιμοποιηθεί και να εφαρμοστεί από οποιονδήποτε. Σε αντίθεση με τις ανοιχτές μορφές, οι κλειστές (ή ιδιόκτητες) μορφές θεωρούνται εμπορικά μυστικά. Για παράδειγμα, ένας μεγάλος αριθμός εμπορικού εξοπλισμού ή λογισμικού παράγει δεδομένα που δεν μπορούν να διαβαστούν ή να ερμηνευτούν χωρίς άλλα εργαλεία από τον ίδιο πάροχο. Κατά την οργάνωση, την αποθήκευση και τη δημοσίευση δεδομένων είναι σημαντικό να δημιουργείτε συνεκτικές, κατανοητές και διαφανείς οντότητες που να είναι εύκολα προσβάσιμες και να επαναχρησιμοποιούνται. Αυτό είναι δυνατό με ανοιχτές μορφές που μπορούν να ανοίξουν και να χρησιμοποιηθούν επίσης με ανοιχτά εργαλεία που χρησιμοποιούνται συνήθως.

Οργάνωση των δεδομένων σας

  • Ταξινόμηση και οργάνωση των δεδομένων σας. Για παράδειγμα, μην αναμειγνύετε διαφορετικούς τύπους πληροφοριών στις στήλες του excel: είναι συνήθως πιο εύκολο να συνδυαστούν σύνολα δεδομένων παρά να ταξινομηθούν αργότερα τα κακώς δομημένα δεδομένα.

  • Αποφασίστε για μορφές, μονάδες, κωδικούς κ.λπ. και να είστε συνεπείς.

  • Χρησιμοποιήστε κοινές μορφές αρχείων, κατά προτίμηση ανοιχτές.

  • Γράψτε ένα βιβλίο κωδικών, ένα έγγραφο. Τα αρχεία README είναι συχνά απαραίτητα. Η καλή τεκμηρίωση διασφαλίζει την αναπαραγωγιμότητα.

  • Σκεφτείτε την καταληπτότητα. Να είστε προσεκτικοί κατά την αναδιάταξη, τη διαμόρφωση, την ταξινόμηση ή την αντιγραφή-επικόλληση δεδομένων.

  • Να υπάρχουν διαδικασίες για τον έλεγχο της ποιότητας και της πληρότητας των δεδομένων Να είστε σαφείς σχετικά με τα κύρια και άλλα αντίγραφα.

  • Να είστε προσεκτικοί και να προγραμματίζετε καλά τα ευαίσθητα δεδομένα και την ανωνυμοποίηση.

  • Σκεφτείτε την ασφάλεια και τα δικαιώματα πρόσβασης, δώστε πρόσβαση μόνο σε όσους τη χρειάζονται.

  • Σχεδιάστε και συμφωνήστε ποιες εκδόσεις ενός συνόλου δεδομένων θα αρχειοθετηθούν και/ή θα δημοσιευτούν.


Αρχεία και φάκελοι: δόμηση και ονομασία

Είναι σημαντικό να αφιερώσετε λίγο χρόνο για να σχεδιάσετε δομές αρχείων και φακέλων και να ονομάσετε.

  • Δημιουργήστε και συμφωνήστε σε ένα σύστημα ονοματοδοσίας αρχείων και φακέλων και να είστε συνεπείς

  • Προσπαθήστε να οργανώσετε τα αρχεία λογικά χρησιμοποιώντας φακέλους και υποφακέλους αντί να συμπεριλάβετε όλα τα αρχεία σε έναν μόνο φάκελο

  • Αποφύγετε πολύ βαθιές δομές φακέλων, καθώς μπορεί να είναι δύσκολος ο χειρισμός τους

  • Εάν τα δεδομένα σας είναι ευαίσθητα στον χρόνο και οργανώνονται λογικά κατά χρονικές περιόδους, θα μπορούσε να είναι χρήσιμο να οργανώνετε αρχεία κατά φακέλους συγκεκριμένου χρόνου, όπως ΕΕΕΕ-ΜΜ-ΗΗ

  • Χρησιμοποιήστε ουσιαστικά, μοναδικά ονόματα αρχείων και φακέλων

  • Διατηρήστε τα ονόματα αρχείων και φακέλων όσο το δυνατόν πιο σύντομα αλλά σχετικά. 25 χαρακτήρες συνήθως θεωρούνται μέγιστος.

  • Οι ημερομηνίες σε μορφή ΕΕΕΕ-ΜΜ-ΗΗ σάς επιτρέπουν να ταξινομήσετε και να αναζητήσετε τα αρχεία σας

  • Αποφύγετε τη χρήση ειδικών χαρακτήρων όπως % & / \ : ; * . ? < > ^! " () και Σκανδιναβικά γράμματα

  • Υποδείξτε τον αριθμό έκδοσης χρησιμοποιώντας «V» ή «έκδοση» και τρία ψηφία (ή 4 εάν έχετε μεγάλο αριθμό αρχείων), π.χ. 001, 002…….201, 202 (όχι 1, 2, 21).

  • Χρησιμοποιήστε υπογράμμιση (_) αντί για κενά

  • Εάν χρησιμοποιείτε προσωπικό όνομα στο όνομα, δώστε πρώτα το επώνυμο και μετά το όνομα

  • Ωστόσο, να είστε πολύ προσεκτικοί με τα προσωπικά δεδομένα κατά την ονομασία αρχείων και φακέλων

7

Τεκμηρίωση 

Μεταδεδομένα 

Τα μεταδεδομένα είναι πληροφορίες σχετικά με τα δεδομένα, για παράδειγμα, πού, πότε, γιατί και πώς συλλέχθηκαν, υποβλήθηκαν σε επεξεργασία και ερμηνεύτηκαν τα δεδομένα. Τα μεταδεδομένα μπορεί επίσης να περιέχουν λεπτομέρειες σχετικά με πειράματα, αναλυτικές μεθόδους και ερευνητικό πλαίσιο.

Τα μεταδεδομένα είναι ένας γενικός όρος που μπορεί να σημαίνει τόσο τα μεταδεδομένα ανακάλυψης, τα οποία είναι πάντα ανοιχτές πληροφορίες, όσο και τα έγγραφα τεκμηρίωσης δεδομένων. Η τεκμηρίωση, τα μεταδεδομένα και ο τρόπος ερμηνείας των δεδομένων μπορεί να είναι ανοιχτές ή περιορισμένες πληροφορίες (βλ, εικόνα παρακάτω). 

Μπορείτε να διαβάσετε περισσότερα σχετικά με τα μεταδεδομένα ανακάλυψης στην ενότητα Δημοσίευση. 

Εικόνα. Μεταδεδομένα ανακάλυψης (CC BY4.0) 

Τεκμηρίωση δεδομένων σημαίνει δημιουργία πληροφοριών, οι οποίες επιτρέπουν τις ερμηνείες των δεδομένων σωστά και ανεξάρτητα. Είναι σημαντικό να σχεδιάστε πώς να τεκμηριώσετε τα δεδομένα και ακολουθήστε αυτό το σχέδιο σε όλο το έργο. Είναι συνετό να τεκμηριώνεται πώς έχουν τροποποιηθεί τα δεδομένα σε διάφορα στάδια του έργου - το να πρέπει να επιστρέψετε και να συμπληρώσετε τα κενά στην τεκμηρίωση στη συνέχεια είναι επίπονο και περίπλοκο, και κυρίως δεν είναι δυνατό! 

Η επαρκής τεκμηρίωση των δεδομένων, των αλλαγών που έγιναν, των πόρων, των μεθόδων, των συντμήσεων, των κωδικών και των διαδικασιών που χρησιμοποιούνται στις αναλύσεις είναι ουσιαστικής σημασίας τόσο για την αναπαραγωγιμότητα όσο και για την αξιολόγηση της ποιότητας της έρευνας. 

Η προέλευση (καταγραφή της προέλευσης και οι αλλαγές που έγιναν στα δεδομένα) θα πρέπει να είναι διαφανής. Η αναπαραγωγιμότητα είναι ένα σημαντικό μέρος της παροχής αποδεικτικών στοιχείων για την ορθότητα των ερευνητικών αποτελεσμάτων. Άλλοι ερευνητές θα πρέπει να είναι σε θέση να επιθεωρούν τη ροή εργασίας και να αξιολογούν όλα τα βήματα που έχουν γίνει κατά τη διάρκεια της ανάλυσης και να τα επαναλαμβάνουν.

Η τεκμηρίωση δεδομένων περιλαμβάνει μια ποικιλία εγγράφων, τα οποία περιγράφουν όλα τα δεδομένα που χρησιμοποιούνται σε ένα έργο, όπως ποια είναι τα δεδομένα του έργου, πώς έχουν συλλεχθεί, τι σημαίνουν οι συντμήσεις και πώς έχουν τροποποιηθεί τα δεδομένα. 

Η τεκμηρίωση δεδομένων μπορεί να γίνει για παράδειγμα χρησιμοποιώντας τους ακόλουθους τρόπους:

  • Πρότυπα (μετα)δεδομένων είναι ειδικές μορφές πειθαρχίας που χρησιμοποιούνται ευρέως.

  • Τα ηλεκτρονικά τετράδια εργαστηρίου δημιουργούν μεταδεδομένα για το έργο, διατηρώντας παράλληλα τις σημειώσεις ενημερωμένες. 

  • Λεξικά δεδομένων να εξηγήσει τις μεταβλητές που χρησιμοποιούνται σε ένα σύνολο δεδομένων.

  • Τα Databooks είναι συλλογές κωδίκων και αλγορίθμων που χρησιμοποιούνται σε ένα έργο.

  • Τα λεξιλόγια είναι ένα τυποποιημένο σύνολο όρων και παρέχουν έναν συνεπή τρόπο περιγραφής δεδομένων.

Τα αρχεία Readme είναι έγγραφα κειμένου που παρέχετε πληροφορίες σχετικά με τα αρχεία δεδομένων για να διασφαλίσετε ότι ερμηνεύονται σωστά.