Δημοσίευση δεδομένων
Δημοσίευση δεδομένων
Η δημοσίευση δεδομένων (ή το άνοιγμα, χρησιμοποιούνται και οι δύο όροι) είναι σημαντικό μέρος μιας καλής επιστημονικής διαδικασίας, ωφελεί εσάς και ολόκληρη την κοινότητα, καθώς και τον ακρογωνιαίο λίθο της αναπαραγώγιμης και αναπαραγώγιμης έρευνας.
Σήμερα το απαιτούν και οι χρηματοδότες. Όταν εξετάζετε εάν πρέπει να κάνετε τα δεδομένα σας διαθέσιμα για επαναχρησιμοποίηση, ο εμπειρικός κανόνας είναι να κάνετε τα δεδομένα "όσο το δυνατόν πιο ανοιχτά, όσο κλειστά χρειάζεται". Η δημοσίευση δεδομένων δεν σημαίνει αυτόματα ότι είναι εντελώς ανοιχτά και δωρεάν για λήψη από οποιονδήποτε. Μπορείτε να επιλέξετε πόσο ανοιχτά είναι διαθέσιμα τα δεδομένα σας και μπορεί να έχουν περιορισμένη πρόσβαση ή να είναι κλειστά.
Η ελάχιστη απαίτηση είναι να δημοσιεύσετε μεταδεδομένα εύρεσης, τα οποία είναι κάπως σαν την ετικέτα του συνόλου δεδομένων σας. Αποτελείται από ένα μόνιμο αναγνωριστικό, άδεια καθώς και βασικές πληροφορίες σχετικά με το τι αφορούν τα δεδομένα, ποιος τα συνέλεξε, πότε και πώς να αποκτήσετε πρόσβαση. Με την κοινή χρήση περιγραφικών πληροφοριών σχετικά με τα δεδομένα με μηχανικό τρόπο, μπορούν να βρεθούν μέσω μηχανών αναζήτησης που βασίζονται στον ιστό. Πάνω απ 'όλα, τα μεταδεδομένα χρειάζονται ένα μόνιμο αναγνωριστικό που να επιτρέπει την αναφορά στα δεδομένα. Τα δημοσιευμένα δεδομένα πρέπει επίσης να έχουν άδεια.
Τι είναι τα data papers και τα data journals;
Ένα data paper είναι ένα έγγραφο με αξιολόγηση από ομοτίμους που περιγράφει ένα σύνολο δεδομένων που δημοσιεύεται σε περιοδικό με κριτές. Τα έγγραφα δεδομένων παρέχουν αναγνώριση για την προσπάθεια προετοιμασίας, επιμέλειας και περιγραφής δεδομένων μέσω ενός επιστημονικού άρθρου.
Τα Data Journals αποτελούνται από data papers που περιγράφουν πώς, γιατί και πότε συλλέχτηκε ένα σύνολο δεδομένων και οποιοδήποτε παράγωγο προϊόν δεδομένων παρήχθη. Τα data journals παρέχουν ισχυρά κίνητρα στους δημιουργούς δεδομένων να επαληθεύουν, να τεκμηριώνουν και να διαδίδουν τα δεδομένα τους. Φέρνουν επίσης την πρόσβαση σε δεδομένα και την τεκμηρίωση στο κύριο ρεύμα της επιστημονικής επικοινωνίας, επιβραβεύοντας τους δημιουργούς δεδομένων μέσω των υπαρχόντων μηχανισμών δημοσίευσης με αξιολόγηση από ομοτίμους και παρακολούθησης αναφορών.
Μόνιμα αναγνωριστικά (PID)
Ένα PID είναι ένα παγκοσμίως μοναδικό, τεκμηριωμένο και μόνιμο αναγνωριστικό που παρέχει έναν άμεσο σύνδεσμο προς έναν διαδικτυακό πόρο. Τα PID πρέπει να είναι μηχανικά ενεργά και, για παράδειγμα, να επιλύονται σε μια ιστοσελίδα που (επανα)παρουσιάζει το περιεχόμενο. Η εκχώρηση ενός PID είναι ένα χρήσιμο κριτήριο ποιότητας για τις διαδικτυακές δημοσιεύσεις. Στην περίπτωση έκδοσης διπλού βιβλίου (ανοικτή πρόσβαση και εκτύπωση), οι περισσότεροι εκδότες εκχωρούν ένα ISBN για κάθε έκδοση.
Για αμιγώς ψηφιακές εκδόσεις, τα DOIs (Digital Object Identifiers) είναι κατάλληλα αναγνωριστικά. Συχνά εκχωρείται ένα DOI ανά δημοσίευση. Η πρόσθετη κατανομή των DOI για μεμονωμένα κεφάλαια, σχήματα και πίνακες θεωρείται μερικές φορές επιθυμητή. Τα DOI χρησιμοποιούνται επίσης για τη δημοσίευση δεδομένων. Εκτός από τα PID για αντικείμενα, υπάρχουν και PID για πρόσωπα, ιδρύματα κ.λπ. Για παράδειγμα, το ORCID iD είναι πρότυπο για τη μοναδική ταυτοποίηση των επιστημόνων και τα ROR είναι οι ταυτότητες του Μητρώου Οργανισμών Ερευνών χρησιμοποιούνται για την αναγνώριση ιδρυμάτων.
Δείτε το βίντεο:
What are Persistent Identifiers and why to use them?
Μεταδεδομένα Ανακάλυψης (πλαίσιο πληροφοριών),
Τα μεταδεδομένα Ανακάλυψης είναι ένα σύνολο τυποποιημένων και δομημένων περιγραφικών, διοικητικών και δομικών στοιχείων. Αυτά τα στοιχεία εξηγούν την προέλευση, τον σκοπό, τη χρονική αναφορά, τη γεωγραφική θέση, τον συγγραφέα και τους όρους χρήσης των δεδομένων. Τα μεταδεδομένα ανακάλυψης περιλαμβάνουν ένα μόνιμο αναγνωριστικό και μια άδεια. Τα μεταδεδομένα ανακάλυψης μπορούν επίσης να ονομαστούν δημόσια μεταδεδομένα.
Είναι σημαντικό τόσο τα μεταδεδομένα όσο και τα πραγματικά δεδομένα να συμμορφώνονται με τις αρχές FAIR, ώστε τα δεδομένα να είναι ευρέσιμα, προσβάσιμα, διαλειτουργικά και ανεξάρτητα επαναχρησιμοποιήσιμα. Αυτό είναι ευκολότερο να γίνει όταν χρησιμοποιείτε μια αξιόπιστη υπηρεσία δημοσίευσης δεδομένων, δηλαδή ένα αποθετήριο δεδομένων, το οποίο παράγει μεταδεδομένα με δυνατότητα μηχανικής ανάγνωσης από τα δεδομένα. Τα αποθετήρια δεδομένων παρέχουν επίσης στα δεδομένα ένα μόνιμο αναγνωριστικό και μια άδεια χρήσης με δυνατότητα ανάγνωσης..
Οφέλη από τη δημοσίευση δεδομένων:
ορατότητα για την έρευνα: ευκαιρίες για συνεργασία, αξία, ευκαιρίες χρηματοδότησης
Δυνατότητα ανακάλυψης δεδομένων από μηχανή αναζήτησης (PIDs), παραπομπές, καταγραφή λήψεων δεδομένων
Αποτελεσματική χρήση των ερευνητικών πόρων
Συμμόρφωση με τις απαιτήσεις των χρηματοδοτών και των εκδοτών
Διαφάνεια δεδομένων: αναπαραγώγιμα αποτελέσματα και νέα ανάλυση που πρέπει να διεξαχθεί
Πρόσβαση και χρήση των δεδομένων του έργου ακόμη και μετά το έργο
Εικόνα. Συμβουλές για τη δημοσίευση ερευνητικών δεδομένων (CC BY4.0)
Αποθετήρια δεδομένων
Ένας καλός γενικός κανόνας είναι να χρησιμοποιείτε πάντα πειθαρχικούς ή ειδικούς χώρους αποθήκευσης δεδομένων. Αυτά ακολουθούν τα κοινοτικά πρότυπα σχετικά με τα δεδομένα και, ως εκ τούτου, καθοδηγούν τον χρήστη να δημοσιεύσει δεδομένα σε μορφή που να συνάδει με άλλα παρόμοια δεδομένα. Αυτό επιτρέπει τη διαλειτουργικότητα δεδομένων και το συνδυασμό συνόλων δεδομένων που συλλέγονται από διάφορες πηγές. Μπορείτε να αναζητήσετε αποθετήρια στο re3data.org, το οποίο είναι ένα παγκόσμιο μητρώο αποθετηρίων ερευνητικών δεδομένων.
Μόνο εάν δεν μπορείτε να βρείτε ένα αποθετήριο για τις ανάγκες σας, χρησιμοποιήστε είτε το αποθετήριο του ιδρύματός σας (εάν υπάρχει) είτε ένα γενικό αποθετήριο όπως Zenodo.
Τα αποθετήρια δεδομένων θα πρέπει να παρέχουν μόνιμα αναγνωριστικά για τα μεταφορτωμένα σύνολα δεδομένων, καθώς και επαρκή μεταδεδομένα και σαφείς πληροφορίες άδειας χρήσης. Οι άδειες επιτρέπουν στον χρήστη να προσδιορίσει τα δικαιώματα χρήστη για τα δεδομένα. Οι άδειες Creative Commons χρησιμοποιούνται ευρέως. Η άδεια CC BY 4.0, για παράδειγμα, επιτρέπει τη χρήση των δεδομένων, αλλά απαιτεί να αναφέρεται ο συγγραφέας, ενώ η άδεια CC0 παρέχει πλήρη δικαιώματα σε άλλους για τη χρήση των δεδομένων.
Πώς να επιλέξετε ποια δεδομένα θα δημοσιεύσετε, θα διατηρήσετε και θα διαγράψετε?
Όταν επιλέγετε τι να αρχειοθετήσετε και/ή να δημοσιεύσετε, είναι καλό να αλλάζετε απόψεις και να εξετάζετε τι δεδομένα βλέπου οι χρήστες. Πόσο πίσω μπορεί ο αναγνώστης μιας διατριβής ή ενός επιστημονικού άρθρου να μπορεί να παρακολουθήσει τη διαδικασία προς τα ακατέργαστα δεδομένα, χωρίς να είναι πλέον δυνατή η αναπαραγωγή της αρχικής διαδικασίας; Σε πολλές περιπτώσεις δεν είναι δυνατή η επιστροφή στα πρωτογενή δεδομένα, αλλά εάν η τεκμηρίωση δεδομένων, η αυτοματοποίηση, η αποθήκευση των αρχείων καταγραφής και ο κώδικας και η διαχείριση της έκδοσής τους εφαρμόζονται από την αρχή, είναι δυνατό να εξασφαλιστεί όσο το δυνατόν μεγαλύτερη διαφάνεια. Εάν είναι δυνατό (αυτό είναι ιδιαίτερα ειδικό για την πειθαρχία), ίσως είναι καλό να δημοσιεύονται τόσο τα ακατέργαστα δεδομένα όσο και τα επεξεργασμένα δεδομένα με την τεκμηρίωση.
Διαγραφή δεδομένων
Αν και μπορεί να είναι δελεαστικό να καταθέσετε όλα τα δεδομένα σας μόνο σε περίπτωση που αποδειχθούν χρήσιμα στο μέλλον, αυτό δεν είναι πάντα δυνατό, καθώς η αρχειοθέτηση όλων θα μπορούσε να αποδειχθεί δαπανηρή και χρονοβόρα και σε ορισμένες περιπτώσεις ανήθικη. Τα αρχεία που δεν δημοσιεύονται, αρχειοθετούνται ή διατηρούνται θα πρέπει να διαγράφονται όταν έχουν εκπληρώσει τον σκοπό τους.
Δείτε το βίντεο: Manage your research data - towards publishing data