
📊 Καθαρισμός και Μετασχηματισμός Δεδομένων
📌 Περιγραφή Μαθήματος
Η ποιότητα των δεδομένων αποτελεί τη βάση κάθε επιτυχημένης ανάλυσης και λήψης αποφάσεων. Το παρόν μάθημα παρέχει ολοκληρωμένη κατάρτιση στον καθαρισμό, μετασχηματισμό και επικύρωση δεδομένων, καλύπτοντας τόσο θεωρητικές έννοιες όσο και πρακτικές εφαρμογές με σύγχρονα εργαλεία.
🎯 Μαθησιακά Αποτελέσματα
Με την ολοκλήρωση του μαθήματος, θα είστε σε θέση να:
- Αναγνωρίζετε και χειρίζεστε προβλήματα ποιότητας δεδομένων (ελλιπείς τιμές, διπλότυπα, ανωμαλίες)
- Εφαρμόζετε τεχνικές κανονικοποίησης και τυποποίησης δεδομένων
- Χρησιμοποιείτε εργαλεία όπως OpenRefine, Excel Power Query και Python pandas
- Μετατρέπετε δεδομένα μεταξύ διαφορετικών μορφών (CSV, JSON, XML, RDF)
- Σχεδιάζετε κανόνες επικύρωσης και συστήματα ελέγχου ποιότητας
- Υλοποιείτε ροές εργασίας καθαρισμού δεδομένων σε πραγματικά σενάρια
📚 Δομή Μαθήματος
Βασικές έννοιες, αρχή GIGO, κοινά προβλήματα
Ελλιπή δεδομένα, διπλότυπα, κανονικοποίηση
OpenRefine, Power Query, Python pandas
CSV, JSON, XML, RDF & μετατροπές
6 διαστάσεις, επικύρωση, παρακολούθηση
E-commerce, IoT, χρηματοοικονομικά
🛠️ Εργαλεία & Τεχνολογίες
Στο μάθημα θα χρησιμοποιήσουμε:
⚡ Προαπαιτούμενα
- Βασική γνώση χειρισμού υπολογιστικών φύλλων (Excel ή παρόμοιο)
- Κατανόηση βασικών εννοιών βάσεων δεδομένων (προαιρετικό)
- Εξοικείωση με βασικές έννοιες προγραμματισμού (για τις ενότητες Python)
📋 Αξιολόγηση
- Quiz ανά ενότητα: 10 ερωτήσεις × 6 ενότητες
- Βαθμολογία επιτυχίας: 60%
- Προσπάθειες: Έως 3 ανά quiz
- Τελική αξιολόγηση: Συνολικό quiz 30 ερωτήσεων
👨🏫 Υποστήριξη
Για απορίες σχετικά με το περιεχόμενο του μαθήματος, χρησιμοποιήστε το Φόρουμ Συζητήσεων του μαθήματος. Για τεχνικά ζητήματα, επικοινωνήστε με την ομάδα υποστήριξης.
«Garbage In, Garbage Out» — Η ποιότητα των αποτελεσμάτων εξαρτάται από την ποιότητα των δεδομένων εισόδου.