Enrolment options

📊 Καθαρισμός και Μετασχηματισμός Δεδομένων

Data Cleaning & Transformation

📖 Περιγραφή Μαθήματος

Το μάθημα "Καθαρισμός και Μετασχηματισμός Δεδομένων" αποτελεί έναν ολοκληρωμένο οδηγό για μία από τις πιο κρίσιμες διαδικασίες στον κύκλο ζωής των δεδομένων. Σύμφωνα με έρευνες, οι επαγγελματίες δεδομένων αφιερώνουν έως και 80% του χρόνου τους στον καθαρισμό δεδομένων, καθιστώντας την κατανόηση αυτών των τεχνικών απαραίτητη για κάθε σύγχρονο επαγγελματία.

Μέσα από 6 ενότητες και πρακτικά παραδείγματα, θα μάθετε να εντοπίζετε και να διορθώνετε προβλήματα ποιότητας δεδομένων, να χρησιμοποιείτε επαγγελματικά εργαλεία, και να εφαρμόζετε βέλτιστες πρακτικές που χρησιμοποιούνται σε πραγματικά επιχειρηματικά περιβάλλοντα.

🎯 Μαθησιακοί Στόχοι

Με την ολοκλήρωση του μαθήματος, οι εκπαιδευόμενοι θα είναι σε θέση να:

  • Κατανοούν τη σημασία του καθαρισμού δεδομένων και τον αντίκτυπό του στην ποιότητα των αναλύσεων
  • Αναγνωρίζουν κοινά προβλήματα δεδομένων (ελλιπή δεδομένα, διπλότυπα, ακραίες τιμές, ασυνέπειες)
  • Εφαρμόζουν κατάλληλες τεχνικές καθαρισμού για κάθε τύπο προβλήματος
  • Χρησιμοποιούν εργαλεία όπως OpenRefine, Excel Power Query και Python pandas
  • Μετατρέπουν δεδομένα μεταξύ διαφορετικών μορφότυπων (CSV, JSON, XML, RDF)
  • Αξιολογούν την ποιότητα δεδομένων χρησιμοποιώντας μετρικές και frameworks
  • Σχεδιάζουν ολοκληρωμένες διαδικασίες διασφάλισης ποιότητας δεδομένων

📚 Περιεχόμενα Μαθήματος

Ενότητα 1 Εισαγωγή στον Καθαρισμό Δεδομένων
Ενότητα 2 Τεχνικές Καθαρισμού και Μετασχηματισμού
Ενότητα 3 Εργαλεία Καθαρισμού Δεδομένων
Ενότητα 4 Μετατροπή Μορφότυπων Δεδομένων
Ενότητα 5 Επαλήθευση και Διασφάλιση Ποιότητας
Ενότητα 6 Πρακτικές Εφαρμογές (Case Studies)

📝 Αξιολόγηση

  • 3 Ενδιάμεσα Quiz (μετά τις ενότητες 1, 2, 3) - 18 ερωτήσεις συνολικά
  • 1 Τελικό Quiz - 20 ερωτήσεις πολλαπλής επιλογής
  • Βαθμός επιτυχίας: 70%

👥 Σε Ποιους Απευθύνεται

  • Data Analysts και Business Analysts
  • Data Scientists και Machine Learning Engineers
  • Επαγγελματίες ΙΤ που διαχειρίζονται δεδομένα
  • Στελέχη επιχειρήσεων που λαμβάνουν αποφάσεις βάσει δεδομένων
  • Φοιτητές πληροφορικής και στατιστικής
  • Οποιονδήποτε θέλει να βελτιώσει την ποιότητα των δεδομένων του

✅ Προαπαιτούμενα

  • Βασική γνώση χειρισμού υπολογιστή
  • Εξοικείωση με spreadsheets (Excel/Google Sheets)
  • Βασική κατανόηση εννοιών δεδομένων (προαιρετικό)
  • Δεν απαιτείται προηγούμενη εμπειρία προγραμματισμού
⏱️

Διάρκεια

6-8 ώρες

Αυτορυθμιζόμενη μάθηση

🏅

Πιστοποίηση

Βεβαίωση Ολοκλήρωσης

Με επιτυχία στο τελικό quiz

💻

Μορφή

Online / SCORM

Διαδραστικό περιεχόμενο

Self enrolment (Φοιτητής)
Self enrolment (Φοιτητής)