Enrolment options

Καθαρισμός και Μετασχηματισμός Δεδομένων

📊 Καθαρισμός και Μετασχηματισμός Δεδομένων

Από τα ακατέργαστα δεδομένα στην αξιόπιστη πληροφορία
🕐 6 Ενότητες 📝 60 Ερωτήσεις Quiz 💻 Πρακτικές Ασκήσεις 📜 Πιστοποιητικό

📌 Περιγραφή Μαθήματος

Η ποιότητα των δεδομένων αποτελεί τη βάση κάθε επιτυχημένης ανάλυσης και λήψης αποφάσεων. Το παρόν μάθημα παρέχει ολοκληρωμένη κατάρτιση στον καθαρισμό, μετασχηματισμό και επικύρωση δεδομένων, καλύπτοντας τόσο θεωρητικές έννοιες όσο και πρακτικές εφαρμογές με σύγχρονα εργαλεία.

80%
του χρόνου ενός Data Scientist αφιερώνεται στον καθαρισμό δεδομένων

🎯 Μαθησιακά Αποτελέσματα

Με την ολοκλήρωση του μαθήματος, θα είστε σε θέση να:

  • Αναγνωρίζετε και χειρίζεστε προβλήματα ποιότητας δεδομένων (ελλιπείς τιμές, διπλότυπα, ανωμαλίες)
  • Εφαρμόζετε τεχνικές κανονικοποίησης και τυποποίησης δεδομένων
  • Χρησιμοποιείτε εργαλεία όπως OpenRefine, Excel Power Query και Python pandas
  • Μετατρέπετε δεδομένα μεταξύ διαφορετικών μορφών (CSV, JSON, XML, RDF)
  • Σχεδιάζετε κανόνες επικύρωσης και συστήματα ελέγχου ποιότητας
  • Υλοποιείτε ροές εργασίας καθαρισμού δεδομένων σε πραγματικά σενάρια

📚 Δομή Μαθήματος

1 Εισαγωγή

Βασικές έννοιες, αρχή GIGO, κοινά προβλήματα

2 Τεχνικές Καθαρισμού

Ελλιπή δεδομένα, διπλότυπα, κανονικοποίηση

3 Εργαλεία

OpenRefine, Power Query, Python pandas

4 Μορφές Δεδομένων

CSV, JSON, XML, RDF & μετατροπές

5 Ποιότητα Δεδομένων

6 διαστάσεις, επικύρωση, παρακολούθηση

6 Μελέτες Περίπτωσης

E-commerce, IoT, χρηματοοικονομικά

🛠️ Εργαλεία & Τεχνολογίες

Στο μάθημα θα χρησιμοποιήσουμε:

OpenRefine Excel Power Query Python pandas Great Expectations GREL

⚡ Προαπαιτούμενα

  • Βασική γνώση χειρισμού υπολογιστικών φύλλων (Excel ή παρόμοιο)
  • Κατανόηση βασικών εννοιών βάσεων δεδομένων (προαιρετικό)
  • Εξοικείωση με βασικές έννοιες προγραμματισμού (για τις ενότητες Python)

📋 Αξιολόγηση

  • Quiz ανά ενότητα: 10 ερωτήσεις × 6 ενότητες
  • Βαθμολογία επιτυχίας: 60%
  • Προσπάθειες: Έως 3 ανά quiz
  • Τελική αξιολόγηση: Συνολικό quiz 30 ερωτήσεων

👨‍🏫 Υποστήριξη

Για απορίες σχετικά με το περιεχόμενο του μαθήματος, χρησιμοποιήστε το Φόρουμ Συζητήσεων του μαθήματος. Για τεχνικά ζητήματα, επικοινωνήστε με την ομάδα υποστήριξης.

«Garbage In, Garbage Out» — Η ποιότητα των αποτελεσμάτων εξαρτάται από την ποιότητα των δεδομένων εισόδου.

Self enrolment (Φοιτητής)
Self enrolment (Φοιτητής)