هنحتاج تنظيف البيانات فى ايه؟ - Data Cleaning

ايه معنى Data Cleaning؟

دى عملية بنقوم بيها بتعديل على البيانات عشان نتأكد ان المعلومات اللى فيها دقيقة ومظبوطة.
ساعات تنظيف البيانات أو الـ data cleaning بنحتاجه عشان نمسح بيانات قديمة، أو مش كاملة، أو مكررة.

ايه الهدف من الـ Data Cleaning؟

الهدف هو اننا نزود نسبة الدقة فى البيانات بتاعتنا عشان نسرع عملية تحليل البيانات من غير ما يحصل معانا مشاكل فى الأرقام، وده بيساعدنا اننا نطلع أرقام احصائية ادق وبالتالى ده هيبقى شىء مفيد جداً والأرقام الإحصائية دى هتتاخد فى الاعتبار وتحسن فى اتخاذ القرار وتبقى موثوقة اكتر.

ايه العمليات اللى بتتنفذ فى الـ Data Cleaning؟

زى ما اتشرح لنا فى درس الـ Data Cleaning:
  1. ازاى ننظف ونعيد هيكلة البيانات المفقودة أو الناقصة (غير كاملة)
  2. ازاى نحول الأعمدة لأنواع data types مختلفة
  3. ازاى نتعامل مع القيم المفقودة NULLs
فيه طبعاً عمليات تانية، بس على حسب الـ technology اللى بنستخدمها، لكن أنا بتكلم من ناحية الـ SQL عشان يبقى الموضوع مفهوم للكل.

ليست هناك تعليقات: