الارتباط بين المتغيرات الفئوية
لقد عملت مع الكثير من علماء البيانات ورأيت أن الناس يتجاهلون عمومًا التحقق من الارتباط بين المتغيرات الفئوية
#تحليل_البيانات
لقد عملت مع الكثير من علماء البيانات ورأيت أن الناس يتجاهلون عمومًا التحقق من الارتباط بين المتغيرات الفئوية
#تحليل_البيانات
الارتباط
الارتباط يحكي العلاقة بين متغيرين مستقلين .
عند اجراء الانحدار الخطي يتم فحص العلاقة بين المتغيرات المستقلة لتجنب العلاقة الخطية المتعددة .
الارتباط يحكي العلاقة بين متغيرين مستقلين .
عند اجراء الانحدار الخطي يتم فحص العلاقة بين المتغيرات المستقلة لتجنب العلاقة الخطية المتعددة .
أثناء التحقق من الارتباط بين المتغيرات الفئوية ، من الممكن فقط معرفة ما إذا كانت المتغيرات لها أي ارتباط . لا يمكن تقدير درجة الارتباط
أهمية الارتباط بين المتغيرات الفئوية
تجنب العلاقات الخطية المتعددة. يعتبر وجود متغيرين أو أكثر من المتغيرات المستقلة عالية الترابط في نموذج انحدار خاطئ . يشرحون نفس الاختلاف ويؤثرون بعضهم البعض. لن تعرف أبدًا مقدار التباين الفردي في التباين العام
تجنب العلاقات الخطية المتعددة. يعتبر وجود متغيرين أو أكثر من المتغيرات المستقلة عالية الترابط في نموذج انحدار خاطئ . يشرحون نفس الاختلاف ويؤثرون بعضهم البعض. لن تعرف أبدًا مقدار التباين الفردي في التباين العام
عدم معالجة القيمة
ضع في اعتبارك متغيرين فئويين (IDVs): X1 و X2
y ويحاولان التنبؤ بـ
. X1 و X2 مرتبطان ارتباطًا وثيقًا ولذا يتعين علينا اختيار أحدهما
في حال وجود قيم مفقودة يتم تعبئة من خلال المتغير الاخر المرتبط بها
ضع في اعتبارك متغيرين فئويين (IDVs): X1 و X2
y ويحاولان التنبؤ بـ
. X1 و X2 مرتبطان ارتباطًا وثيقًا ولذا يتعين علينا اختيار أحدهما
في حال وجود قيم مفقودة يتم تعبئة من خلال المتغير الاخر المرتبط بها
فهم العلاقة بين المتغيرات الفئوية كثيرًا ، يمكن أن تفعل المعجزات للأعمال التجارية.يعتقد العديد من محترفي التحليلات أن التحليلات تدور حول النماذج ألتنبؤيه.
يعد تحليل الاتجاهات والعلاقات المخفية بين الابعاد امرا مهما يساعد ع اتخاذ القرارات وتحسين جودة البيانات .
اختبار كاي سكوير
ضع في اعتبارك مجموعة بيانات تحتوي على 1000 سجل ولها متغيرات - الديانة ونوع الطعام. نود اختبار ما إذا كانت هناك أي علاقة بين الديانة ونوع الطعام.
الديانة : مسلم / غير مسلم
نوع الطعام : نباتي / غير نباتي
ضع في اعتبارك مجموعة بيانات تحتوي على 1000 سجل ولها متغيرات - الديانة ونوع الطعام. نود اختبار ما إذا كانت هناك أي علاقة بين الديانة ونوع الطعام.
الديانة : مسلم / غير مسلم
نوع الطعام : نباتي / غير نباتي
نبدأ بوضع الفرضية
صفرية - لا توجد علاقة بين الديانة ونوع الطعام
بديلة - توجد علاقة بين اليانة ونوع الطعام
صفرية - لا توجد علاقة بين الديانة ونوع الطعام
بديلة - توجد علاقة بين اليانة ونوع الطعام
قيمة إحصاء مربع تشي هي 6.718.
p -value في نفس الصف في عمود "Asymptotic Significance (2-sided)"
(.010) . تكون النتيجة مهمة إذا كانت هذه القيمة أقل من (عادةً .05).
.لذلك نرفض الفرضية الصفرية التي تؤكد أن المتغيرين مستقلين عن بعضهما
p -value في نفس الصف في عمود "Asymptotic Significance (2-sided)"
(.010) . تكون النتيجة مهمة إذا كانت هذه القيمة أقل من (عادةً .05).
.لذلك نرفض الفرضية الصفرية التي تؤكد أن المتغيرين مستقلين عن بعضهما
جاري تحميل الاقتراحات...