مخطط الانتشار
ارسم نقاط البيانات على محورين للكشف عن الارتباطات والتجمعات والقيم المتطرفة.
ما هو مخطط الانتشار؟
يضع مخطط الانتشار نقاط البيانات الفردية على شبكة ثنائية الأبعاد حيث يمثل كل محور متغيراً مختلفاً. تُظهر كل نقطة تقاطع قياسَين لملاحظة واحدة. يكشف النمط الناتج عما إذا كان المتغيران مرتبطَين.
مخططات الانتشار هي الأداة الرئيسية لاستكشاف العلاقات بين المتغيرات. المجموعة القطرية الضيقة تشير إلى ارتباط قوي. التوزيع العشوائي لا يشير إلى أي ارتباط. تبرز القيم الشاذة بصرياً وتظهر التجمعات الطبيعية بدون تحليل إحصائي.
متى تستخدم مخطط الانتشار
- استكشاف الارتباط بين متغيرَين مستمرَّين
- تحديد القيم الشاذة في مجموعة بيانات
- اكتشاف التجمعات أو المجموعات الطبيعية
- إظهار توزيع نقاط البيانات عبر بُعدَين
- مقارنة المجموعات برسم كل منها بلون مختلف
أفضل الممارسات
- استخدم كلا المحورَين للمتغيرات المستمرة (الرقمية)، وليس الفئات
- أضف تسميات المحور تتضمن الوحدات
- استخدم نقاطاً شبه شفافة عند تداخل نقاط كثيرة
- رمّز المجموعات بالألوان لمقارنة المجموعات الفرعية
- فكر في إضافة خط اتجاه إذا كانت العلاقة ذات معنى
- حافظ على أحجام النقاط متسقة إلا إذا كنت تُشفّر متغيراً ثالثاً
مثال
ساعات الدراسة مقابل درجات الاختبار.
أنشئ هذا في Claude
مع تثبيت ChartPane، فقط صف ما تريده:
Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)