Diagram Sebar

Plot titik data individual pada dua sumbu untuk mengungkap korelasi, kluster, dan outlier.

Apa itu diagram sebar?

Diagram sebar (juga disebut grafik XY) menempatkan titik data individual pada kisi dua dimensi di mana setiap sumbu mewakili variabel yang berbeda. Setiap titik menunjukkan persimpangan dua pengukuran untuk satu observasi. Pola yang dihasilkan mengungkapkan apakah kedua variabel terkait.

Diagram sebar adalah alat utama untuk mengeksplorasi hubungan antar variabel. Kelompok diagonal yang rapat menunjukkan korelasi kuat. Sebaran acak tidak menunjukkan korelasi. Outlier menonjol secara visual dan pengelompokan alami sering muncul tanpa analisis statistik.

Kapan menggunakan diagram sebar

  • Mengeksplorasi korelasi antara dua variabel kontinu
  • Mengidentifikasi outlier dalam kumpulan data
  • Menemukan kluster atau pengelompokan alami
  • Menampilkan distribusi titik data di dua dimensi
  • Membandingkan kelompok dengan memplot setiap dengan warna berbeda

Praktik terbaik

  • Gunakan kedua sumbu untuk variabel kontinu (numerik), bukan kategori
  • Tambahkan label sumbu yang menyertakan satuan
  • Gunakan titik semi-transparan saat banyak titik tumpang tindih
  • Kode warna kelompok untuk membandingkan subpopulasi
  • Pertimbangkan menambahkan garis tren jika hubungannya bermakna
  • Pertahankan ukuran titik yang konsisten kecuali mengkodekan variabel ketiga

Contoh

Jam belajar vs. nilai ujian, menunjukkan korelasi positif antara waktu yang diinvestasikan dan hasil.

Buat ini di Claude

Dengan ChartPane terpasang, cukup deskripsikan apa yang Anda inginkan:

Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)

Jenis grafik terkait