Suatu
data yang sudah diperoleh selanjutnya perlu dilakukan visualisasi data supaya
data dapat dijelaskan dengan baik dan diinterpretasikan dengan mudah. Visualisasi data merupakan bagian yang sangat
penting untuk mengkomunikasikan hasil analisa yang telah kita lakukandan dapat
membantu kita dalam memutuskan metode analisa yang tepat pada data tersebut. Selain itu,
visualisasi data juga mempermudah untuk menarik kesimpulan dengan melihat tren
atau pola yang ada. Mengetahui keberadaan pencilan dan berusaha memahaminya
juga dimungkinkan dengan adanya visualisasi data. Visualisasi data baik
kualitatif ataupun kuantitatif dapat berbentuk bermacam-macam hal. Meskipun
secara umum, visualisasi data kuantitatif akan berupa grafik dan visualisasi
data kualitatif akan berupa diagram atau peta.
Program R
memiliki library visualisasi yang sangat beragam, baik dari fungsi dasar pada R
maupun dari fungsi pengembangan lainnya seperti ggplot, ggplot2 dan lattice.
Seluruh library visualisasi tersebut memiliki kelebihan dan kekurangannya
masing-masing. Melakukan visualisasi data juga perlu diperhatikan dalam
pemilihan grafik yang akan digunakan. Berikut ini penjelasan yang sangat bagus
dalam memilih grafik yang tepat, oleh Dr. Andrew Abela.
Berikut beberapa
contoh visualisasi data yang dapat dilakukan pada program R:
1.
Histogram dan Density plot merupakan cara visualisasi data variabel numerik untuk melihat
bentuk distribusi datanya. Dengan menggunakan histogram atau density plot kita dapat
melihat apakah distribusi dari suatu data bersifat simetris atau tidak. Hal ini
terkait dengan asumsi yang digunakan untuk analisa statistik yang akan
digunakan pada data.
2.
Scatterplot adalah salah satu tipe grafik yang menampilkan titik-titik dalam koordinat
Cartesian (sumbu X dan Y) untuk menunjukkan hubungan antar dua dataset dan
dapat melihat kekuatan hubungan melalui nilai korelasi antar kedua datanya.
3.
Bar chart merupakan salah satu cara untuk memvisualisasikan variabel
kategori. Bar chart terdiri atas elemen axis berupa data kategori sedangkan
axis lainnya merupakan nilai (rata-rata, frekuensi, dll) dari variabel kategori
tersebut.
4.
Pie chart ditampilkan dalam bentuk lingkaran yang terbagi dengan ukuran
panjang busur tertentu untuk menunjukkan perbandingan jumlah data. Pie chart
ini lebih baik digunakan jika kategori datanya tidak terlalu banyak.
5.
Tabel frekuensi merupakan bentuk deskripsi
umum yang digunakan untuk data kategorik. Nilai data dijabarkan ke dalam suatu
kolom yang disebut kolom frekuensi. Angka yang diperlihatkan dari setiap baris
di dalam kolom frekuensi memudahkan seseorang untuk mengetahui mana nilai data
terkecil ataupun nilai data yang terbesar.
6.
Cross table juga biasa disebut dengan istilah pivot table. Cross table
digunakan untuk memperlihatkan hubungan nilai diantara sejumlah variabel.
7.
Box plot merupakan salah satu cara untuk memvisualisasikan distribusi suatu
data. Dapat melihat bentuk distribusi data serta membandingkan Ddstribusi antar
data yang lain menggunakan box plot.
8.
Strip chart merupakan salah satu metode visualisasi data kategorikal terhadap
data numerik. Strip chart juga disebut sebagai scatter plot 1 dimensi atau dot
plot. Metode visualisasi ini bagus untuk melihat sebaran nilai data berdasarkan
kategori data (grup data) dengan jumlah data relatif kecil sehingga metode ini
juga dapat menjadi alternatif visualisasi selain box plot dengan jumlah data
yang kecil.
9.
Normal QQ-plot merupakan sebuah plot probabilitas yang berguna untuk melihat
secara visual apakah ditribusi suatu data mengikuti distribusi tertentu. Jika
distribusi data mengikuti distribusi normal, maka sebaran data akan mengikuti
garis referensi distribusi normal.
11.
Plot Group Means dapat digunakan untuk memplotkan variabel kategori terhadap nilai
rata-rata masing-masing kategorinya. Umumnya plot ini digunakan sebelum
dilakukan uji Anova untuk melihat apakah terdapat efek pada faktor tunggal
maupun interaksinya.
12.
Line chart dapat dibuat menggunakan fungsi plot(x,y, type= ) dimana x dan y
merupakan titik vektor numerim yang saling dihubungkan. Plot tidak dapat
langsung dilakukan menggunakan fungsi lines( ). Jika melakukan plot langsung
menggunakan fungsi tersebut maka tidak ada plot yang akan dihasilkan karena
pada dasarnya fungsi tersebut merupakan fungsi tambahan setelah plot( ).
13.
Untuk membuat scatter plot
matriks pada r dapat menggunakan fungsi pairs. Fungsi pairs.panels( ) pada
paket psych dapat digunakan untuk membuat matriks scatter plot. Berbeda dengan
fungsi pairs( ), pada fungsi pairs.panels( ) plot yang dihasilkan akan meliputi
scatter plot, histogram dan density plot variabel kontinyu, serta nilai
koefisien Korelasi Pearson. Hal ini menyebabkan grafik yang dihasilkan
menggunakan fungsi ini menjadi lebih ringkas. R mempunyai fungsi yang sederhana
untuk membuat grafik, diantaranya:
Tabel perintah membuat
grafik di R |
|
Plot.Types |
R.base.function |
Scatter plot |
plot() |
Scatter plot matrix |
pairs() |
Box plot |
boxplot() |
Strip chart |
stripchart() |
Histogram plot |
hist() |
Density plot |
density() |
Bar plot |
barplot() |
Line plot |
plot() dan line() |
Pie charts |
pie() |
Dot charts |
dotchart() |
Add text to a plot |
text() |
Untuk lebih memahaminya bisa melihat contoh visualisasi data dengan
R pada link https://rpubs.com/databee/692034.
Sekian sharing dari kami, semoga bermanfaat. Jika ada pertanyaan bisa hubungi
kami melalui @databee.id. InsyaaAllah selanjutnya akan kami bahas
visualisasi data menggunakan ggplot2, stay tune ya 😊.
Referensi:
https://www.rachmatwahid.com/2020/01/teknik-visualisasi-data-dalam-statistika.html
https://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html
medium.com/@julivius236/visualisasi-data-30171d2062d
https://environmentallearning.wordpress.com/2019/01/17/visualisasi-data-r-base-graph/
Komentar
Posting Komentar