Langsung ke konten utama

Visualisasi Data dengan R

 



Suatu data yang sudah diperoleh selanjutnya perlu dilakukan visualisasi data supaya data dapat dijelaskan dengan baik dan diinterpretasikan dengan mudah.  Visualisasi data merupakan bagian yang sangat penting untuk mengkomunikasikan hasil analisa yang telah kita lakukandan dapat membantu kita dalam memutuskan metode analisa yang tepat pada data tersebut. Selain itu, visualisasi data juga mempermudah untuk menarik kesimpulan dengan melihat tren atau pola yang ada. Mengetahui keberadaan pencilan dan berusaha memahaminya juga dimungkinkan dengan adanya visualisasi data. Visualisasi data baik kualitatif ataupun kuantitatif dapat berbentuk bermacam-macam hal. Meskipun secara umum, visualisasi data kuantitatif akan berupa grafik dan visualisasi data kualitatif akan berupa diagram atau peta.

Program R memiliki library visualisasi yang sangat beragam, baik dari fungsi dasar pada R maupun dari fungsi pengembangan lainnya seperti ggplot, ggplot2 dan lattice. Seluruh library visualisasi tersebut memiliki kelebihan dan kekurangannya masing-masing. Melakukan visualisasi data juga perlu diperhatikan dalam pemilihan grafik yang akan digunakan. Berikut ini penjelasan yang sangat bagus dalam memilih grafik yang tepat, oleh Dr. Andrew Abela.



Berikut beberapa contoh visualisasi data yang dapat dilakukan pada program R:

1.      Histogram dan Density plot merupakan cara visualisasi data variabel numerik untuk melihat bentuk distribusi datanya. Dengan menggunakan histogram atau density plot kita dapat melihat apakah distribusi dari suatu data bersifat simetris atau tidak. Hal ini terkait dengan asumsi yang digunakan untuk analisa statistik yang akan digunakan pada data.

2.      Scatterplot adalah salah satu tipe grafik yang menampilkan titik-titik dalam koordinat Cartesian (sumbu X dan Y) untuk menunjukkan hubungan antar dua dataset dan dapat melihat kekuatan hubungan melalui nilai korelasi antar kedua datanya.

3.      Bar chart merupakan salah satu cara untuk memvisualisasikan variabel kategori. Bar chart terdiri atas elemen axis berupa data kategori sedangkan axis lainnya merupakan nilai (rata-rata, frekuensi, dll) dari variabel kategori tersebut.

4.      Pie chart ditampilkan dalam bentuk lingkaran yang terbagi dengan ukuran panjang busur tertentu untuk menunjukkan perbandingan jumlah data. Pie chart ini lebih baik digunakan jika kategori datanya tidak terlalu banyak.

5.      Tabel frekuensi  merupakan bentuk deskripsi umum yang digunakan untuk data kategorik. Nilai data dijabarkan ke dalam suatu kolom yang disebut kolom frekuensi. Angka yang diperlihatkan dari setiap baris di dalam kolom frekuensi memudahkan seseorang untuk mengetahui mana nilai data terkecil ataupun nilai data yang terbesar.

6.      Cross table juga biasa disebut dengan istilah pivot table. Cross table digunakan untuk memperlihatkan hubungan nilai diantara sejumlah variabel.

7.      Box plot merupakan salah satu cara untuk memvisualisasikan distribusi suatu data. Dapat melihat bentuk distribusi data serta membandingkan Ddstribusi antar data yang lain menggunakan box plot.

8.      Strip chart merupakan salah satu metode visualisasi data kategorikal terhadap data numerik. Strip chart juga disebut sebagai scatter plot 1 dimensi atau dot plot. Metode visualisasi ini bagus untuk melihat sebaran nilai data berdasarkan kategori data (grup data) dengan jumlah data relatif kecil sehingga metode ini juga dapat menjadi alternatif visualisasi selain box plot dengan jumlah data yang kecil.

9.      Normal QQ-plot merupakan sebuah plot probabilitas yang berguna untuk melihat secara visual apakah ditribusi suatu data mengikuti distribusi tertentu. Jika distribusi data mengikuti distribusi normal, maka sebaran data akan mengikuti garis referensi distribusi normal.

10.  Dot plot atau plot titik merupakan penayangan grafik dua dimensi dari objek yang menunjukkan karakteristik kuantitatifnya. Satu sumbu datar mencantumkan nilai kuantitatif yang akan diplotkan dan sumbu tegak menunjukkan label yang berhubungan dengan setiap nilai numeriknya. Dot plot membantu memvisualisasikan variabel kategori sehingga dapat lebih mudah memperoleh informasi dari data.

11.  Plot Group Means dapat digunakan untuk memplotkan variabel kategori terhadap nilai rata-rata masing-masing kategorinya. Umumnya plot ini digunakan sebelum dilakukan uji Anova untuk melihat apakah terdapat efek pada faktor tunggal maupun interaksinya.

12.  Line chart dapat dibuat menggunakan fungsi plot(x,y, type= ) dimana x dan y merupakan titik vektor numerim yang saling dihubungkan. Plot tidak dapat langsung dilakukan menggunakan fungsi lines( ). Jika melakukan plot langsung menggunakan fungsi tersebut maka tidak ada plot yang akan dihasilkan karena pada dasarnya fungsi tersebut merupakan fungsi tambahan setelah plot( ).

13.  Untuk membuat scatter plot matriks pada r dapat menggunakan fungsi pairs. Fungsi pairs.panels( ) pada paket psych dapat digunakan untuk membuat matriks scatter plot. Berbeda dengan fungsi pairs( ), pada fungsi pairs.panels( ) plot yang dihasilkan akan meliputi scatter plot, histogram dan density plot variabel kontinyu, serta nilai koefisien Korelasi Pearson. Hal ini menyebabkan grafik yang dihasilkan menggunakan fungsi ini menjadi lebih ringkas. R mempunyai fungsi yang sederhana untuk membuat grafik, diantaranya:

Tabel perintah membuat grafik di R

Plot.Types

R.base.function

Scatter plot

plot()

Scatter plot matrix

pairs()

Box plot

boxplot()

Strip chart

stripchart()

Histogram plot

hist()

Density plot

density()

Bar plot

barplot()

Line plot

plot() dan line()

Pie charts

pie()

Dot charts

dotchart()

Add text to a plot

text()

Untuk lebih memahaminya bisa melihat contoh visualisasi data dengan R pada link  https://rpubs.com/databee/692034. Sekian sharing dari kami, semoga bermanfaat. Jika ada pertanyaan bisa hubungi kami melalui @databee.id. InsyaaAllah selanjutnya akan kami bahas visualisasi data menggunakan ggplot2, stay tune ya 😊.

 

Referensi:

https://www.rachmatwahid.com/2020/01/teknik-visualisasi-data-dalam-statistika.html

https://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html

medium.com/@julivius236/visualisasi-data-30171d2062d

https://environmentallearning.wordpress.com/2019/01/17/visualisasi-data-r-base-graph/

 

 @choir195

Komentar

Postingan populer dari blog ini

Apa Arti Kebarokahan dalam Hidup?

Bismillah.. Sudah hampir 1 tahun berada di Bogor, kota hujan penuh keberkahan. Selayaknya di Jogja yang begitu banyak taman-taman surge (majelis ilmu), di Bogor pun cukup bertebaran taman-taman surge meskipun tidak sebanyak di Jogja. Memang, di Jogja setiap hari ada kajian dari waktu subuh hingga isya’ di berbagai masjid-masjid, kampong dan kampus. Maka tak heran jika ada teman yang mengatakan bahwa ‘Jogja itu surganya kajian’ .   Itulah mungkin salah satu dari kerinduan Jogja.. Salah satu majelis ilmu yang saya ikuti pada hari Sabtu, 21 September 2019 yakni kajian Ngariung Yuk yang ternyata udah batch 6. Kajian ini ternyata juga diadakan dari Bogor Raincake milik pasangan artis Shireen Sungkar dan Teuku Wisnu (a.k.a cinta fitri yang terwujud di dunia nyata). Pada Kajian Ngariung Yuk batch 6 ini mengundang seorang Ustadz ternama yakni Ust Oemar Mita di The Sahira Hotel, Bogor. Meskipun ada kuota tapi acara ini gratis. Hal ini cukup menginspirasi saya bahwa bisnis yang kemud

Rekomendasi Buku dan Kelas Pra-Nikah

BAHAGIA: bukan tentang harta, tapi tentang rasa

          Daerah Istimewa Yogyakarta (DIY) didapuk sebagai provinsi termiskin di Pulau Jawa berdasarkan data Badan Pusat Statistik (BPS) yang menyebutkan sebanyak 11,49% penduduk miskin pada 2022. Artinya, pengeluaran mereka berada di bawah garis kemiskinan Yogyakarta, yakni Rp551.342 per kapita/bulan. Sedangan Indeks Pembangunan Manusaia (IPM) di provinsi DIY tertinggi kedua nasional yakni sebesar 80,64 pada 2022. IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya.Mari melihat satu data lagi yakni indeks kebahagiaan DIY sebesar 71,7 pada 2021, angka lebih besar dari rata-rata nasional yang sebesar 71,49. Indeks Kebahagiaan Indonesia merupakan indeks komposit yang dihitung secara tertimbang menggunakan dimensi (perasaan dan makna hidup) dan indikator dengan skala 0-100. Semakin tinggi nilai indeks menunjukkan tingkat kehidupan penduduk yang semakin bahagia.                       Data kemiskinan,