1 Pengantar ggplot2

ggplot2 adalah salah satu paket visualisasi data paling populer di R, yang dirancang untuk mempermudah pembuatan grafik berkualitas tinggi dengan pendekatan yang sistematis dan fleksibel. Dikembangkan oleh Hadley Wickham pada tahun 2005, ggplot2 berbasis pada konsep “Grammar of Graphics” yang memperlakukan grafik sebagai lapisan-lapisan komponen, seperti data, estetika, geometri, dan skala. Pendekatan ini memungkinkan pengguna untuk dengan mudah menyesuaikan dan menggabungkan elemen-elemen visual untuk menghasilkan visualisasi yang informatif dan estetis.

Paket ini mendukung berbagai jenis grafik, termasuk scatter plots, bar charts, line graphs, box plots, dan masih banyak lagi. Salah satu keunggulan ggplot2 adalah kemampuannya untuk menangani data besar dan kompleks, serta menyediakan fungsionalitas bawaan untuk memfasilitasi eksplorasi data secara interaktif. Dengan fitur seperti facetting, pengguna dapat dengan mudah membuat visualisasi multivariat untuk membandingkan data dalam berbagai kategori. Hal ini menjadikan ggplot2 sangat relevan untuk analisis data eksploratif maupun komunikasi data.

Selain fleksibilitas dan kekuatan, ggplot2 juga memiliki dokumentasi yang sangat lengkap serta dukungan dari komunitas yang aktif. Pengguna dapat menemukan banyak sumber daya seperti tutorial, buku panduan, dan forum diskusi untuk mempelajari dan mengoptimalkan penggunaan ggplot2. Dengan kombinasi fitur yang kuat dan kemudahan penggunaan, ggplot2 telah menjadi alat standar dalam visualisasi data di bidang statistik, sains data, dan penelitian.

2 Dasar Dasar ggplot2

ggplot2 adalah salah satu pustaka visualisasi data di R yang dikembangkan oleh Hadley Wickham. Pustaka ini didasarkan pada konsep Grammar of Graphics, sebuah pendekatan sistematis untuk membuat visualisasi data. Dengan menggunakan ggplot2, pengguna dapat membuat grafik yang menarik, informatif, dan mudah dimodifikasi.

2.1 Struktur dasar dari ggplot2 melibatkan tiga komponen utama:

Data: Data yang akan divisualisasikan.
Aesthetic Mappings (aes): Pemetaan variabel data ke elemen visual seperti warna, bentuk, atau sumbu.
Geometries (geom): Jenis grafik yang akan dibuat, seperti garis, titik, atau batang.

2.2 Paket Dataset

Instalasi ggplot2 Jika Anda belum menginstal ggplot2, Anda dapat melakukannya dengan menggunakan perintah berikut: install.packages(“ggplot2”)

Setelah diinstal, Anda perlu memuat paket tersebut ke dalam sesi R Anda:

library(ggplot2)

2.3 Membuat Data Frame

membuat sebuah data frame bernama data yang berisi dua kolom: x dan y. Kolom x diisi dengan 100 angka acak yang dihasilkan dari distribusi normal (mean = 0, standar deviasi = 1) menggunakan fungsi rnorm(100), dan kolom y juga diisi dengan 100 angka acak dari distribusi normal yang sama.

data <-data.frame(x = rnorm(100),y=rnorm(100))

2.4Membuat Judul,Plot,dan Tema

membuat visualisasi data dengan label sumbu x (“Sumbu X”) serta sumbu y (“Sumbu Y”)

ggplot(data, aes(x = x, y = y))+
  
  #membuat plot titik
  geom_point()+
 
   #menambahkan plot judul dan sumbu
  labs(title = "Point Titik", x = "Sumbu X", y = "Sumbu Y") +

  #memilih tema
  theme_classic()

2.5 Faceting

Fitur ini memungkinkan pembuatan subplot berdasarkan kategori dalam data.

data <- data.frame(x = rnorm(100), y = rnorm(100), grup = sample(c("A", "B", "C", "D"), 100, replace = TRUE))
ggplot(data, aes(x = x, y = y, color = grup))+
  geom_point()+
  facet_wrap(~grup)+
  scale_color_manual(values = c("A" = "blue", "B" = "red", "C" = "yellow", "D" = "black"))+
  theme_dark()+
  labs(title = "Plot titik dengan warna berdasarkan Grup",
       x = "Nilai X",
       y = "Nilai Y",
       color = "Grup")

3 Mengelola Data CSV

Sebelum mengelola data dari file CSV, pastikan file tersebut berada di lokasi yang benar dan memiliki format yang sesuai. Anda dapat menentukan direktori kerja menggunakan setwd() jika diperlukan, serta memastikan bahwa paket yang dibutuhkan, seperti dplyr dan readr, telah terinstal dan dimuat. Selanjutnya, periksa struktur data untuk memastikan bahwa data terorganisir dengan baik, serta cek nama dan tipe kolom untuk memastikan konsistensi. Setelah itu, baca data menggunakan fungsi yang sesuai, seperti read_csv(), dan tinjau beberapa baris awal dengan head() untuk memastikan bahwa data telah terbaca dengan benar dan siap untuk diolah.

3.1 Membaca Data CSV

library(readr)
lizard <- read.csv("lizards.csv")
View(lizard)

foto

3.2 Mengelola Data Length dan Weight

library(ggplot2)
ggplot(lizard, aes(x = total_length, y = weight))+
  geom_point()+
  labs(title = "plot titik",x = "total_length", y = "weight")+
  theme_classic()

4

#Jitter
ggplot(lizard, aes(x = total_length, y = weight))+
  geom_jitter()+
  labs(title = "plot titik - title lizard",x = "total_length", y = "coomon_name")

4.1

#Bar
library(ggplot2)
ggplot(lizard, aes(y = common_name))+
  geom_bar()+
  labs(title = "plot titik - title lizard",x = "total_length", y = "coomon_name")

4.2

#Histogram warna
library(ggplot2)
ggplot(lizard, aes(x = weight))+
  geom_histogram(color = "red", fill = "purple" )+
  labs(title = "dinding lizard", x = "weight", y = "count")

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

4.3

#shape
library(ggplot2)
ggplot(lizard, aes(x = total_length, y = weight,color))+
  geom_point(color = "blue", shape = 17, size = 10 )+
  labs(title = "plot titik warna biru",x = "total_length", y = "weight")

4.4

#common_name
library(ggplot2)
ggplot(lizard, aes(x = total_length, y = weight, color = common_name)) +
  geom_point(shape = 17, size = 3) +  # Warna akan ditentukan oleh common_name
  labs(title = "Plot Titik Berdasarkan Common Name", x = "Total Length", y = "Weight") +
  theme_minimal()  # Menggunakan tema minimal untuk tampilan yang lebih bersih

5 Animasi Grafik dengan gganimate

library(gapminder)
library(ggplot2)
library(gganimate)

5.1

data = gapminder
data

5.2

library(gapminder)
library(ggplot2)
gapminder_plot <- ggplot(
  gapminder, 
  aes(x = gdpPercap, y=lifeExp)
  ) +
  geom_point(alpha = 0.6) +
  scale_x_log10() +
  labs(x = "GDP per capita", y = "Life expectancy")
gapminder_plot

5.3

gapminder_plot <- ggplot(
  gapminder, 
  aes(x = gdpPercap, y=lifeExp, size = pop, colour = continent)
  ) +
  geom_point(alpha = 0.6) +
  scale_x_log10() +
  scale_color_viridis_d(option = "viridis") +
  labs(x = "GDP per capita", y = "Life expectancy")
gapminder_plot

5.4

library(gapminder)
library(ggplot2)

gapminder_point <- ggplot(
  gapminder,
  aes(x = gdpPercap, y = lifeExp, color = continent)  # Menambahkan color berdasarkan continent
) +
  geom_point(alpha = 0.6) +  # Memperbaiki alpha
  scale_x_log10() +  # Menggunakan skala logaritmik untuk sumbu x
  labs(
    title = "Plot Titik Berdasarkan GDP per Kapita dan Harapan Hidup",
    x = "GDP per Kapita",
    y = "Harapan Hidup"
  )

# Menampilkan plot
print(gapminder_point)

5.5

gapminder_point <- ggplot(
  gapminder,
  aes(x = gdpPercap, y = lifeExp, size = pop, color = continent)  
) +
  geom_point(alpha = 0.6) + 
  scale_x_log10() + 
  scale_color_viridis_d( option = "D")
  labs(
    title = "Plot Titik Berdasarkan GDP per Kapita dan Harapan Hidup",
    x = "GDP per Kapita",
    y = "Harapan Hidup"
  )

## $x
## [1] "GDP per Kapita"
## 
## $y
## [1] "Harapan Hidup"
## 
## $title
## [1] "Plot Titik Berdasarkan GDP per Kapita dan Harapan Hidup"
## 
## attr(,"class")
## [1] "labels"

animated_gapminder <- gapminder_point +
transition_time(year) + labs(title = "gapminder animated")

animate(animated_gapminder, nframes = 50, renderer = gifski_renderer("animated_gapminder.gif"))

6

library(gganimate)
gapminder_plot + facet_wrap(~continent) +
  transition_time(year) +
  labs(title = "Year: {frame_time}")

7

gapminder_plot + 
  transition_time(year) +
  labs(title = "Year: {frame_time}") +
  shadow_wake(wake_length = 0.1, alpha = FALSE)

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents (A. T. de Carvalho, Lechevallier, and Melo 2012). For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Referensi

A. T. de Carvalho, Francisco de, Yves Lechevallier, and Filipe M. de Melo. 2012. “Partitioning Hard Clustering Algorithms Based on Multiple Dissimilarity Matrices.” Pattern Recognition 45 (1): 447–64. https://doi.org/10.1016/j.patcog.2011.05.016.

Visualisasi Data Menggunakan ggplot2

Wahyu Dwy Permana-Institut Teknologi Statistika dan Bisnis Muhammadiya

2025-01-18