Bahasa pemrograman R telah menjadi tulang punggung dalam analisis data, statistika komputasi, dan visualisasi grafis selama beberapa dekade. Fleksibilitasnya, ditambah dengan ekosistem paket yang sangat besar (CRAN), menjadikannya alat yang tak tergantikan bagi ilmuwan data, peneliti, dan analis bisnis. Artikel ini akan menyajikan beberapa contoh program R dasar hingga menengah untuk memberikan gambaran praktis penggunaannya.
Visualisasi sederhana proses analisis data menggunakan R.
1. Dasar-Dasar R: Variabel dan Struktur Data
Sebelum menjalankan program kompleks, penting untuk memahami bagaimana R menangani data. R dikenal dengan struktur datanya yang kuat, seperti vektor, matriks, list, dan yang paling penting, data frame.
A. Membuat Vektor
Vektor adalah struktur data paling dasar di R, dapat menampung tipe data tunggal.
# Membuat vektor numerik
angka <- c(10, 20, 35, 42, 50)
print(angka)
# Membuat vektor karakter
nama_kota <- c("Jakarta", "Bandung", "Surabaya")
print(nama_kota)
# Melakukan operasi sederhana pada vektor
hasil_kali <- angka * 2
print(hasil_kali)
B. Mengenal Data Frame
Data frame mirip dengan tabel dalam database atau spreadsheet, yang memungkinkan penyimpanan kolom dengan tipe data berbeda.
# Membuat Data Frame contoh
data_mahasiswa <- data.frame(
NIM = c("M001", "M002", "M003", "M004"),
Nilai = c(85.5, 92.0, 78.5, 88.0),
Status = c("Lulus", "Lulus", "Remedial", "Lulus")
)
# Menampilkan struktur data frame
str(data_mahasiswa)
# Mengakses kolom tertentu (menggunakan sintaks $)
nilai_rata <- mean(data_mahasiswa$Nilai)
print(paste("Rata-rata Nilai:", round(nilai_rata, 2)))
2. Kontrol Alur Program
Struktur kontrol seperti if-else dan perulangan (for loop) sangat penting untuk mengotomatisasi tugas dan membuat keputusan dalam program.
A. Kondisional (If-Else)
Program ini akan mengkategorikan mahasiswa berdasarkan nilai rata-rata.
# Menggunakan data frame di atas
nilai_ambang_batas <- 80
if (data_mahasiswa$Nilai[2] >= nilai_ambang_batas) {
print(paste(data_mahasiswa$NIM[2], "berhasil mencapai target."))
} else {
print(paste(data_mahasiswa$NIM[2], "perlu peningkatan."))
}
B. Perulangan (For Loop)
Kita bisa menggunakan perulangan untuk memproses setiap elemen dalam vektor atau data frame.
# Menghitung kuadrat dari setiap angka dalam vektor 'angka'
kuadrat_angka <- c()
for (x in angka) {
kuadrat_angka <- c(kuadrat_angka, x^2)
}
print("Kuadrat Angka:")
print(kuadrat_angka)
3. Visualisasi Data dengan Contoh Program R (Package ggplot2)
Kekuatan utama R terletak pada kemampuan visualisasinya. Package ggplot2 adalah standar emas untuk membuat plot yang menarik dan informatif. Jika Anda menjalankan ini di RStudio, pastikan paket sudah terinstal menggunakan install.packages("ggplot2").
# Memuat library yang diperlukan
library(ggplot2)
# Menggunakan data frame 'data_mahasiswa' yang sudah dibuat
grafik_nilai <- ggplot(data_mahasiswa, aes(x = NIM, y = Nilai, fill = Status)) +
geom_bar(stat = "identity", position = "dodge") +
labs(
title = "Distribusi Nilai Mahasiswa",
x = "Nomor Induk Mahasiswa",
y = "Skor Nilai"
) +
theme_minimal()
# Menampilkan grafik
print(grafik_nilai)
Output dari kode ini akan menghasilkan visualisasi batang (bar plot) yang menunjukkan nilai setiap mahasiswa, dengan warna berbeda berdasarkan status kelulusan mereka. Ini menunjukkan bagaimana R mengintegrasikan pemrosesan data dengan representasi visual secara mulus.
4. Penerapan Statistik Sederhana
R sangat kuat untuk analisis statistik. Berikut contoh penggunaan fungsi statistik bawaan.
# Menghitung statistik deskriptif untuk kolom Nilai
summary(data_mahasiswa$Nilai)
# Melakukan uji-t (t-test) sederhana, jika kita punya dua kelompok data.
# Contoh hipotetis: membandingkan dua kelompok nilai
kelompok_a <- c(75, 80, 85, 78)
kelompok_b <- c(90, 92, 88, 91)
# Uji-t dua sampel independen
uji_ttest <- t.test(kelompok_a, kelompok_b)
print("Hasil Uji-t:")
print(uji_ttest)
Fungsi t.test() adalah contoh program R yang menunjukkan betapa mudahnya melakukan inferensi statistik kompleks hanya dengan satu baris kode. Hasilnya mencakup nilai p (p-value) yang krusial untuk pengambilan keputusan statistik.
Secara keseluruhan, contoh program R di atas mencakup spektrum dasar mulai dari manipulasi struktur data fundamental hingga analisis statistik dan visualisasi modern. Pemahaman dasar ini adalah fondasi yang kuat untuk menjelajahi topik R yang lebih mendalam, seperti pemodelan regresi atau machine learning.