Operator yang terdapat pada kurung berikut ( * ) adalah operator yang digunakan untuk penjumlahan

KOMPAS.com – Bahasa program dibuat agar sebagai perantara komunikasi antara manusa dan komputer. Bahasa pemrograman membuat komputer dapat memahami perintah yang diberikan manusia dan mengeksekusinya.

Dalam bahasa program ada yang disebut sebagai operator. Dilansir GeeksforGeeks, operator adalah dasar dari setiap bahasa pemrograman yang memungkinkan manusia memerintahkan berbagai jenis operasi pada komputer.

Salah satu operator dalam bahasa program adalah operator aritmatika. Berdasarkan situs Study, operator aritmatika dalam pemrograman adalah bagian dari indikator atau sumbol yang menandakan dibutuhnya operasi matematika atau aritmatika tertentu. Misalnya pertambahan, pengurangan, perkalian, dan pembagian.

Operator aritmatika yang digunakan dalam bahasa pemrograman hampir sama dengan yang digunakan dalam kehidupan sehari-hari.

Baca juga: Jenis-Jenis Perangkat Penyimpanan di Sistem Komputer

Jenis-jenis operator aritmatika

Jenis operator artimatika penambahan dalam bahasa pemrograman dituliskan dengan simbol “+”. Penambahan berguna menambahkan satu operan dengan operan lainnya.

Misalnya A = 10 dan B = 5. Jika ingin menambahkan keduanya, tinggal digunakan operator “+” di antara keduanya sebagai berikut:
X = A + B, maka operasi tersebut menghasilkan X = 15

Jenis operator aritmatika pengurangan dalam bahasa pemrograman dituliskan dengan simbol (-). Pengurangan berguna mengurangi suatu operan dengan operan lainnya.

Misalnya X = 21 dan Y = 7. Operasi pengurangan dapat dilakukan dengan menuliskan N = X – Y, maka akan didapatkan hasil N = 14.

Jenis operator aritmatika perkalian dalam bahasa pemrograman dituliskan dengan simbol (*). Pengurangan berguna mengalikan suatu operan dengan operan lainnya.

Dalam bahasa pemrograman perkalian bisa dituliskan dengan cara a = 5 * 2, atau dengan nilai dalam variabel misalnya a = b * c. Misalnya b = 4 dan c = 5, maka a = 20.

Baca juga: Langkah-Langkah Sebelum Menginstal Komputer

Jenis operator aritmatika pembagian dalam bahasa pemrograman dituliskan dengan simbol (/). Pengurangan berguna membagi suatu operan dengan operan lainnya.

Layaknya pertambahan, pengurangan, dan perkalian, pembagian juga dapat dituliskan langsung. Misalnya x = 14 / 2, maka hasil dari x = 7. Atau ditulis dalam variabel misalnya x = b / a. Dengan b = 14 dan a = 2, maka didapat nilai x = 7.

Simbol mod merupakan salah satu contoh operator yang menghasilkan angka dari sebuah hasil bagi. Mod atau modulus merupakan sisa hasil bagi dalam bahasa pemrogaman yang ditulis dengan simbol (%).

Dilansir dari Khan Academy, operator % mengembalikan sisa angka setelah dibagi, biasanya untuk menemukan angka yang genap dan ganjil.

Misalnya x = 4 % 2, maka x bernilai 0. Hal tersebut karena angka empat habis dibagi dua. Namun jika perintahnya x = 5 % 2, maka x bernilai 1. Hal tersebut karena lima memiliki sisa satu saat dibagi dua.

Sederhananya jika kita memiliki 5 buah koin dan ingin membagikannya kepada kedua anak. Masing-masing anak akan mendapatkan dua koin, dan kita memiliki sisa satu koin. Itulah yang dinamakan dengan modulus atau hasil bagi.

Baca juga: Prinsip dan Cara Kerja Komputer

Perlu diingat dalam operasi aritmatika di komputer sekalipun, urutan perhitungan dan prioritas operasi sangatlah penting. Misalnya perkalian dan pembagian akan dieksekusi terlebih dahulu sebelum pengurangan dan penambahan.

Misalnya jika menuliskan 9 – 2 * 3 = x, nilai x yang akan di dapat adalah 3. Hal tersebut karena angka 2 akan terlebih dahulu dikalikan dengan angka 3 menghasilkan 6. Barulah kemudian angka 9 dikurangi dengan 6 dan menghasilkan 2.

Namun jika menuliskan (9-2)*3= x, maka nilai x yang akan didapat adalah 21. Hal tersebut karena angka 9 akan terlebih dahulu dikurangi 2 dan menghasilkan 7. Barulah angka 7 akan dikalikan dengan 3 menghasilkan nilai 21.

Melihat hasil yang sangat jauh berbeda, maka penggunaan operator aritmatika harus diperhatikan prioritasnya agar meghasilkan nilai sesuai dengan yang diinginkan.

Dapatkan update berita pilihan dan breaking news setiap hari dari Kompas.com. Mari bergabung di Grup Telegram "Kompas.com News Update", caranya klik link //t.me/kompascomupdate, kemudian join. Anda harus install aplikasi Telegram terlebih dulu di ponsel.

Terdapat sejumlah operator operasi yang penting untuk pembaca ketahui, antara lain:

  • Operator aritmatika,
  • Operator perbandingan, dan
  • Operator logika.

Proses perhitungan akan ditangani oleh fungsi khusus. R akan memahami urutannya secara benar. Kecuali kita secara eksplisit menetapkan yang lain. Sebagai contoh tuliskan dan jalankan sintaks berikut pada Console R (tekan enter) maupun R Commander (tekan tombol submit):

## [1] 10

Bandingkan dengan sintaks berikut:

## [1] 12

TIPS!:R dapat digunakan sebagai kalkulator

Berdasarkan kedua hasil tersebut dapat disimpulkan bahwa ketika kita tidak menetapkan urutan perhitungan menggunakan tanda kurung, R akan secara otomatis akan menghitung terlebih dahulu perkalian atau pembangian.

Operator aritmatika yang disediakan R disajikan pada Tabel 2.1:

Tabel 2.1: Operator Aritmatika R.
+ Addition, untuk operasi penjumlahan
- Substraction, untuk operasi pengurangan
* Multiplication, untuk operasi pembagian
/ Division, untuk operasi pembagian
^ Eksponentiation, untuk operasi pemangkatan
%% Modulus, Untuk mencari sisa pembagian
%/% Integer, Untuk mencari bilangan bulat hasil pembagian saja dan tanpa sisa pembagian

Untuk lebih memahaminya berikut contoh sintaks penerapan operator tersebut.

## [1] 8 ## [1] 2 ## [1] 15 ## [1] 1.667 ## [1] 125 ## [1] 2 ## [1] 1

Penggunaan operator aritmatika perlu mempertimbangkan hierarki prioritas operasinya. Pada contoh sebelumnya kita telah belajar bahwa operasi aritmatika akan dikerjakan terlebih dahulu dari yang ada di dalam tanda kurung lalu setelah itu akan diikuti oleh operasi lainnya. Secara lengkap, hierarki prioritas operasi aritmatika dirangkum pada Tabel 2.2:

Tabel 2.2: Hierarki prioritas operasi operator aritmatika.
1 +,- unari (tanda +,-)
2 ^
3 *,/,%%,%/%
4 +,- binari

Berdasarkan Tabel 2.2, pembaca dapat memprediksi output dari operasi berikut:

Operasi tersebut akan menghasilkan nilai 4 dengan urutan pengerjaan sebagai berikut:

  1. Pemberian tanda negatif pada angka 2
  2. Operasi dalam tanda kurung dengan urutan eksponensiasi (3^2) diikuti perkalian (9*2)
  3. Operasi pembagian terhadap nilai dalam kurung dengan angka 3 (18/3)
  4. Operasi penjumlahan (-2+6)

Operator relasi digunakan untuk membandingkan satu objek dengan objek lainnya. Operator yang disediakan R disajikan pada Tabel 2.3.

Tabel 2.3: Operator Relasi R.
== sama dengan bernilai TRUE jika kedua objek bernilai sama
!= tidak sama denga bernilai TRUE jika kedua objek tidak bernilai sama
> lebih besar dari bernilai TRUE jika nilai objek kanan lebih besar dari nilai objek kiri
< lebih kecil dari bernilai TRUE jika nilai objek kanan lebih kecil dari nilai objek kiri
>= lebih besar sama dengan bernilai TRUE jika nilai objek kanan lebih besar atau sama dengan dari nilai objek kiri
<= lebih kecil sama dengan bernilai TRUE jika nilai objek kanan lebih kecil atau sama dengan dari nilai objek kiri

Berikut adalah penerapan operator pada tabel tersebut:

x <- 34 y <- 35 # Operator > x > y

## [1] FALSE ## [1] TRUE ## [1] FALSE ## [1] FALSE ## [1] TRUE ## [1] TRUE

Operator perbandingan memiliki hierarki prioritas yang lebih rendah dibandingkan dengan operator aritmatika. Pembaharuan Tabel 2.2 dilakukan dengan menambahkan operator perbandingan ditampilkan pada Tabel 2.4.

Tabel 2.4: Hierarki prioritas operasi dengan penambahan operator perbandingan.
1 +,- unari (tanda +,-)
2 ^
3 *,/,%%,%/%
4 +,- binari
5 <,<=,>,>=
6 ==,!=

Operator logika hanya berlaku pada vektor dengan tipe logical, numeric, atau complex. Semua angka bernilai 1 akan dianggap bernilai logika TRUE. Operator logika yang disediakan R dapat dilihat pada Tabel 2.5.

Tabel 2.5: Operator logika R.
&& Operator logika AND
|| Operator logika OR
! Opeartor logika NOT
& Operator logika AND element wise
| Operator logika OR element wise

Penerapannya terdapat pada sintaks berikut:

## [1] FALSE

# Operator || print(v||t)

## [1] TRUE ## [1] FALSE FALSE TRUE ## [1] FALSE FALSE FALSE ## [1] TRUE TRUE FALSE

operator & dan | akan mengecek logika tiap elemen pada vektor secara berpesangan (sesuai urutan dari kiri ke kanan). Operator %% dan || hanya mengecek dari kiri ke kanan pada observasi pertama. Misal saat menggunakan && jika observasi pertama TRUE maka observasi pertama pada vektor lainnya akan dicek, namun jika observasi pertama FALSE maka proses akan segera dihentikan dan menghasilkan FALSE.

Page 2

Data pada R dapat dikelompokan berdasarkan beberapa tipe. Tipe data pada R disajikan pada Tabel 2.6.

Tabel 2.6: Tipe data R.
Logical TRUE, FALSE Nilai Boolean
Numeric 12.3, 5, 999 Segala jenis angka
Integer 23L, 97L, 3L Bilangan integer (bilangan bulat)
Complex 2i, 3i, 9i Bilangan kompleks
Character ‘a’, “b”, “123” Karakter dan string
Factor 1, 0, “Merah” Dapat berupa numerik atau string (namun pada proses akan terbaca sebagai angka)
Raw Identik dengan “hello” Segala jenis data yang disimpan sebagai raw bytes

Sintaks berikut adalah contoh dari tipe data pada R. Untuk mengetahui tipa data suatu objek kita dapat menggunakan perintah class()

# Logical apel <- TRUE class(apel)

## [1] "logical"

# Numeric x <- 2.3 class(x)

## [1] "numeric"

# Integer y <- 2L class(y)

## [1] "integer"

# Compleks z <- 5+2i class(z)

## [1] "complex"

# string w <- "saya" class(w)

## [1] "character"

# Raw xy <- charToRaw("hello world") class(xy)

## [1] "raw"

Keenam jenis data tersebut disebut sebagai tipe data atomik. Hal ini disebabkan karena hanya dapat menangani satu tipe data saja. Misalnya hanya numeric atau hanya integer.

Selain menggunakan fungsi class(), kita dapat pula menggunakan fungsi is_numeric(), is.character(), is.logical(), dan sebagainya berdasarkan jenis data apa yang ingin kita cek. Berbeda dengan fungsi class(), ouput yang dihasilkan pada fungsi seperti is_numeric() adalah nilai Boolean sehingga fungsi ini hanya digunakan untuk mengecek apakah jenis data pada objek sama seperti yang kita pikirkan. Sebagai contoh disajikan pada sintaks berikut:

Struktur data diklasifikasikan berdasarkan dimensi data dan tipe data di dalamnya (homogen atau heterogen). Klasifikasi jenis data disajikan pada Tabel 2.7.

Tabel 2.7: Struktur data R.
1d Atomik vektor List
2d Matriks Dataframe
nd Array

Berdasarkan Tabel tersebut dapat kita lihat bahwa objek terbagi atas dua buah struktur data yaitu homogen dan heterogen. Objek dengan struktur data homogen hanya dapat menyimpan satu tipe atau jenis data saja (numerik saja atau factor saja), sedangkan objek dengan struktur data heterogen akan dapat menyimpan berbagai jenis data.

Page 3

Sebelum memulai analisa terhadap data yang kita miliki, umumnya kita akan merapikan data yang akan kita gunakan. Tujuannya adalah agar data yang akan digunakan sudah siap untuk dilakukan analisa dengan software tertentu seperti R atau R Commander, dimana pada dataset perlu jelas antara variabel dan nilai (value), serta untuk mempermudah dalah memperoleh informasi pada data. Sebelum kita melakukan analisa di dataset tersebut, kita harus tahu terlebih dahulu apa saja syarat suatu dataset dikatakan rapi (tidy). Berikut adalah syaratnya:

  • Setiap variabel harus memiliki kolomnya sendiri
  • Setiap observasi harus memiliki barisnya sendiri
  • Setiap nilai berada pada sel tersendiri

Ketiga syarat tersebut saling berhubungan sehingga jika salah satu syarat tersebut tidak terpenuhi, maka dataset belum bisa dikatakan tidy. Ketiga syarat tersebut dapat divisualisasikan melalui Gambar 2.1.

Gambar 2.1: Visualisasi 3 rule tidy data (Sumber: Grolemund dan Wickham, 2017).

Page 4

Input data dapat dilakukan secara langsung pada R Commander. Input data secara langsung umumnya dilakukan jika jumlah data yag kita miliki relatif kecil. Untuk melakukanya jalakan tahapan berikut:

  1. Pada menu, klik Data/New data set.... Klik OK,
  2. Pada jedela yang muncul, ketikkan nama dataset yang kita inginkan. Klik OK
  3. Pada jendela Data Editor:Nama_Dataset, ketikkan data yang kita miliki.
  4. Untuk menambah baris klik tombol Add row, sedangkan untuk menambah kolom klik tombol Add column.
  5. Untuk mengubah nama kolom, klik pada bagian nama kolom dan ketikkan nama kolom yang diinginkan.
  6. Secara default rowname akan dinamai urutan observasi. Namun, kita dapat memberikan nama pada masing-masing kolom dengan cara meng-klik nama baris pada tiap barisnya.
  7. Untuk mengecek dataset yang telah kita buat, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.2.

Gambar 2.2: Visualisasi tahapan input dataset pada R Commander.

Terdapat beberapa hal yang perlu diperhatikan pada proses input data, antara lain:

  • Dalam pemberian rownames. Jika rownames mengandung spasi, input rownames disertai tanda quote (contoh:"Nama Baris"). Jika tidak ingin menggunakan spasi pada rownames, gunakan tanda titik atau koma sebagai pemisah kata (contoh:Nama.Baris atau Nama_Baris).
  • Pastikan rownames bersifat unik (tidak ada duplikasi nama).
  • Pembaca dapat menggunakan tombol pada pada keyboard untuk bernavigasi pada data editor atau gunakan klik kiri pada sel yang ingin dituju.
  • Jenis data pada kolom akan secara otomatis ditentukan oleh seluruh data yang ada pada kolomnya. Jika data berupa angka, program secara otomatis mengkonversinya menjadi data numeric. Jika data berupa campuran angka atau karakter, secara otomatis program mengkonversinya menjadi Character.
  • Pembaca dapat memperluas area sel dengan cara menggeser sisi sel atau dengan cara memperluas melalui menggeser ujung jendela editor.
  • Dataset yang telah dibuat dapat diedit kembali dengan cara klik toolbar Edit data set.

Page 5

Pada Chapter 2.5, pembaca akan mempelajari bagaimana cara melakukan import data dari berbagai sumber seperti plain text, spreadsheets, SPSS, STATA, SAS, dan Minitab. Sebelum melakukan hal tersebut terdapat beberapa hal yang perlu pembaca perhatikan, antara lain:

  • Pastikan data berada dalam format tidy data (lihat Chapter 2.3), dan
  • Pastikan missing value berada pada notasi yang konsisten.

Data yang berasal dari berbagai sumber akan memberikan format notasi missing value yang berbeda-beda, misalnya data yag berasal dari database akan memberikan notasi NULL terhadap missing value, sedangkan data yang berasal dari spreadsheet akan memberikan notasi missing value berdasarkan operasi yang dilakukan pada datanya (contoh: #VALUE! untuk hasil operasi 2 buah objek berbeda tipe datanya). RCommander tidak dapat menangani kondisi di mana pada satu kolom data terdapat lebih dari 1 notasi missing value. Untuk mengatasi hal tersebut, pembaca perlu menyeragamkan notasi missing value pada data (contoh: mengubahnya menjadi notasi NA atau dikosongkan jika data bersumber dari spreadsheet).

Pada Chapter 2.5, pembaca akan diberikan contoh bagaimana melakukan import data yang disajikan pada Tabel 2.8.

Tabel 2.8: Sepuluh Observasi pertama dataset mtcars
21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4

Adapun penjelasan terkait Tabel 2.8 ditampilkan pada Tabel 2.9

Tabel 2.9: Penjelasan variabel dataset mtcars.
mpg Mil/(US) galon
cyl Jumlah silinder
disp Displacement (cu.in)
hp Gross horsepower
drat Rasio gandar belakang
wt Berat (1000 lb)
qsec Watu tempuh 1/4 mil
vs Mesin (0=V-shape, 1=straight)
am Transmisi (0=otomatis, 1=manual)
gear Jumlah gear depan
carb Jumlah karburator

Terdapat 3 buah metode untuk membaca data dari plain text. Metode tersebut dibagi berdasarkan lokasi file plain text tersebut berada.

Membaca file yang berada pada sistem lokal

  1. Pada menu Data, klik Data/Import data/from text file,clipboard,or URL....
  2. Pada jendela yang muncul, isikan spesifikasi file (lihat Tabel 2.10) dan nama objek dataset yang diinginkan. Pada bagian Location of Data File pilih Local file system. Klik OK.
  3. Pada jendela Windows Explorer yang muncul, pilih file yang hendak dibaca. Klik Open.
  4. Untuk melihat dataset yang berhasil dibuat, klik pada toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.3.

Gambar 2.3: Visualisasi tahapan membaca file plain text dari sistem lokal.

Membaca file yang berada pada clipboard

  1. Higlight tabel dataset yang pembaca miliki dan copy dataset tersebut. Dataset tersebut selanjutnya akan tersimpan pada clipboard.
  2. Pada menu Data, klik Data/Import data/from text file,clipboard,or URL....
  3. Pada jendela yang muncul, isikan spesifikasi file (lihat Tabel 2.10) dan nama objek dataset yang diinginkan. Pada bagian Location of Data File pilih clipboard .Klik OK.
  4. Dataset akan secara otomatis dibuat oleh program dengan mengambil data yang tersimpan pada clipboard.
  5. Untuk melihat dataset yang berhasil dibuat, klik pada toolbar View data set.

Membaca file yang berada pada URL

  1. Copy halaman URL lokasi dataset berada.
  2. Pada menu Data, klik Data/Import data/from text file,clipboard,or URL....
  3. Pada jendela yang muncul, isikan spesifikasi file (lihat Tabel 2.10) dan nama objek dataset yang diinginkan. Pada bagian Location of Data File pilih Internet URL. Klik OK.
  4. Pada jendela yang muncul tempelkan (pasting) halaman URL yang telah di copy sebelumnya.
  5. Untuk melihat dataset yang berhasil dibuat, klik pada toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.4.

Gambar 2.4: Visualisasi tahapan membaca file plain text dari internet URL.

Sintaks yang muncul pada R Console saat proses telah dilakukan adalah sebagai berikut:

# sistem lokal Dataset <- read.table("D:/mtcars.txt", header=TRUE, sep="", na.strings="NA", dec=".", strip.white=TRUE) # clipboard Dataset <- read.table("clipboard", header=TRUE, sep="", na.strings="NA", dec=".", strip.white=TRUE) # URL Dataset <- read.table("www.abcde.com/mtcars.txt", header=TRUE, sep="",na.strings="NA", dec=".", strip.white=TRUE)

Tabel 2.10: Penjelasan terkait item pada jendela Read Text Data From File, Clipboard, or URL.
1. Enter name for data set text input Input nama dataset yang diinginkan sebagai output
2. Variable name in file Check box Jika di centang, program membaca baris pertama tabel sebagai nama kolom
3. Missing value indikator text input Karakter yang mengidikasikan missing value dalam file (misal: White space, NA, NaN, dll)
4. Location of Data File radio button Lokasi file yang akan dibaca berada
5. Field Separator radio button Pemisah antar kolom data yang digunakan
6. Decimal-Point Character radio button Karakter yang digunakan sebagai penunjuk decimal-point

Format data lain yang dapat dibaca oleg R Commander adalah xlsx (Excel) ,.dta (STATA), .sav (SPSS), .sas7bdat dan .xport (SAS), serta .mtp (minitab). Cara membaca data dengan format tersebut cukup sederhana dilakukan pada R Commander. Pembaca hanya perlu menuju menu Data/Import data dan memilih sumber data yang ingin dibaca. Pada jendela yang muncul (kecuali format .xport) pembaca diminta untuk melakukan sejumlah konfigurasi seperti apakah rownames terletak pada kolom pertama, apakah perlu mengubah jenis data karakter menjadi faktor, dll. Pada kondisi dimana pembaca diminta untuk mengkonversi karakter menjadi faktor, penulis menyarankan untuk tidak melakukannya saat awal membaca data sebab akan menyulitkan pada saat melakukan analisis data selanjutnya. Konversi karakter menjadi faktor dilakukan pada sejumlah variabel yang memang ingin diubah menjadi faktor (bisa numerik atau karakter). Tampilan jendela konfigurasi awal saat membaca data ditampilkan pada Gambar 2.5.

Gambar 2.5: Tampilan jendela konfigurasi import data berbagai format file.

Contoh sintaks yang akan muncul saat proses tersebut selesai adalah sebagai berikut:

# .xlsx Dataset <- readXL("D:/mtcars.xlsx", rownames=FALSE, header=TRUE, na="", sheet="mtcars", stringsAsFactors=TRUE) # .sav Dataset <- readSPSS("D:/mtcars.sav", rownames=FALSE, stringsAsFactors=TRUE, tolower=FALSE) # .xport Datasets <- read.xport("D:/mtcars.xport") # .sasb7dat Dataset <- readSAS("D:/mtcars.sas7bdat", stringsAsFactors=TRUE, rownames=FALSE) # .dta Dataset <- readStata("D:/mtcars.dta", convert.dates=TRUE, stringsAsFactors=TRUE, rownames=FALSE)

Page 6

Jika pembaca ingin mengakses dataset dari paket yang pembaca inginkan, pembaca dapat menjalankan perintah berikut pada R Console:

Jika paket tersebut belum terpasang, jalankan perintah berikut:

install.packages("nama_paket")

Jika pembaca kesulitan menggunakan cara tersebut, pembaca dapat menggunakan metode yang sama dengan cara memasang paket Rcmdr (lihat Chapter 1.2.4) dan memuat paket Rcmdr (lihat Chapter 1.3).

Untuk mengecek dataset apa saja yang tersedia paket yang telah aktif, lakukan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Data in packages/List data set in packages.
  2. Jendela R data sets yang memberikan daftar seluruh dataset yang tersedia pada paket yang telah dimuat akan muncul.

Pada proses tersebut, R Script akan memunculkan sebuah sintaks berikut:

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.6.

Gambar 2.6: Tampilan langkah menampilkan seluruh dataset dari paket.

Untuk membaca dataset dari paket, jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Data in packages/Read data set from an attached package....
  2. Pada kotak package, double click paket yang pembaca ingin lihat datasetnya. Daftar dataset selanjutnya akan muncul pada kotak Data set.
  3. Pilih dataset yang pembaca ingin baca. Pembaca dapat merubah nama dataset yang akan dibaca melalui kotak Enter nama of data set. Klik OK.
  4. Untuk melihat dataset yang telah dimuat, klik toolbar View data set.

Pada contoh berikut, penulis mencoba memuat dataset mtcars dari paket datasets. Sintaks yang muncul pada R Script dan kotat Output adalah sebagai berikut:

data(mtcars, package="datasets")

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.7.

Gambar 2.7: Tampilan langkah membaca dataset pada paket.

Page 7

Data pada R Commander dapat disimpan ke dalam format .RData. Penyimpanan dalam format tersebut akan mempermudah pembaca untuk memperoleh data tersebut saat akan dibaca kembali dan pembaca tidak perlu mengulangi kembali proses membaca data pada bagian sebelumnya. Untuk dapat menyimpan data menggunakan format .RData yang telah berhasil dibaca pada R Commander, pembaca dapat melakukan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Active data set/Save active data set....
  2. Pada jendela Windows Explorer yang muncul, navigasikan ke lokasi atau folder di mana data tersebut akan disimpan. Beri nama data tersebut sesuai dengan nama yang diinginkan. Klik Save.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.8.

Gambar 2.8: Tampilan tahapan menyimpan data ke dalam format RData.

Pada R Script dan kotak Output akan muncul sintaks berikut yang menandakan bahwa data yang ada pada R Commander telah disimpan pada folder yang telah penulis inginkan.

save("mtcars", file="D:/EnvStat/Rcmdr-book/dataset/mtcars.RData")

Selain menyimpan data ke dalam format .RData, R Commander juga dapat menyimpan data ke dalam format .csv. Untuk melakukannya jalankan langkah berikut:

  1. Pada menu Data, klik Data/Active data set/Export active data set....
  2. Pada jendela yang muncul, spesifikasikan format data yang akan disimpan (lihat Tabel 2.11).
  3. Pada jendela Windows Explorer yang muncul, navigasikan ke lokasi atau folder di mana data tersebut akan disimpan. Beri nama data tersebut sesuai dengan nama yang diinginkan. Klik Save.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.9.

Gambar 2.9: Tampilan tahapan menyimpan data ke dalam format csv.

Pada R Script dan kotak Output akan muncul sintaks berikut yang menandakan bahwa data yang ada pada R Commander telah disimpan pada folder yang telah penulis inginkan.

Tabel 2.11: Penjelasan item jendela Export active data set.
1. Write variable names check box pilihan apakah nama variabel akan disertakan ke dalam file csv
2. Write row names check box pilihan apakah nama baris disertakan ke dalam file csv
3. Quotes around character values check box pilihan apakah tipe data karakter diberi tanda petik
4. Missing values text input simbol atau karakter missing value yang digunakan pada file csv
5. Field Separator radio button pemisah antar kolom data yang digunakan

Data yang telah disimpan ke dalam format .RData dapat langsung dimuat ke dalam R Commander tanpa perlu menspesifikasikan kembali format data yang hendak dibaca. Untuk melakukannya jalankan langkah berikut:

  1. Pada menu Data, klik Data/Load data set....
  2. Pada jendela Windows Explorer yang muncul, navigasikan ke lokasi atau folder di mana data tersebut berada. Pilih data yang akan dimuat. Klik Open.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.10.

Gambar 2.10: Tampilan tahapan memuat data dalam format RData.

Page 8

Menu Data/Manage variables in active data set merupakan menu yang dibuat untuk memodifikasi variabel dan membuat variabel baru pada dataset. Pada Chapter 2.8, penulis akan memjelaskan cara menggunakan submenu Recode variables untuk merubah level pada tipe data factor dan membuat variabel baru dari variabel dengan tipe data numeric, penulis juga akan menjelaskan cara menggunakan submenu Reorder Factor Levels untuk mengubah urutan factor yang semula berdasarkan urutan alfabet menjadi sesuai dengan yang kita inginkan, serta informasi lain terkait penggunaan submenu pada menu Data/Manage variables in active data set.

Terdapat dua kegunaan submenu Recode Variables, yaitu: membuat factor baru dengan cara mentransformasi variabel numeric menjadi factor, serta merubah urutan level suatu factor.

Ketentuan recode pada Recode Variables secara umum memiliki formula *nilai-lama=nilai-baru*, dimana nilai-baru (nilai awal variabel tercatat) dispesifikasi sesuai dengan Tabel 2.12. Berikut adalah sejumlah informasi yang perlu pembaca perhatikan untuk memahami penggunaan submenu Recode Varibles:

  • Jika nilai variabel lama yang tercatat sama sekali ketentuan recode yang kita tetapkan, nilai tersebut hanya dibawa menuju Recode Variables. Sebagai contoh, jika aturan "sangat setuju"="setuju" ditetapkan, tapi nilai lama untuk factor "setuju" tidak dicatat, maka kedua nilai lama (factor lama) tersebut digabung menjadi satu sehingga ("sangat setuju","setuju")="setuju".
  • Jika nilai variabel lama yang dicatat memenuhi lebih dari satu ketetapan recode, maka ketentuan pertama yang berlaku diterapkan. Sebagai contoh, jika terdapat variabel pendapatan dengan ketentuan recode lo:2.500.000="rendah" dan 2.500.000:7.500.000="sedang", maka sebuah observasi dengan variabel pendapatan bernilai 2.500.000 akan dikategorikan sebagai "rendah".
  • Seperti yang telah dijabarkan pada poin sebelumnya, karakter spesial lo digunakan untuk menyatakan nilai variabel numeric terkecil, sedangkan hi digunakan untuk variabel numeric dengan nilai tertinggi.
  • Pada setiap ketentuan recode pastikan diakhiri dengan nilai else yang menunjukkan nilai lain diluar ketentuan recode sebelumnya (termasuk missing value).
Tabel 2.12: Ketentuan recode pada submenu Recode Variables.
1. nilai individual(a) 99=NA; NA="missing"; "sangat setuju="setuju"
2. sebuah set nilai (a,b,...,k) 1,3,5,..,k="ganjil"; "sangat setuju","cukup setuju"="setuju"
3. rentang numerik (a:b) 1901:2000="abad 21"; lo:2.000.000="rendah"; 10.000.000:hi="tinggi"
4. lainnya (else) else="lainnya"

Pada dataset mtcars (lihat Tabel 2.8), misalkan kita ingin menambahkan variabel baru berupa factor yang menyatakan klasifikasi kendaraan berdasarkan tingkat penggunaan bahan bakar per mil (mpg). Untuk kendaraan dengan ketentuan mpg lo:20="boros", 20:30="sedang", dan else="hemat". Berikut adalah langkah-langkah untuk melakukannya:

  1. Pada menu Data, klik Data/Manage variables in active data set/Recode variables...
  2. Pada jendela yang muncul pilih variabel yang ingin dilakukan recoding, tentukan ketentuan recodingnya, dan nama variabel baru yang dihasilkan. Penjelasan terkait jendela tersebut ditampilkan pada Tabel 2.13.
  3. Spesifikasikan apakah tipe data variabel tersebut adalah factor atau bukan dengan mencentang checkbox. Klik OK.
  4. Untuk melihat variabel baru yang telah terbentuk, klik View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.11.

Gambar 2.11: Tampilan tahapan recoding variabel.

Proses tersebut akan memunculkan sintaks pada R Script sebagai berikut:

Tabel 2.13: Penjelasan item jendela Recode Variables.
1. Variables to recode select box daftar nama variabel yang akan di recode
2. New variable name ... text input nama baru untuk variabel yang dibuat
3. Make (each) variable.. check box pilihan apakah variabel baru adalah factor
4. Enter recode directives text input kotak untuk memasukkan ketentuan recode

Pada saat analisis data, variabel yang kita miliki terkadang tidak cukup untuk menjelaskan suatu fenomena. Namun, kita dapat membentuk sebuah variabel baru yang dapat membantu menjelaskan fenomena tersebut. Pembentukan variabel baru dapat berupa tranformasi sebuah variabel atau pembentukan variabel berdasarkan beberapa formulasi beberapa variabel lain.

Dalam melakukan tranformasi variabel, kita dapat memanfaatkan sejumlah operator operasi yang telah penulis jelaskan pada Chapter 2.1.1. Selain operator tersebut, terdapat sejumlah fungsi operasi arimatika yang tersedia pada R. Fungsi-fungsi tersebut, antara lain:

  1. Logaritma dan eksponensial

Untuk contoh fungsi logaritmik dan eksponensial jalankan sintaks berikut:

log2(8) # logaritma basis 2 untuk 8

## [1] 3

log10(8) # logaritma basis 10 untuk 8

## [1] 0.9031 ## [1] 2981

fungsi trigonometri yang ditampilkan seperti sin,cos, tan, dll.

**PENTING!!!: x dalam fungsi trigonometri memiliki satuan radian

Berikut adalah salah satu contoh penggunaannya:

## [1] -1

Fungsi lainnya yang dapat digunakan adalah fungsi absolut, akar kuadrat, dll. Berikut adalah contoh sintaks penggunaan fungsi absolut dan akar kuadrat.

abs(-2) # nilai absolut -2

## [1] 2 ## [1] 2

Untuk memahami permasalahan terkait komputasi variabel baru, kita akan membuat variabel baru pada dataset mtcars yang telah dijelaskan pada Tabel 2.8. Variabel baru yang akan kita buat adalah variabel rasio antara jarak tempuh per satuan bahan bakar (mpg) terhadap berat kendaraan (wt) dan kita namai variabel baru tersebut rwt. Variabel baru ini dapat menjadi alternatif lain dalam menjelaskan efisiensi suatu mobil yang ditandai dengan rasio antara jarak tempuh terhadap bobot dan konsumsi bahan bakarnya. Berikut adalah tahapan untuk melakukannya:

  1. Pada menu Data, klik Data/Manage variables in active data set/Compute new variable.
  2. Pada jendela yang muncul, ketikkan formula pembentuk variabel baru pada kotak Expression to compute.
  3. Untuk memasukkan nama variabel ke dalam formula, pembaca dapat mengetikkan nama variabel secara manual atau melakukan double click nama variabel yang tersedia pada kotak Current variables.
  4. Ketikkan nama variabel baru pada kotak New variable name. Klik OK.
  5. Untuk mengecek variabel yang telah terbentuk, klik View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.12.

Gambar 2.12: Tampilan tahapan komputasi variabel baru.

Berdasarkan tahapan tersebut, sintaks yang terbentuk pada R Script adalah sebagai berikut:

mtcars$rwt <- with(mtcars, mpg/ wt)

Untuk menambahkan variabel nomor observasi pada dataset jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Add observation numbers to data set.
  2. Variabel ObsNumber berupa nomor observasi akan secara otomatis ditambahkan pada akhir kolom dataset.
  3. Untuk mengecek variabel baru tersebut, klik toolbar View data set.

Pada akhir tahapan, sintaks berikut tercetak pada R Script:

dataset$ObsNumber <- 1:"number of observation"

Standardisasi variabel bertujuan untuk mentransformasi variabel sehingga variabel tersebut memiliki nilai rata-rata 0 dan simpangan baku 1. Tahapan melakukan standardisasi variabel pada R Commander adalah sebagai berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Standardize variables....
  2. Pada jendela yang muncul, pilih variabel yang akan di standardisasi. Pembaca dapat memilih lebih dari satu variabel dengan cara menekan tombol ctrl+klik (pada Windows) saat memilih variabel. Klik OK.
  3. Untuk mengecek variabel yang telah distandadrdisasi, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.13.

Gambar 2.13: Tampilan tahapan standardisasi variabel.

Sintaks yang digunakan dalam tahapan tersebut adalah sebagai berikut:

Pada Chapter 2.8.1, kita telah belajar bagaimana cara melakukan recoding variabel dan membentuk factor. Pada Chapter 2.8.5, kita akan membahas cara merubah variabel numeric menjadi factor tanpa perlu melakukan proses recoding. Pada Chapter ini, kita hanya perlu mesuplai variabel numeric yang akan diubah menjadi factor. Kita juga dapat menambahkan label pada factor tersebut. Untuk melakukannya jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Convert numeric varibles to factors.
  2. Spesifikasikan variabel yang akan diubah menjadi factor (lihat Tabel 2.14). Klik OK
  3. Untuk mengecek apakah variabel telah terkonversi menjadi factor, klik Statistics/Summaries/Active data set. Variabel yang telah dikonversi menjadi factor akan memberikan ringkasan data berupa tabel kontingensi (tidak menampilkan mean, min, max, dll).

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.14.

Gambar 2.14: Tampilan tahapan merubah variabel numeric menjadi factor.

Sintaks yang dihasilkan pada proses tersebut adalah sebagai berikut:

Tabel 2.14: Penjelasan item convert numeric variables to factors.
1. Variables select box daftar nama variabel yang akan diubah menjadi factor
2. Factor levels radio button pilihan apakah perlu menambahkan label pada factor atau tidak
3. New variable name or... text input jika tidak diisi maka variabel lama akan diganti variabel baru (tidak ada variabel baru ditambahkan)

Binning variabel numeric merupakan cara untuk mengelompokkan nilai variabel numeric ke dalam suatu kelas berdasarkan rentang tertentu. Penetapan rentang pada proses binning di R Commander terbagi atas 3 metode, yaitu:

  • Equal-width : membagi data ke dalam kelas berdasarkan interval yang seragam.
  • Equal-count : membagi data ke dalam kelas berdasarkan jumlah kelas yang sama.
  • Natural break : membagi data ke dalam kelas berdasarkan jarak terdekat (biasanya menggunakan jarak Euclidian) pada pusat masing-masing kelas. Algoritma pengelompokan yang biasa digunakan adalah algoritma k-means (baca K-Means).

Tahapan untuk melakukan proses binning variabel numeric antara lain:

  1. Pada menu Data, klik Data/Manage variables in active data set/Bin numeric variable....
  2. Pada jendela yang muncul spesifikasikan variabel numeric yang akan di binning dan metode pengelompokan yang digunakan (lihat Tabel 2.15. Klik OK.
  3. Untuk mengecek variabel hasil binning, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.15.

Gambar 2.15: Tampilan tahapan binning variabel numeric.

Sintaks yang digunakan pada masing-masing metode binning, antara lain:

# Equal-width dataset$namavariabel <- with(dataset, binVariable(variabel, bins="jumlah_bin", method='intervals', labels=c("label1",...))) dataset$namavariabel <- with(dataset, binVariable(variabel, bins="jumlah_bin", method='proportions', labels=c("label1",...))) dataset$namavariabel <- with(dataset, binVariable(variabel, bins="jumlah_bin", method='natural', labels=c("label1",...)))

Tabel 2.15: Penjelasan item jendela convert numeric variables to factors.
1. Variables to bin select box daftar nama variabel numeric yang akan dilakukan binning
2. New variable name text input Input nama variabel baru
3. Number of bins slider spesifikasi jumlah bin atau kelas yang digunakan
4. Level Names radio button spesifikasi metode penamaan bin
5. Binning Method radio button spesifikasi metode binning

Secara umum saat kita merubah sebuah variabel character atau string menjadi factor level factor hasil konversi tersebut diurutkan berdasarkan abjad. Sebuah variabel yang terdiri dari nilai “setuju”, “netral”, dan “tidak setuju”, jika diubah menjadi factor akan memiliki urutan level “netral”, “setuju”, dan “tidak setuju”. Urutan tersebut tidak benar dan perlu dirubah. Untuk melakukannya pada R Commander jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Reorder factor levels....
  2. Pada jendela yang muncul spesifikasikan variable factor yang akan dirubah (lihat Tabel 2.16. Klik OK.
  3. Pada jendela yang muncul, rubah urutan factor lama. Klik OK.
  4. Untuk mengecek factor level, jalankan sintaks berikut:

# ubah nama dataset dan variabel levels(dataset$namavariabel)

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.16.

Gambar 2.16: Tampilan tahapan merubah urutan factor level.

Sintaks dari tahapan merubah urutan factor secara umum ditampilkan sebagai berikut:

Tabel 2.16: Penjelasan item jendela reorder factor levels.
1. Factor select box daftar variabel factor pada dataset
2. Name for factor text input nama variabel factor yang baru (jika ingin membuat variabel baru)
3. Make ordered factor check box spesifikasi apakah factor akan diurutkan atau tidak

Saat melakukan subset pada dataset yang akan dijelaskan pada Chapter 2.9 sering kali tidak semua factor level ada pada dataset tersebut (sejumlah factor level memiliki observasi nol) yang berpengaruh pada analisis data yang kita lakukan. Untuk mengatasinya, kita dapat melakukan drop pada factor level tersebut. Untuk melakukannya, jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Drop unused factor levels....
  2. Pada jendela yang muncul spesifikasikan variable factor yang akan didrop factor levelnya. Klik OK.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.17.

Gambar 2.17: Tampilan tahapan drop factor level.

Sintaks untuk melakukan drop factor levels secara umum adalah sebagai berikut:

dataset <- within(dataset, { namavariabel <- droplevels(namavariabel) })

Untuk merubah nama variabel pada R Commander dapat dilakukan dengan dua cara, antara lain:

Cara 1

  1. Klik toolbar Edit data set.
  2. Pada jendela dataset yang muncul , double click nama variabel yang ingin dirubah dan ubah nama variabel tersebut. Klik OK

Cara 2

  1. Pada menu Data, klik Data/Manage variables in active data set/Rename variables....
  2. Pada jendela yang muncul pilih variabel yang ingin dirubah namanya. Klik OK.
  3. Pada jendela yang muncul, isikan nama variabel baru dan Klik OK jika telah selesai.
  4. Untuk mengecek apakah proses telah berhasil, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.18.

Gambar 2.18: Tampilan tahapan merubah nama variabel.

Sintaks untuk merubah nama variabel secara umum adalah sebagai berikut:

names(dataset)[c(nomorvariabel)] <- c("namavariabelbaru")

Untuk menghapus variabel pada dataset, jalankan langkah-langkah berikut:

  1. Pada menu Data, klik Data/Manage variables in active data set/Delete variables from data set....
  2. Pada jendela yang muncul pilih variabel yang ingin dihapus. Klik OK.
  3. Untuk mengecek apakah proses telah berhasil, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.19.

Gambar 2.19: Tampilan tahapan menghapus variabel.

Sintaks untuk menghapus variabel secara umum adalah sebagai berikut:

dataset <- within(dataset, { namavariabel1 <- NULL namavariabel2 <- NULL })

Page 9

Pada Chapter 2.9, kita akan belajar bagaimana memanipuasi dataset. Adapun yang menjadi topik bahasan dalam Chapter 2.9, antara lain:

  • Melakukan subset dataset,
  • Agregasi variabel pada dataset,
  • Melakukan drop observasi pada dataset,
  • Melakukan drop observasi dengan missing value,
  • Mengelompokkan variabel menjadi variabel factor dan nilai,
  • Menggabungkan dua dataset, dan,
  • Modifikasi lainnya.

Pada analisis data, kita sering kali tidak membutuhkan seluruh observasi dari data yang kita miliki. Kita akan melakukan filter untuk memperoleh data sesuai dengan keperluan kita. Selain itu, melihat subset data berdasarkan kriteria tertentu membantu kita untuk melakukan analisis ekspolarif terhadap data yang kita miliki.

Untuk melakukan subset data, kita memelukan sebuah ekpresi atau formula yang dapat mengecek satu persatu data yang memenuhi formula subset yang telah dibentuk. Sebagai contoh, kita ingin memperoleh dataset tanpa nilai missing value pada variabel namavariabel. Berikut adalah contoh sintaks formula atau ekspresi yang digunakan:

Untuk membuat formula atau ekspresi tersebut, kita dapat menggunakan kembali operator operasi yang telah dijelaskan pada Chapter 2.1. Langkah-langkah untuk melakukan subset pada dataset adalah sebagai berikut:

  1. Pada menu Data, klik Data/Active data set/Subset active data set....
  2. Pada jendela yang muncul spesifikasikan variabel yang akan dipilih pada dataset baru dan formula subset yang digunakan (lihat Tabel 2.17). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.20.

Gambar 2.20: Tampilan tahapan melakukan subset pada dataset.

Secara umum sintaks untuk melakukan proses subset adalah sebagai berikut:

contoh_subset <- subset(dataset,subset=formula_subset)

Tabel 2.17: Penjelasan item jendela subset data set.
1. Include all variables check box opsi apakah akan menyertakan seluruh variabel pada hasil subset
2. Variables select box daftar nama variabel yang dapat dipilih untuk ditampilkan pada hasil subset
3. Subset expression text input formula atau ekpresi subset yang digunakan
4. Name for new data set text imput opsi untuk memberikan nama pada dataset baru atau tidak (dataset lama akan dihapus)

Submenu agregate variables in active dataset memberikan ringkasan nilai satu atau beberapa variabel berdasarkan level variabel factor dan menghasilkan dataset baru dengan satu observasi untuk tiap level factor. Proses agregasi mengaplikasikan beberapa fungsi seperti mean(), sum(), atau fungsi lainnya untuk menghasilkan sebuah nilai untuk setiap observasi pada tiap variabel dan level factor.

Fungsi statistika deskriptif bawaan yang dapat digunakan pada R Commander ditampilkan pada Tabel 2.18.

Tabel 2.18: Fungsi statistika deskriptif bawaan pada R.
mean rata-rata
median median
sum jumlah seluruh observasi dalam sebuah variabel
quantile kuantil data
min nilai observasi minimum
max nilai observasi maksimum
IQR rentang antar kuartil
mad simpangan absolut median
sd simpangan baku
var varians

Tahapan agregasi variabel dilakukan melalui langkah-langkah berikut:

  1. Pada menu Data, klik Data/Active data set/Aggregate variables in active data set....
  2. Spesifikan variabel yang akan dilakukan agregasi, factor level yang digunakan, dan fungsi agregat yang digunakan (lihat Tabel 2.19). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.21.

Gambar 2.21: Tampilan tahapan agregasi variabel.

Tabel 2.19: Penjelasan item jendela aggregate observations.
1. Name for aggregated.. text input input nama dataset baru yang dihasilkan
2. Variables to aggregate select box daftar nama variabel yang dapat dipilih untuk diagregasi
3. Aggregated by select box daftar nama variabel factor yang digunakan untuk agregasi
4. Statistic text imput fungsi statistik yang digunakan untuk agregasi

Sintaks untuk melakukan proses agragasi secara umu dituliskan sebagai berikut:

Argumen ... pada sintaks tersebut merupakan argumen tambahan pada fungsi statistik yang digunakan. Secara umum argumen tambahan yang digunakan fungsi yang ditampilkan pada Tabel 2.18 adalah na.rm=TRUE, yaitu: jika data mengandung missing value, maka observasi yang mengandung missing value tersebut akan di drop. Selain argumen tersebut, fungsi quantile memerlukan argumen spesifikasi prob atau spesifikasi kuantil yang akan ditampilkan (misal:prob=0.5 untuk kuantil ke-50 atau median). Untuk menambahkan argumen tersebut, pembaca dapat menspesifikasikannya pada bagian Statistic pada jendela aggregate observations yaitu pada pilihan Other (specify) seperti yang ditunjukkan pada Gambar 2.21.

Kita dapat melakukan drop terhadap sejumlah baris observasi berdasarkan indeks (nomor baris observasinya) atau nama baris observasinya. Seleksi baris yang akan didrop dilakukan menggunakan metode yang ditampilkan pada Tabel 2.12, yaitu: baris individual (contoh: 1), set baris (contoh: 1,2,3..,k), atau rentang baris (contoh: 1:5) untuk seleksi menggunakan indeks. Langkah-langkah untuk melakukan seleksi baris yang akan didrop adalah sebagai berikut:

  1. Pada menu Data, klik Data/Active data set/Remove row(s) from active data set....
  2. Spesifikan index baris yang akan di drop dan nama output dataset baru (lihat Tabel 2.20). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.22.

Gambar 2.22: Tampilan tahapan melakukan drop observasi.

Sintaks yang digunakan untuk melakukan drop baris observasi secara umu adalah sebagai berikut:

datasetbaru <- dataset[-c(indeks),]

Penjelasan item jendela remove rows from active data set.
1. Indices or quoted... text input indeks atau nama baris yang akan di drop atau di hapus
2. Name for new data set text input input nama dataset baru yang dihasilkan

Selain menggunakan submenu subset active data set, drop missing value dapat pula dilakukan dengan menggunakan submenu remove cases with missing data. Perbedaan antara metode pertama dan kedua adalah pada metode kedua drop missing value dilakukan pada seluruh variabel dalam dataset. Tahapan untuk melakukannya adalah sebagai berikut:

  1. Pada menu Data, klik Data/Active data set/Remove cases with missing data....
  2. Spesifikan variabel yang akan dipilih untuk dataset baru dan nama output dataset (lihat Tabel 2.21). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.23.

Gambar 2.23: Tampilan tahapan melakukan drop observasi dengan missing value.

Sintaks untuk melakukan drop missing value pada seluruh variabel dalam dataset secara umum adalah sebagai berikut:

datasetbaru <- na.omit(dataset)

Tabel 2.21: Penjelasan item jendela remove missing data.
1. Include all variables check box pilihan apakah akan menyertakan seluruh variabel pada dataset baru atau tidak
2. Variables select box daftar variabel yang dapat dipilih untuk disertakan dalam dataset baru
3. Name for new data set text input input nama dataset baru

Submenu stack variables in active data set membuat sebuah dataset baru dimana dua atau lebih variabel ditumpuk menjadi variabel satu variabel dengan nilai variabel sebelumnya ditampilkan pada variabel nilai. Jika terdapat \(n\) observasi dalam dataset dan \(k\) variabel, maka dataset baru akan terdiri dari 2 variabel (factor dan numeric) dan \(n\times k\) observasi. Tahapan untuk melakukannya adalah sebagai berikut:

  1. Pada menu Data, klik Data/Active data set/Stack variables in active data set....
  2. Spesifikan variabel yang akan dipilih untuk dataset baru dan nama output dataset (lihat Tabel 2.22). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.24.

Gambar 2.24: Tampilan tahapan mengelompokkan variabel menjadi variabel factor dan nilai.

Terdapat dua buah sintaks dalam melakukan proses pengelompokan data. Sintaks pertama melakukan pengelompokan data, sedangkan sintaks kedua merubah nama kolom dataset baru. Kedua sintaks tersebut adalah sebagai berikut:

Tabel 2.22: Penjelasan item jendela stack variables.
1. Variables select box daftar variabel yang dapat dipilih untuk dikelompokkan
2. Name for staked data.. text input nama dataset baru hasil pengelompokan
3. Name for variable text input nama variabel nilai hasil pengelompokkan
4. Name for factor text input nama variabel factor hasil pengelompokan nama variabel pada dataset sebelumnya

Untuk menggabungkan dua buah dataset, kedua dataset perlu memiliki elemen kunci yang sama. Secara default R Commander mengambil rownames sebagai elemen kunci, sehingga elemen kunci yang dimiliki oleh masing-masing dataframe haruslah konsisten satu sama lain. Penggabungan dataset dapat dilakukan melalui penggabungan kolom dan baris. Penggabungan juga dapat dilakukan melalui elemen unik dari baris maupun kolom. Maksudnya adalah R Commander hanya menggabungkan dataset yang memiliki elemen kunci sama (rownames sama) pada kedua dataset. Jika terdapat observasi pada dataset 1 dan tidak memiliki rownames atau elemen kunci sama pada dataset 2, maka observasi tersebut akan dihapus dari proses penggabungan data. Tahapan penggabungan dua buah dataset adalah sebagai berikut:

  1. Pada menu Data, klik Data/Merge data set....
  2. Pada jendela yang muncul, klik dataset yang akan digabungkan dan cara penggabungannya (lihat Tabel 2.23). Klik OK.
  3. Untuk mengecek dataset, klik toolbar View data set.

Visualisasi tahapan tersebut ditampilkan pada Gambar 2.25.

Gambar 2.25: Tampilan tahapan menggabungkan dua buah dataset.

Sintaks yang digunakan untuk menggabungkan dua buah dataset secara umum adalah sebagai berikut:

Tabel 2.23: Penjelasan item jendela merge data sets.
1. Name for merge data set text input input nama dataset baru
2. First Data set select box daftar dataset pertama yang akan digabung
3. Second Data set select box daftar dataset kedua yang akan digabung
4. Direction or Merge radio button pilihan cara penggabungan
5. Merge only common... check box opsi apakah hanya observasi dengan elemen unik yang ada pada dua buah dataset yang akan digabungkan

Daftar submenu yang digunakan untuk melakukan modifikasi dataset lainnya pada R Commander, antara lain:

  • Select active data set : submenu ini memiliki fungsi sama dengan toolbar Data set, yaitu: memilih dataset yang diaktifkan. Jika pada jendela yang muncul terdapat beberapa dataset yang dapat diaktifkan, pembaca dapat memilih satu dataset dari daftar tersebut untuk diaktifkan.
  • Refresh active data set : submenu yang berfungsi untuk melakukan reset informasi yang dipertahankan terkait dataset yang aktif, seperti: nama vraiabel pada dataset, jenis data pada dataset tersebut, dll. Pembaca mungkinperlu melakukan refresh terhadap dataset yang aktif jika pembaca melakukan sebuah perubahan pada dataset tersebut diluar menu R Commander.
  • Help on active data set : menampilkan dokumentasi terkait dataset yang aktif (biasanya dataset yang ada dalam sebuah paket).
  • Variables in active data set : menampilkan daftar variabel yang ada dalam data set.
  • Set case name : memilih sebuah variabel pada dataset aktif dan selanjutnya menjadikan variabel tersebut sebagai rownames observasi dalam dataset tersebut.

Page 10

  1. Sebuah IPAL memiliki laporan hasil pemantauan parameter dissolved oxygen (DO) dan biochemical oxygen demand (BOD) pada outlet IPAL yang ditampilkan pada Tabel 2.24. Inputkan data tersebut ke dalam R Commander!
Tabel 2.24: Hasil pemantauan parameter DO dan BOD outlet IPAL X
1 5.07 8.42
2 2.01 11.78
3 3.54 8.23
4 4.97 9.71
5 5.91 10.20
6 2.73 9.63
7 4.51 10.54
8 3.74 8.94
9 2.52 9.38
10 -0.50 8.81
11 7.05 10.86
12 4.99 7.24
  1. Data pengukuran inlet dan outlet konsentrasi BOD, COD, dan DO dari 10 IPAL yang ada di Kota X ditampilkan pada Tabel 2.25. Hitung efisiensi pengolahan masing-masing IPAL tersebut untuk ketiga parameter tersebut dan amati perubahan rasio BOD/COD pada inlet dan outlet masing-masing IPAL tersebut!
Tabel 2.25: Hasil pemantauan parameter DO,BOD,dan COD 10 IPAL Kota X
IPAL 1 5.51 0.95 29.92 10.98 42.79 15.25
IPAL 2 4.95 1.56 31.50 4.44 48.72 24.37
IPAL 3 5.92 2.42 37.79 15.59 50.54 17.88
IPAL 4 5.12 3.96 34.70 15.25 49.67 17.45
IPAL 5 4.15 1.48 33.90 14.17 47.50 20.22
IPAL 6 4.78 0.92 35.97 7.85 56.53 14.49
IPAL 7 5.14 2.36 30.93 11.48 60.08 12.80
IPAL 8 3.50 1.33 39.68 13.38 39.66 27.82
IPAL 9 4.99 3.50 36.95 9.18 50.44 26.87
IPAL 10 4.98 1.41 38.18 7.10 43.11 19.97
  1. Lakukan data merging pada elemen unik antara Tabel 2.25 dan Tabel 2.26!
Tabel 2.26: Hasil pemantauan parameter TSS 12 IPAL Kota X
IPAL 1 20.66 5.12
IPAL 2 19.95 9.86
IPAL 3 18.31 12.07
IPAL 4 21.38 9.81
IPAL 5 18.68 8.77
IPAL 6 20.88 9.78
IPAL 7 20.79 6.18
IPAL 8 20.42 1.38
IPAL 9 17.77 7.25
IPAL 10 19.73 16.12
IPAL 11 20.02 3.99
IPAL 12 19.64 10.08

Page 11

Pada Chapter 3 penulis akan menjelaskan bagaimana cara menghasilkan ringkasan data dan visualisasi data menggunakan R Commander. Data-data yang digunakan pada Chapter 3, antara lain: dataset iris dan dataset VADeaths. Kedua dataset tersebut merupakan dataset yang terdapat pada paket datasets (lihat Chapter 2.6). Selain dataset tersebut, kita akan menggunakan kembali dataset mtcars pada Tabel 2.8.

Dataset iris merupakan dataset yang menampilkan data observasi 3 spesies anggrek dengan jumlah observasi tiap spesiesnya sebanyak 50 observasi. Beberapa observasi dataset iris ditampilkan pada Tabel 3.1, sedangkan penjelasan terkait dataset tersebut ditampilkan pada Tabel 3.2.

Tabel 3.1: Sepuluh Observasi pertama dataset iris
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa
4.6 3.4 1.4 0.3 setosa
5.0 3.4 1.5 0.2 setosa
4.4 2.9 1.4 0.2 setosa
4.9 3.1 1.5 0.1 setosa
Tabel 3.2: Penjelasan variabel dataset iris.
Sepal.Length numeric panjang sepal (cm)
Sepal.Width numeric lebar sepal (cm)
Petal.Length numeric panjang petal (cm)
Petal.Width numeric lebar petal (cm)
Species factor spesies anggrek

Dataset VADeaths menyajikan informasi terkait tingkat mortalitas per 1000 penduduk di Virginia pada tahun 1940. Beberapa observasi dataset tersebut ditampilkan pada Tabel 3.3. Sedangkan penjelasan variabel yang terdapat pada dataset tersebut ditampilkan pada Tabel 3.4.

Tabel 3.3: Sepuluh Observasi pertama dataset VADeaths
50-54 11.7 8.7 15.4 8.4
55-59 18.1 11.7 24.3 13.6
60-64 26.9 20.3 37.0 19.3
65-69 41.0 30.9 54.6 35.1
70-74 66.0 54.3 71.1 50.0
Tabel 3.4: Penjelasan variabel dataset perkotaan.
Rural Male numeric jumlah penduduk pria kawasan pedesaan
Rural Femal numeric jumlah penduduk wanita kawasan pedesaan
Urban Male numeric jumlah penduduk pria kawasan perkotaan
Urban Femal numeric jumlah penduduk wanita kawasan perkotaan
rownames - rentang usia penduduk

Page 12

R Commander dapat menghasilkan sejumlah ringkasan statistik seperti tabel frekuensi, jumlah observasi yang kosong (missing value), mean, median, simpangan baku, dll. Beberapa menu ringkasan data yang dapat digunakan pada menu Statistics/Summaries, antara lain:

  • Active data set : membuat ringkasan data berupa nilai min, max, kuartil 1, median, mean, dan kuartil 3 untuk jenis data numeric. Sedangkan untuk jenis data factor atau character/string akan dihasilkan tabel frekuensi.
  • Numerical summaries... : membuat ringkasan data spesifik untuk variabel numerik, seperti: mean, median, kuartil, simpangan baku, kurtosis, dll. baik untuk variabel tunggal maupun agregat variabel numeric berdasarkan variabel factor.
  • Frequency distributions... : membuat tabel distribusi frekuensi variabel factor atau character/string. Selain itu, menu ini menyajikan opsi untuk menampilkan uji goodness-of-fit untuk melakukan uji apakah proporsi frekuensi pada tiap kelompok kategori sesuai dengan ekspektasi yang kita harapkan. Dalam hal ini kita dapat pula menguji apakah proporsi observasi pada tiap kelompok sama (tiap kelompok homogen).
  • Count missing observations : menampilkan data terkait jumlah observasi kosong pada tiap variabel dataset.
  • Table of statistics : menampilkan ringkasan data variabel numeric tunggal atau agregat berdasarkan satu fungsi statistik tertentu.
  • Correlation matrix : menampilkan matrix korelasi dua atau lebih variabel numerik. Menu ini juga menampilkan opsi apakah nilai p-value dan adjusted p-value metode Holm setiap pasang korelasi variabel perlu ditampilkan.

Pada Chapter 3.1.1, penulis akan memberikan contoh penerapan menu Statistics/Summaries/Active data set pada dataset iris dan mtcars. Berikut adalah ringkasan data untuk kedua dataset tersebut:

## Sepal.Length Sepal.Width Petal.Length ## Min. :4.30 Min. :2.00 Min. :1.00 ## 1st Qu.:5.10 1st Qu.:2.80 1st Qu.:1.60 ## Median :5.80 Median :3.00 Median :4.35 ## Mean :5.84 Mean :3.06 Mean :3.76 ## 3rd Qu.:6.40 3rd Qu.:3.30 3rd Qu.:5.10 ## Max. :7.90 Max. :4.40 Max. :6.90 ## Petal.Width Species ## Min. :0.1 setosa :50 ## 1st Qu.:0.3 versicolor:50 ## Median :1.3 virginica :50 ## Mean :1.2 ## 3rd Qu.:1.8 ## Max. :2.5 ## mpg cyl disp ## Min. :10.4 Min. :4.00 Min. : 71.1 ## 1st Qu.:15.4 1st Qu.:4.00 1st Qu.:120.8 ## Median :19.2 Median :6.00 Median :196.3 ## Mean :20.1 Mean :6.19 Mean :230.7 ## 3rd Qu.:22.8 3rd Qu.:8.00 3rd Qu.:326.0 ## Max. :33.9 Max. :8.00 Max. :472.0 ## hp drat wt ## Min. : 52.0 Min. :2.76 Min. :1.51 ## 1st Qu.: 96.5 1st Qu.:3.08 1st Qu.:2.58 ## Median :123.0 Median :3.69 Median :3.33 ## Mean :146.7 Mean :3.60 Mean :3.22 ## 3rd Qu.:180.0 3rd Qu.:3.92 3rd Qu.:3.61 ## Max. :335.0 Max. :4.93 Max. :5.42 ## qsec vs am ## Min. :14.5 Min. :0.000 Min. :0.000 ## 1st Qu.:16.9 1st Qu.:0.000 1st Qu.:0.000 ## Median :17.7 Median :0.000 Median :0.000 ## Mean :17.8 Mean :0.438 Mean :0.406 ## 3rd Qu.:18.9 3rd Qu.:1.000 3rd Qu.:1.000 ## Max. :22.9 Max. :1.000 Max. :1.000 ## gear carb ## Min. :3.00 Min. :1.00 ## 1st Qu.:3.00 1st Qu.:2.00 ## Median :4.00 Median :2.00 ## Mean :3.69 Mean :2.81 ## 3rd Qu.:4.00 3rd Qu.:4.00 ## Max. :5.00 Max. :8.00

Secara umum format sintaks pada menu tersebut adalah sebagai berikut:

Pada Chapter 3.1.2 akan ditampilkan cara membuat ringkasan data numerik variabel Sepal.Length dan Sepal.Width pada dataset iris dengan agregasi menggunakan variabel Species. Untuk melakukannya jalankan tahapan berikut:

  1. Pilih menu Statistics/Summaries/Numerical summaries.../.
  2. Pada tab Data di jendela Numerical Summaries, pilih variabel numeric (jika ingin memilih lebih dari satu tekan tombol shift+ klik). Dalam hal ini penulis akan memilih variabel Sepal.Length dan Sepal.Width.
  3. Untuk membuat ringkasan variabel numerik berdasarkan grup data atau factor, klik tombol Summarize by: pada tab Data dan pilih variabel factor yang digunakan. Dalam hal ini penulis memilih variabel Species. Klik OK.
  4. Pada tab Statistics, centang statistika deskriptif yang akan ditampilkan. Klik OK.

Ringkasan tahapan tersebut divisualisasikan pada Gambar 3.1.

Gambar 3.1: Tampilan langkah membuat ringkasan data variabel numeric dataset iris.

Tampilan ringkasan data variabel Sepal.Length dan Sepal.Width berdasarkan variabel factor Species adalah sebagai berikut:

## Warning: package 'RcmdrMisc' was built under R version ## 3.6.2 ## Loading required package: car ## Warning: package 'car' was built under R version 3.6.2 ## Loading required package: carData ## Loading required package: sandwich ## Warning: package 'sandwich' was built under R version ## 3.6.2

numSummary(iris[,c("Sepal.Length", "Sepal.Width"), drop=FALSE], groups=iris$Species, statistics=c("mean", "sd", "se(mean)", "IQR", "quantiles", "cv", "skewness", "kurtosis"), quantiles=c(0,.25,.5,.75,1), type="2")

## ## Variable: Sepal.Length ## mean sd se(mean) IQR cv ## setosa 5.006 0.3525 0.04985 0.400 0.07041 ## versicolor 5.936 0.5162 0.07300 0.700 0.08696 ## virginica 6.588 0.6359 0.08993 0.675 0.09652 ## skewness kurtosis 0% 25% 50% 75% 100% n ## setosa 0.1201 -0.2527 4.3 4.800 5.0 5.2 5.8 50 ## versicolor 0.1054 -0.5330 4.9 5.600 5.9 6.3 7.0 50 ## virginica 0.1180 0.0329 4.9 6.225 6.5 6.9 7.9 50 ## ## Variable: Sepal.Width ## mean sd se(mean) IQR cv skewness ## setosa 3.428 0.3791 0.05361 0.475 0.1106 0.04117 ## versicolor 2.770 0.3138 0.04438 0.475 0.1133 -0.36284 ## virginica 2.974 0.3225 0.04561 0.375 0.1084 0.36595 ## kurtosis 0% 25% 50% 75% 100% n ## setosa 0.9547 2.3 3.200 3.4 3.675 4.4 50 ## versicolor -0.3662 2.0 2.525 2.8 3.000 3.4 50 ## virginica 0.7061 2.2 2.800 3.0 3.175 3.8 50

Format umum sintaks tersebut adalah sebagai berikut:

Pada fungsi tersebut terdapat 3 buah tipe yang digunakan untuk menghitung nilai skewness dan kurtosis. Ketiga tipe tersebut memiliki bentuk persamaan yang berbeda-beda, dimana tipe 1 merupakan persamaan yang sering digunakan pada textbook lama, tipe 2 merupakan persamaan yang digunakan pada aplikasi SAS dan SPSS, sedangkan tipe 3 merupakan persaman yang digunakan pada aplikasi MINITAB dan BMDP. Untuk memperoleh informasi terkait ketiga tipe tersebut, jalankan sintaks berikut;

?e1071::skewness ?e1071::kurtosis

Untuk data dengan jenis kategorikal, ringkasan data yang dapat dilakukan adalah dengan membuat tabel frekuensi untuk mengetahui jumlah observasi pada tiap kategorinya. Sebagai contoh, kita ingin mengetahui proporsi observasi pada tiap Species pada dataset iris. untuk melakukannya jalankan langkah-langkah berikut:

  1. Pilih menu Statistics/Summaries/Frequency distributions.../.
  2. Pada jendela yang muncul, pilih satu atau beberapa (tekan shift + klik) variabel factor.
  3. Centang pada check box Chi-square goodness-of-fit test jika ingin menampilkan hasil uji goodness-of-fit distribusi data (uji ini hanya dapat dilakukan pada satu variabel). Klik OK
  4. Jika check box dicentang, akan muncul jendela dialog yang meminta pembaca untuk mengisi hipotesis propabilitas dari distribusi observasi pada masing-masing kategori. Secara default, probabilitas akan diatur seragam untuk setiap kategori. Klik OK.

Visualisasi tahapan tersebut ditampilkan pada Gambar 3.2.

Gambar 3.2: Tampilan langkah membuat tabel frekuensi pada dataset iris.

Sintaks dan output yang muncul pada proses tersebut adalah sebagai berikut:

## ## counts: ## Species ## setosa versicolor virginica ## 50 50 50 ## ## percentages: ## Species ## setosa versicolor virginica ## 33.33 33.33 33.33 ## ## Chi-squared test for given probabilities ## ## data: .Table ## X-squared = 1.5e-28, df = 2, p-value = 1

Berdasarkan output yang dihasilkan, dapat diperhatikan bahwa 150 observasi yang ada pada dataset iris tersebar secara merata pada tiap kelas factor. Pada output yang dihasilkan dapat diperhatikan pula bahwa terdapat tiga bagian output. Bagian pertama adalah vektor frekuensi observasi pada tiap kelas factor, bagian kedua output berupa vektor persentase observasi tiap kelas dari total observasi yang ada, dan bagian ketiga adalah statistika uji dalam hal ini adalah uji Chi-square.

Secara umum sintaks tersebut dapat dituliskan seperti berikut:

Menu Statistics/Summaries/Count missing observations dapat digunakan untuk mengecek apakah pada setiap variabel dataset terdapat missing value. Output yang dihasilkan berupa sebuah vektor dengan nama vektor dan nilai vektor berupa jumlah observasi dengan missing value yang ada pada tiap variabel. Berikut adalah contoh sintaks dan output yang dihasilkan untuk mengecek missing value pada dataset iris, mtcars, dan VADeaths:

# iris sapply(iris, function(x)(sum(is.na(x)))) # NA counts

## Sepal.Length Sepal.Width Petal.Length Petal.Width ## 0 0 0 0 ## Species ## 0

# mtcars sapply(mtcars, function(x)(sum(is.na(x)))) # NA counts

## mpg cyl disp hp drat wt qsec vs am gear carb ## 0 0 0 0 0 0 0 0 0 0 0

# VADeaths sapply(VADeaths, function(x)(sum(is.na(x)))) # NA counts

## [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Berdasarkan output yang dihasilkan, dapat disimpulkan bahwa ketiga dataset tersebut tidak memiliki observasi dengan nilai kosong (missing value).

Format umum sintaks tersebut adalah sebagai berikut:

sapply(dataset, function(x)(sum(is.na(x))))

Pada Chapter 2.9.2 kita telah belajar cara untuk membuat ringkasan nilai satu atau beberapa variabel berdasarkan level variabel factor. Output yang dihasilkan berdasarkan menu tersebut adalah dataframe hasil agregasi. Pada Chapter 3.1.5 kita akan belajar kembali proses tersebut. Hal yang membedakan dari proses sebelumnya adalah menu Statistics/Summaries/Table of statistics menghasilkan output berupa vektor.

Pada Chapter 3.1.5 kita akan mencoba untuk mencari rata-rata seluruh variabel numerik berdasarkan variabel Species. Untuk melakukannya jalankan langkah-langkah berikut:

  1. Pilih menu Statistics/Summaries/Table of statistics.
  2. Pada kotak Factors, pilih satu atau beberapa variabel factor sebagai variabel pengelompok. Dalam hal ini variabel Species dipilih.
  3. Pada kotak Response variables, satu atau beberapa variabel numeric yang hendak dihitung tabel statistiknya. Pada contoh kali ini penulis memilih seluruh variabel numeric.
  4. Pada bagian Statistics, pilih statistik yang akan dihasilkan. Dalam hal ini penulis ingin menghitung nilai mean pada setiap kelompok spesies pada setiap variabel. Klik OK.

Visualisasi tahpan tersebut ditampilkan pada Gambar 3.3.

Gambar 3.3: Tampilan langkah membuat tabel statistik pada dataset iris.

Sintaks dan output yang dihasilkan pada tahapan tersebut adalah sebagai berikut:

## setosa versicolor virginica ## 1.462 4.260 5.552 ## setosa versicolor virginica ## 0.246 1.326 2.026 ## setosa versicolor virginica ## 5.006 5.936 6.588 ## setosa versicolor virginica ## 3.428 2.770 2.974

Secara umum berdasarkan output yang dihasilkan, spesies anggrek virginica memiliki nilai rata-rata panjang petal, lebar petal dan dan panjang sepal yang lebih besar dibanding yang lainnya, sedangkan spesies setosa memiliki ukuran petal dan panjang sepal yang lebih kecil serta lebar sepal yang lebih besar dibandingkan spesies anggrek lainnya. Selain itu, diketahui bahwa spesies anggrek versicolor memiliki ukuran sepal dan petal yang berada diantara dua spesies anggrek lainnya.

Format umum sintaks tersebut adalah sebagai berikut:

with(dataset, tapply(NamaVariabel, list(VariabelFactor), mean, na.rm=TRUE))

MenuStatistics/Summaries/Correlation matrix akan menghasilkan matriks korelasi antar variabel numeric. Metode yang tersedia untuk menghitung nilai korelasi antara dua buah variabel numeric adalah metode Pearson product-moment (metode parametrik) dan Spearman rank-order (metode nonparametrik). Pada menu tersebut juga tersedia pilihan apakah akan menampilkan nilai p-value dan adjusted p-value (metode Holm) pada masing-masing nilai korelasi.

Pada Chapter 3.1.6 kita akan membuat matriks korelasi pada seluruh variabel numeric dataset iris. Untuk melakukannya jalankan langkah-langkah berikut:

  1. Pilih menu Statistics/Summaries/Correlation matrix.
  2. Pada kotak Variables, pili seluruh variabel numeric dengan cara tekan Shift+klik atau Shift + arrow up/down.
  3. Pada bagian Type of Correlation, pilih Pearson product-moment (pembaca dapat memilih jenis korelasi lainnya).
  4. Pada bagian Observations to Use, pilih Complete observation (observasi tanpa missing value pada seluruh variabelnya) atau Pairwise-complete observation (observasi tanpa missing value hanya pada variabel yang akan dipasangkan satu sama lain).
  5. Centang pada check box Pairwise p-value jika ingin menampilkan p-value dan adjusted p-value nilai korelasi. Klik OK.

Visualisasi tahapan tersebut ditampilkan pada Gambar 3.4.

Gambar 3.4: Tampilan langkah membuat matriks korelasi pada dataset iris.

Sintaks dan output yang dihasilkan pada tahapan tersebut adalah sebagai berikut:

## Warning: package 'Hmisc' was built under R version ## 3.6.2 ## ## Attaching package: 'Hmisc' ## The following object is masked _by_ 'package:RcmdrMisc': ## ## Dotplot ## The following objects are masked from 'package:base': ## ## format.pval, units ## ## Pearson correlations: ## Petal.Length Petal.Width Sepal.Length ## Petal.Length 1.0000 0.9629 0.8718 ## Petal.Width 0.9629 1.0000 0.8179 ## Sepal.Length 0.8718 0.8179 1.0000 ## Sepal.Width -0.4284 -0.3661 -0.1176 ## Sepal.Width ## Petal.Length -0.4284 ## Petal.Width -0.3661 ## Sepal.Length -0.1176 ## Sepal.Width 1.0000 ## ## Number of observations: 150 ## ## Pairwise two-sided p-values: ## Petal.Length Petal.Width Sepal.Length ## Petal.Length <.0001 <.0001 ## Petal.Width <.0001 <.0001 ## Sepal.Length <.0001 <.0001 ## Sepal.Width <.0001 <.0001 0.1519 ## Sepal.Width ## Petal.Length <.0001 ## Petal.Width <.0001 ## Sepal.Length 0.1519 ## Sepal.Width ## ## Adjusted p-values (Holm's method) ## Petal.Length Petal.Width Sepal.Length ## Petal.Length <.0001 <.0001 ## Petal.Width <.0001 <.0001 ## Sepal.Length <.0001 <.0001 ## Sepal.Width <.0001 <.0001 0.1519 ## Sepal.Width ## Petal.Length <.0001 ## Petal.Width <.0001 ## Sepal.Length 0.1519 ## Sepal.Width

Berdasarkan nilai korelasi Pearson yang dihasilkan dapat kita peroleh sejumlah informasi penting, antara lain:

  • variabel Petal.Length dan variabel Petal.Width memiliki korelasi positif dan kuat yang menunjukkan bahwa panjang petal pada tanaman anggrek yang besar akan diikuti oleh lebar petal tanaman anggrek yang besar dan sebaliknya.
  • variabel Sepal. Lenght berkorelasi kuat dan positif dengan variabel Petal.Length dan variabel Petal.Width yang menunjukkan bahwa ukuran petal tanaman anggrek yang besar akan diikuti oleh panjang sepal tanaman anggrek yang besar dan sebaliknya.
  • variabel Sepal.Width berkorelasi negatif dan lemah terhadap variabel lainnya yang menunjukkan bahwa besar kecil ukuran petal dan panjang sepal tidak serta-merta dikuti oleh besar kecilnya lebar sepal pada tanaman anggrek.

Format umum dari fungsi rcorr.adjust() adalah sebagai berikut:

Page 13

Ringkasan data yang dapat digunakan pada dua atau lebih variabel kategorikal adalah tabel kontingensi. Pada R Commander, tabel kontingensi dapat dibuat menggunakan menu Statistics/Contingency tables. Terdapat beberapa submenu yang dapat digunakan untuk membuat tabel kontingensi, antara lain:

  • Two-way table... : membuat tabel kontingensi untuk dua buah variabel kategorikal.
  • Multi-way table... : membuat tabel kontingensi untuk lebih dari dua variabel.
  • Enter and analyze two way table...: melakukan input manual frekuensi dari tabel kontingensi untuk dua variabel.

Submenu pertama dan ketiga menyediakan opsi analisis statistik yang digunakan seperti Chi-square test of independence, Fisher’s exact test, dll.

Pada Chapter 3.2, kita hanya akan membahas mengenai dua poin pertama. Poin ketiga akan dibahas lebih lanjut pada Chapter analisis asosiasi.

Dataset yang digunakan pada Chapter 3.2 adalah dataset mtcars. Sebelum dataset tersebut digunakan, perlu dilakukan konversi sejumlah variabel numeric menjadi factor (lihat Chapter 2.8.5). Variabel numeric yang akan dikonversi tersebut, antara lain: cyl, vs, am, gear, dan carb. Sintaks yang dihasilkan pada proses konversi adalah sebagai berikut:

Pada Chapter 3.2.1, kita akan membuat tabel kontingensi variabel am terhadap variabel cyl pada dataset mtcars. Untuk melakukannya jalankan langkah-langkah berikut:

  1. Pilih menu Statistics/Contingency tables/Two-way table....
  2. Pada tab Data, pilih variabel am pada kotak Row variables dan variabel cyl pada kotak Column variable.
  3. Pada tab Statistics, pilih No percentage pada bagian Compute percentages (tabel hanya menampilkan frekuensi sesungguhnya). Pembaca dapat pula mencentang pilihan yang tersedia pada bagian Hypothesis Tests untuk menampilkan perhitungan statistik lainnya pada output program. Klik OK.

Visualisasi tahapan tersebut ditampilkan pada Gambar 3.5.

Gambar 3.5: Tampilan langkah membuat tabel kontingensi variabel am terhadap variabel cyl pada dataset mtcars.

Sintaks dan output yang dihasilkan pada tahapan tersebut adalah sebagai berikut:

## ## Frequency table: ## cyl ## am 4 6 8 ## automatic 3 4 12 ## manual 8 3 2 ## Warning in chisq.test(.Table, correct = FALSE): Chi- ## squared approximation may be incorrect ## ## Pearson's Chi-squared test ## ## data: .Table ## X-squared = 8.7, df = 2, p-value = 0.01

Berdasarkan output yang dihasilkan dapat diperoleh informasi bahwa secara umum pada dataset sampel mobil dengan jumlah silinder > 4 didominasi oleh mobil dengan transmisi otomatis, sedangkan pada mobil dengan jumlah silinder 4 didominasi oleh mobil dengan transmisi manual.

Format umum dari sintaks tersebut adalah sebagai berikut:

Misalkan kita ingin membuat sebuah tabel kontingensi dari dataset mtcars untuk beberapa variabel dengan ketentuan sebagai berikut:

  • variabel am sebagai variabel baris,
  • variabel cyl sebagai variabel kolom, dan
  • variabel carb, gear, dan vs sebagai variabel kontrol.

Untuk melakukannya jalankan langkah-langkah berikut:

  1. Pilih menu Statistics/Contingency tables/Multi-way table....
  2. Pilih variabel sesuai dengan ketentuan di atas. Klik OK.

Visualisasi tahapan tersebut ditampilkan pada Gambar 3.6.

Gambar 3.6: Tampilan langkah membuat tabel kontingensi beberapa variabel kategorikal pada dataset mtcars.

Sintaks dan output proses tersebut adalah sebagai berikut:

## ## Frequency table: ## , , carb = 1, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 2, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 4 ## manual 0 0 0 ## ## , , carb = 3, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 3 ## manual 0 0 0 ## ## , , carb = 4, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 5 ## manual 0 0 0 ## ## , , carb = 6, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 8, gear = 3, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 1, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 2, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 3, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 4, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 2 0 ## ## , , carb = 6, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 8, gear = 4, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 1, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 2, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 1 0 0 ## ## , , carb = 3, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 4, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 1 ## ## , , carb = 6, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 1 0 ## ## , , carb = 8, gear = 5, vs = automatic ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 1 ## ## , , carb = 1, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 1 2 0 ## manual 0 0 0 ## ## , , carb = 2, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 3, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 4, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 6, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 8, gear = 3, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 1, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 4 0 0 ## ## , , carb = 2, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 2 0 0 ## manual 2 0 0 ## ## , , carb = 3, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 4, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 2 0 ## manual 0 0 0 ## ## , , carb = 6, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 8, gear = 4, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 1, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 2, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 1 0 0 ## ## , , carb = 3, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 4, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 6, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0 ## ## , , carb = 8, gear = 5, vs = manual ## ## cyl ## am 4 6 8 ## automatic 0 0 0 ## manual 0 0 0

Format umum sintaks tersebut adalah sebagai berikut:

Page 14

Video yang berhubungan

Postingan terbaru

LIHAT SEMUA