Dalam analisis data ada kalanya kita ingin melakukan agregasi data seperti mencari jumlah data, mencari rata-rata atau total nilai Table of Contents Kita bisa gunakan fungsi GroupBy() Fungsi GroupBy()memungkinkan kita untuk mengelompokkan data dalam kumpulan item yang sama misalnya dalam lokasi, produk, tingkat pendidikan, jenis kelamin, dan kategori lainnya Misalnya begini, Kita punya data mahasiswa yang mempunyai atribut nama, alamat, jenis kelamin dan nilai Dari data ini kita bisa mencari tahu total nilai atau rata-rata nilai berdasarkan alamat dan jenis kelamin Oke, kita coba langsung.. Pertama kita buat file data.csv dengan isi sebagai berikut
Kemudian panggil file tersebut dengan fungsi read_csv() dan lakukan operasi GroupBy() Misalnya kita ingin mencari rata-rata nilai untuk setiap grup alamat dan jenis kelamin import pandas as pd df = pd.read_csv('data.csv') alamat = df.groupby('alamat').mean() jenisKelamin = df.groupby('jenis kelamin').mean() print(alamat) print(jenisKelamin) Hasilnya adalah Contoh lainnya misal ingin mengetahui total nilai per kelompok alamat dan jenis kelamin kita ganti mean() menjadi sum() import pandas as pd df = pd.read_csv('data.csv') alamat = df.groupby('alamat').sum() jenisKelamin = df.groupby('jenis kelamin').sum() print(alamat) print(jenisKelamin) Hasilnya Ada beberapa fungsi agregasi lainnya yang sering digunakan selain mean() dan sum() seperti terangkum pada tabel dibawah
Kombinasi Fungsi AgregasiKita bisa mengkombinasikan fungsi agregasi dengan fungsi agg() Misalnya kita ingin mencari nilai rata-rata dan total nilai dari jenis kelamin import pandas as pd import numpy as np df = pd.read_csv('data.csv') jenisKelamin = df.groupby('jenis kelamin').agg([np.mean, np.sum]) Hasilnya adalah Post navigationGrup panda berdasarkan fungsi digunakan untuk mengelompokkan objek atau kolom DataFrames berdasarkan kondisi atau aturan tertentu. Dengan menggunakan fungsi groupby, pengelolaan dataset menjadi lebih mudah. Namun, semua catatan terkait dapat diatur ke dalam kelompok. Dengan menggunakan pustaka Pandas, Anda dapat mengimplementasikan grup Pandas berdasarkan fungsi untuk mengelompokkan data menurut jenis variabel yang berbeda. Sebagian besar pengembang menggunakan tiga teknik dasar untuk mengelompokkan berdasarkan fungsi. Pertama, splitting dimana data dibagi menjadi beberapa kelompok berdasarkan beberapa kondisi tertentu. Kemudian, terapkan fungsi tertentu ke grup ini. Pada akhirnya, gabungkan output dalam bentuk struktur data. Pada artikel ini, kita akan membahas penggunaan dasar grup berdasarkan fungsi di python panda. Semua perintah dijalankan pada editor Pycharm. Mari kita bahas konsep utama grup dengan bantuan data karyawan. Kami telah membuat kerangka data dengan beberapa detail karyawan yang berguna (Nama_Karyawan, Penunjukan, Kota_Karyawan, Usia). Penggabungan String menggunakan Group by FunctionMenggunakan fungsi groupby, Anda dapat menggabungkan string. Catatan yang sama dapat digabungkan dengan ',' dalam satu sel. ContohPada contoh berikut, kami telah mengurutkan data berdasarkan kolom 'Penunjukan' karyawan dan bergabung dengan Karyawan yang memiliki sebutan yang sama. Fungsi lambda diterapkan pada 'Employees_Name'. impor panda sebagai pd Ketika kode di atas dijalankan, output berikut akan ditampilkan: Mengurutkan Nilai dalam urutan menaikGunakan objek groupby ke dalam kerangka data biasa dengan memanggil '.to_frame()' dan kemudian gunakan reset_index() untuk pengindeksan ulang. Urutkan nilai kolom dengan memanggil sort_values(). ContohDalam contoh ini, kami akan mengurutkan usia Karyawan dalam urutan menaik. Menggunakan potongan kode berikut, kami telah mengambil 'Employee_Age' dalam urutan menaik dengan 'Employee_Names'. impor panda sebagai pd Penggunaan agregat dengan groupbyAda sejumlah fungsi atau agregasi yang tersedia yang dapat Anda terapkan pada grup data seperti count(), sum(), mean(), median(), mode(), std(), min(), max(). ContohDalam contoh ini, kami telah menggunakan fungsi 'count()' dengan groupby untuk menghitung Karyawan yang termasuk dalam 'Employee_city' yang sama. impor panda sebagai pd Seperti yang dapat Anda lihat pada output berikut, di bawah kolom Designation, Employee_Names, dan Employee_Age, hitung angka yang berasal dari kota yang sama: Visualisasikan data menggunakan groupbyDengan menggunakan 'import matplotlib.pyplot', Anda dapat memvisualisasikan data Anda ke dalam grafik. ContohDi sini, contoh berikut memvisualisasikan 'Employee_Age' dengan 'Employee_Nmaes' dari DataFrame yang diberikan dengan menggunakan pernyataan groupby. impor panda sebagai pd ContohUntuk memplot grafik bertumpuk menggunakan groupby, putar 'stacked=true' dan gunakan kode berikut: impor panda sebagai pd Pada grafik di bawah ini, jumlah karyawan ditumpuk yang berasal dari kota yang sama. Ubah Nama Kolom dengan grup denganAnda juga dapat mengubah nama kolom teragregasi dengan beberapa nama baru yang dimodifikasi sebagai berikut: impor panda sebagai pd Dalam contoh di atas, nama 'Penunjukan' diubah menjadi 'Penunjukan_Karyawan'. Ambil Grup berdasarkan kunci atau nilaiMenggunakan pernyataan groupby, Anda dapat mengambil catatan atau nilai serupa dari kerangka data. ContohDalam contoh yang diberikan di bawah ini, kami memiliki data grup berdasarkan 'Penunjukan'. Kemudian, grup 'Staf' diambil dengan menggunakan .getgroup('Staff'). impor panda sebagai pd Hasil berikut ditampilkan di jendela output: Tambahkan Nilai ke dalam Daftar grupData serupa dapat ditampilkan dalam bentuk daftar dengan menggunakan pernyataan groupby. Pertama, mengelompokkan data berdasarkan suatu kondisi. Kemudian, dengan menerapkan fungsi tersebut, Anda dapat dengan mudah memasukkan grup ini ke dalam daftar. ContohDalam contoh ini, kami telah memasukkan catatan serupa ke dalam daftar grup. Semua karyawan dibagi ke dalam grup berdasarkan 'Employee_city', dan kemudian dengan menerapkan fungsi 'Lambda', grup ini diambil dalam bentuk daftar. impor panda sebagai pd Penggunaan fungsi Transform dengan groupbyKaryawan dikelompokkan menurut usia mereka, nilai-nilai ini ditambahkan bersama-sama, dan dengan menggunakan fungsi 'mengubah' kolom baru ditambahkan dalam tabel: impor panda sebagai pd KesimpulanKami telah menjelajahi berbagai penggunaan pernyataan groupby dalam artikel ini. Kami telah menunjukkan bagaimana Anda dapat membagi data ke dalam grup, dan dengan menerapkan agregasi atau fungsi yang berbeda, Anda dapat dengan mudah mengambil grup ini. |