Cara menggunakan python for data analysis

Saat ini, data science menjadi ranah yang banyak orang geluti, dan lahir banyak sekali data scientist, data analyst hingga data engineer. Tentu ada perbedaan antara ketiga sebutan itu. Berkecimpung dalam jagat data science memang sangat menarik, dan banyak bahasa pemrograman yang bisa Anda coba.

Namun, salah satu bahasa yang paling banyak orang gunakan adalah Python. Tentu ada banyak bahasa pemrograman lain yang dapat menjadi alternatif. Selain dalam data science, Python memiliki manfaat lainnya juga. Namun, Python untuk data science menjadi salah satu pioner dalam dunia data science itu sendiri. Hal ini tentu memiliki alasan tersendiri.

Beberapa alasannya adalah karena efisiensi, kecepatan hingga ketepatan Python dalam membaca kode. Ini tidak hanya terbatas pada data science saja, bahkan dalam ilmu machine learning pun Python banyak orang sukai. Pekerjaan-pekerjaan kompleks pada machine learning juga dapat Python selesaikan.

Python turut berkembang dengan menyediakan banyak library dengan fungsi beragam. Apakah Anda tertarik untuk mencoba Python? Pada artikel kali ini, kami memberikan cara instalasi Python untuk Windows, dan langkah-langkah instalasi Python untuk data science.

Baca Juga : Mengenal Apa Itu Bahasa Pemrograman Python Dan Cara Belajarnya

Daftar Isi

  • 1 Kelebihan Python Untuk Data Science
    • 1.1 1. Mendapatkan Banyak Dukungan
    • 1.2 2. Open Source
    • 1.3 3. Mudah Untuk Anda Gunakan
  • 2 Instalasi Python Untuk WIndows
  • 3 Menggunakan Library Python Untuk Data Science
  • 4 Cara menggunakan Python untuk Data Science di Google Collab
  • 5 Kesimpulan dan Penutup

Kelebihan Python Untuk Data Science

1. Mendapatkan Banyak Dukungan

Python memiliki banyak pengikut dan pengguna, serta sering orang gunakan dalam ranah akademis dan industri, yang berarti terdapat banyak library analitis tersedia untuk Anda gunakan. Semakin populer Python, maka semakin banyak juga kontribusi yang penggunaannya berikan`

2. Open Source

Python bersifat open source, maka Python grits untuk Anda gunakan. Serta pengembangannya menggunakan model berbasis komunitas. Python memiliki desain yang bisa bekerja pada lingkungan Linux, maupun lingkungan Windows. Ada banyak library Python yang open source seperti Manipulasi Data, Visualisasi Data, Statistik, Matematika, dan masih banyak lagi.

3. Mudah Untuk Anda Gunakan

Seperti kita tahu, karena fokus Python pada kesederhanaan serta keterbacaan, Python menjadi salah satu alat yang ideal bagi para programmer pemula. Python menawarkan kelebihan berupa kode-kode yang lebih pendek, dengan bahasa yang lebih manusiawi. Sehingga secara garis besar, Anda menggunakan waktu yang lebih sedikit dalam menulis kode, dan lebih banyak meluangkan waktu untuk brainstorming.

Instalasi Python Untuk WIndows

1. Hal pertama, unduh installer Python, dan pada artikel ini versi Python yang kami gunakan adalah Python 3.10.2

2. Jalankan file yang telah Anda unduh, centang “Add Python 3.10 to PATH” dan klik Install Now.

3. Tunggu proses install hingga selesai dan klik Close.

4. Tekan tombol dengan logo Windows pada keyboard atau klik logo Windows pada bagian kiri bawah layar Anda, ketik “CMD” lalu jalankan Command Prompt

5. Ketik python –version untuk mengecek apakah instalasi Python berhasil.

6. Anda dapat mencoba menjalankan perintah Python sederhana seperti menampilkan teks “Hello World!” dengan mengetik python pada command prompt dan tekan Enter, lalu masukan kode print(“Hello World!”).

Bahasa pemrograman Python cukup banyak digunakan di bidang data science karena memiliki library yang bermanfaat untuk mengolah data dalam jumlah besar. Karenanya. Anda perlu untuk menginstal library yang cukup umum orang gunakan dalam pengolahan data seperti Pandas, Matplotlib, Numpy, dan masih banyak library lainnya tergantung kebutuhan Anda.

Cara instalasi dan menggunakan library tersebut cukup mudah yaitu dengan mengetik perintah pip install [nama_library]. Anda dapat menginstalnya melalui command prompt dengan mengganti [nama_library] ke nama library yang akan Anda instal, seperti pada contoh berikut akan kami instal library Pandas dengan perintah pip install pandas:

Jika muncul peringatan, Anda dapat mengabaikannya. Selanjutnya Anda akan menggunakan library tersebut untuk mencoba menampilkan informasi statistik dari data.

Baca Juga : Cloud Engineer : Job Desk dan Tugasnya

Menggunakan Library Python Untuk Data Science

Pada command prompt yang telah terbuka, ketik perintah python dan tekan Enter. Lalu copy dan paste kode ini:

import pandas as pd
import numpy as np

data_random = np.random.random(size=(10,4))
df = pd.DataFrame(data=data_random, columns=["A", "B", "C", "D"])
df.head()
df.describe()

Hasilnya akan tampil seperti berikut:

Penjelasan kodenya sebagai berikut:

import pandas as pd
Import numpy as np

Import [nama_library] berguna untuk memanggil library yang telah terinstal, dan as sebagai alias yang berfungsi untuk membuat sebuah nama yang mewakilkan pemanggilan library tersebut.

data_random = np.random.random(size=(10,4))

np adalah alias dari library numpy pada kode sebelumnya, fungsi .random.random() pada library numpy berguna untuk membuat sekumpulan angka acak dengan kriteria size=(

,

). Angka pada ukuran tersebut adalah angka jumlah baris (row) dan jumlah kolom (column) pada data yang Anda buat.

df = pd.DataFrame(data=data_random, columns=["A", "B", "C", "D"])

pd adalah alias dari library pandas pada kode sebelumnya, fungsi .DataFrame() akan membentuk sebuah data yang dapat Anda baca oleh program dengan kriteria data=[sekumpulan angka] dan columns=[nama dari setiap kolom].

df.head()
df.describe()

Fungsi .head() berguna untuk menampilkan 5 baris teratas pada data Anda, dan .describe() akan menampilkan informasi statistik dari data Anda seperti jumlah data, nilai rata-rata, nilai minimum, dan nilai maksimum.

Terdapat beragam library dalam Python untuk data science yang dapat Anda gunakan. Namun, pada artikel ini tidak kami sertakan penjelasan lebih lanjut dari masing – masing library. Jika Anda tidak ingin menginstal library pada komputer Anda, maka Anda dapat menggunakan layanan dari Google yaitu Google Collab yang sudah terinstal banyak library dan siap Anda gunakan kapanpun secara gratis.

Cara menggunakan Python untuk Data Science di Google Collab

1. Pergi ke situs https://colab.research.google.com/ dan klik New Notebook

2. Masukan kode berikut ke kolom kode dan tekan Ctrl+Enter pada keyboard Anda:

import pandas as pd
import numpy as np

data_random = np.random.random(size=(10,4))
df = pd.DataFrame(data=data_random, columns=["A", "B", "C", "D"])
print(df.head())
print(df.describe())

Anda dapat mengecek seluruh library yang sudah siap pakai untuk data science pada Google Colab dengan mengetik perintah !pip list.

Baca Juga : Rekomendasi Programming Language/Bahasa Pemrograman Terbaik 2022

Kesimpulan dan Penutup

Python adalah bahasa pemrograman tingkat tinggi, berorientasi objek dan memiliki semantik yang dinamis. Python juga sangat cocok untuk Pengembangan Aplikasi yang Cepat, karena terbangun dalam struktur data level tinggi dan semakin baik ketika dikombinasikan dengan pengetikan dinamis serta pengikatan dinamis.

Dalam ranah data science, Python menjadi favorit banyak orang karena kecepatan, efisiensi, serta ketepatan Python. Python untuk data science semakin menjadi tren, dan mendorong Python dalam menyediakan library dengan beragam fungsi. Sebutan library ada karena fungsi-fungsi dianggap sebagai buku dalam sebuah perpustakaan, dan Anda bisa menggunakan fungsi tersebut sebebasnya. Apabila Anda juga ingin menggeluti jagat data science, Python adalah salah satu yang tidak dapat Anda lewatkan. Begitu pun dalam ranah lain seperti machine learning atau artificial intelligence yang sedang tren, Python memiliki keunggulannya tersendiri.