Melalui kelas ini, kamu diajak untuk:
Kenapa Perlu Library?
Bahasa pemrograman memberi . Namun, adakalanya keterbatasan-baik waktu maupun tenaga-yang membuat bahasa pemrograman menjadi tak optimal ketika berada di tangan kita.
Komunitas developer bahu membahu untuk saling mempermudah pekerjaan satu sama lain. Maka, beberapa programmer berinisiatif membuat kumpulan code yang terdokumentasi dalam satu library. Dengan library, setiap developer bisa mengerjakan tugas dengan lebih mudah tanpa perlu membangun dari awal.
Library Python
Fungsi Python dalam luasnya semesta pengembangan produk terbantu oleh kehadiran komunitas yang membangun banyak library. Mulai dari analisis dan tabulasi data, machine learning, artificial intelligence, hingga computer vision, memiliki masing-masing library siap pakai.
Komunitas developer bahu membahu untuk saling mempermudah pekerjaan satu sama lain. Maka, beberapa programmer berinisiatif membuat kumpulan code yang terdokumentasi dalam satu library. Dengan library, setiap developer bisa mengerjakan tugas dengan lebih mudah tanpa perlu membangun dari awal.
Geser ke kanan untuk melihat pengelompokan library Python:
Mengelola Data
Pandas dan Numpy adalah kawan karib analis data mazhab Python. Kedua library ini mampu mengunduh, mengklasifikasi, hingga mengolah dalam perhitungan kompleks seperti Machine Learning.
Machine Learning dan Artificial Intelligence
Selain Pandas dan Numpy yang jadi bahan baku pokok, komunitas Python mengandalkan library macam Matplotlib, Tensorflow, dan Keras.
Analisis Teks
Natural Language Processing (NLP) didominasi jagoan Python dengan kemampuan khusus menganalisis teks dan meramu rumusan tertentu pada teks.
Computer Vision dan Audio Analysis
Library Python di bidang ini mampu memindai gambar dan audio menjadi sebuah kumpulan data.
Memasang dan Menggunakan Library
Library harus diinstall dalam sistem, baru kemudian dicantumkan ke file pemrograman. Folder library harus terpasang di Terminal. Tujuannya, agar setiap pengerjaan yang membutuhkan library terkait dapat langsung bekerja tak perlu menghadapi error.
Untuk mencobanya, buka terminal dan ketik perintah penginstalan. Berikut contoh perintah yang dicantumkan untuk menginstal pandas.
pip install pandas
Di dalam Python, pemasangan library berada di paling awal dokumen file baru diikuti kodenya. Misal kita akan menggunakan Pandas, maka harus didahului oleh kode seperti ini.
import pandas as pd from pandas import read_csv df = pd.read_csv("/Users/user/Documents/Code Learning/Python/train.csv")Perintah
Setiap library memiliki kelas dan fungsi yang berbeda satu sama lain. Meski masih berada dalam naungan bahasa Python, diwajibkan membaca dengan teliti daftar fungsi setiap library yang hendak digunakan.
Kuis
Di mana kita harus mencantumkan library saat menulis kode?
Di bagian bawah file.
Awal file kode.
Terminal
Google Sheet
Pemrograman Python banyak menawarkan kelebihan untuk efisiensi, keterbacaan kode dan kecepatan yang menjadikan python sebagai pemrograman pilihan yang paling banyak digunakan oleh para data scientist dan machine learning engineer untuk mengembangkan model dan berbagai aplikasi terkait data science.
Python telah dibangun dengan banyak library untuk digunakan programmer agar lebih memudahkan dalam memecahkan masalah dan menyelesaikan tugas-tugas rumit tanpa banyak gangguan penggunaan kode.
Berikut 5 library python terbaik untuk data science:
1. Matplotlib
Matplotlib memiliki visual powerful namun indah. Library ini adalah library plotting untuk Python dengan sekitar 26.000 komentar di GitHub dan punya komunitas yang sangat besar dengan 700 kontributor.
Karena grafik dan plot yang dihasilkannya, library ini banyak digunakan untuk visualisasi data. Library ini juga menyediakan API berorientasi objek, yang dapat digunakan untuk menanamkan plot tersebut ke dalam aplikasi.
Fitur:
- Dapat digunakan sebagai pengganti MATLAB, dengan keuntungan free dan bersifat open-source
- Mendukung puluhan backend dan jenis output, yang berarti Kita dapat menggunakannya terlepas dari sistem operasi mana yang Kita gunakan atau format output mana yang ingin Kita gunakan
- Pandas sendiri dapat digunakan sebagai pembungkus di sekitar API MATLAB untuk mengatur MATLAB seperti pembersih
- Konsumsi memori rendah dan perilaku runtime yang lebih baik
Penggunaan:
- Analisis korelasi variable
- Memvisualisasikan interval kepercayaan 95 persen dari model
- Deteksi outlier menggunakan scatter plot dan lain-lain.
- Memvisualisasikan distribusi data untuk mendapatkan wawasan yang instan
Seiring dengan perkembangan library ini, para data scientist juga memanfaatkan kemampuan beberapa library yang berguna lainnya yaitu :
- Mirip dengan TensorFlow, Keras adalah salah satu library populer lainnya yang digunakan secara luas untuk deep learning dan modul jaringan saraf. Keras mendukung backend TensorFlow dan Theano, jadi library ini adalah pilihan yang baik jika Kita tidak ingin mempelajari lebih detail TensorFlow.
- Scikit-learn adalah library machine learning yang menyediakan hampir semua algoritma machine learning yang mungkin Kita butuhkan. Scikit-learn dirancang untuk diinterpolasi ke dalam NumPy dan SciPy.
- Seabourn adalah library lainnya yang digunakan untuk visualisasi data. Library ini adalah peningkatan dari matplotlib, karena memperkenalkan jenis plot tambahan.
2. NumPy
NumPy (Numerical Python) adalah paket fundamental untuk komputasi numerik di Python. Berisi objek array N-dimensional yang powerful. Library ini memiliki sekitar 18.000 komentar di GitHub dan komunitas aktif yang terbesar dengan 700 kontributor.
NumPy merupakan paket general-purpose array-processing yang menyediakan objek multidimensi berkinerja tinggi yang disebut array dan alat untuk bekerja dengan library tersebut. NumPy juga mengatasi sebagian masalah perlambatan dengan menyediakan array multidimensi ini serta menyediakan fungsi dan operator yang beroperasi secara efisien pada array ini.
Fitur:
- Menyediakan fungsi yang cepat dan terlengkap untuk rutinitas proses numerik
- Komputasi berorientasi array untuk efisiensi yang lebih baik
- Mendukung pendekatan berorientasi objek
- Komputasi yang ringkas dan lebih cepat dengan vektorisasi
Penggunaan:
- Banyak digunakan dalam analisis data
- Membuat array N-dimensional yang powerful
- Membentuk dasar library lain, seperti SciPy dan scikit-learn
- Sebagai pengganti MATLAB saat digunakan dengan SciPy dan matplotlib
3. SciPy
SciPy (Scientific Python) adalah library Python gratis dan bersifat open-source yang banyak digunakan dalam data science untuk komputasi tingkat tinggi.
SciPy memiliki sekitar 19.000 komentar di GitHub dan komunitas aktif yang besar dengan sekitar 600 kontributor. Library ini banyak digunakan untuk komputasi ilmiah dan teknis karena perluasan dari NumPy dan menyediakan banyak rutinitas yang user friendly dan efisien untuk perhitungan ilmiah.
Fitur:
- Terdiri dari algoritma dan fungsi yang dibangun pada ekstensi NumPy python
- Perintah dengan kemampuan tingkat tinggi untuk manipulasi dan visualisasi data
- Pemrosesan gambar multidimensi dengan submodul SciPy.ndimage
- Menyertakan fungsi bawaan untuk memecahkan masalah persamaan diferensial
Penggunaan:
- Operasi gambar multidimensi
- Memecahkan masalah persamaan diferensial dan transformasi Fourier
- Optimalisasi algoritma
- Aljabar linear
4. Pandas
Pandas (Python data analysis) adalah library yang harus ada dalam lifecycle data science. Library ini adalah library Python yang paling populer dan banyak digunakan untuk data science, bersama dengan NumPy di matplotlib.
Dengan sekitar 17.000 komentar di GitHub dan komunitas aktif yang besar dengan 1.200 kontributor, library ini banyak digunakan untuk analisis dan pembersihan data. Pandas menyediakan struktur data yang cepat dan fleksibel, seperti data frame CD, yang dirancang untuk bekerja dengan data terstruktur secara sangat cepat dan intuitif.
Fitur:
- Sintaks yang fasih dan kaya fungsionalitas sehingga memberi Kita kebebasan untuk menangani data yang hilang
- Memungkinkan Kita membuat fungsi dan menjalankannya di serangkaian data
- Abstraksi tingkat tinggi
- Berisi struktur data tingkat tinggi dan alat untuk manipulasi
Pengaplikasian:
- Konversi dan cleansing data yang umum
- Proses ETL (ekstract, transform, load) digunakan untuk transformasi data dan penyimpanan data, karena memiliki dukungan yang sangat baik untuk memuat file CSV ke dalam format bingkai datanya
- Digunakan dalam berbagai bidang akademik dan komersial, termasuk statistik, keuangan, dan ilmu saraf
- Mempunyai fungsionalitas Time-series yang spesifik, seperti date range generation, moving window, regresi linier, dan date shifting
5. TensorFlow
TensorFlow adalah library untuk komputasi numerik berkinerja tinggi dengan sekitar 35.000 komentar dan memiliki komunitas yang besar dengan sekitar 1.500 kontributor. Library ini digunakan di berbagai bidang ilmiah.
TensorFlow adalah kerangka kerja untuk mendefinisikan dan menjalankan komputasi dengan melibatkan tensor yang merupakan sebagian objek komputasi yang telah ditentukan hingga akhirnya menghasilkan sesuatu yang bernilai.
Fitur:
- Visualisasi grafik komputasi yang lebih baik
- Mengurangi error sebesar 50 hingga 60 persen dalam neural machine learning
- Komputasi paralel untuk menjalankan model yang kompleks
- Manajemen library terbaik yang didukung oleh Google
- Pembaruan yang lebih cepat dan rilis baru yang sering untuk memberi Kita fitur terbaru
Penggunaan TensorFlow:
- Speech and image recognition
- Aplikasi berbasis teks
- Time-series analisis
- Deteksi video
6. PyBrain
PyBrain merupakan library Python untuk data science yang berfokus pada algoritma fleksibel dan mudah digunakan untuk tugas-tugas machine learning dan berbagai lingkungan yang telah ditentukan untuk menguji dan membandingkan algoritme.
Library ini populer karena fleksibilitas dan algoritma untuk penelitian state-of-the-art. Sebagian besar masalah saat ini berhubungan dengan keadaan lanjutan dan ruang tindakan, fungsi approximators seperti jaringan saraf harus digunakan untuk mengatasi dimensi besar. PyBrain dibangun di sekitar jaringan saraf di kernel dan semua metode pelatihan menerima jaringan saraf sebagai contoh yang harus dilatih. Hal ini menjadikan PyBrain alat yang kuat untuk tugas-tugas nyata.
Dari berbagai sumber
&nbsp; <div id="721e049e9903c3a740c4902878c99923"></div> <script async src="//click.advertnative.com/loading/?handle=6111"></div> <div class="post-components"> </div> </div> <aside class="sidebar tie-col-md-4 tie-col-xs-12 normal-side is-sticky" aria-label="Primary Sidebar"> <div class="theiaStickySidebar"> <div id="block-2" class="container-wrapper widget widget_block"><script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-2871313978430907" crossorigin="anonymous">