Cara menggunakan pandas to google sheets

I uploaded a file to Google spreadsheets (to make a publically accessible example IPython Notebook, with data) I was using the file in it's native form could be read into a Pandas Dataframe. So now I use the following code to read the spreadsheet, works fine but just comes in as string,, and I'm not having any luck trying to get it back into a dataframe (you can get the data)

Table of Contents

  • 2. Membaca File Menggunakan Head()
  • 3. Melakukan Akses Data dari Kolom
  • 4. Melakukan Akses Data dari Baris
  • 5. Menampilkan Data Baris dan Kolom Tertentu
  • 6. Menampilkan Data dalam Range Tertentu

import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content

The data ends up looking like: (1st row headers)

',City,region,Res_Comm,mkt_type,Quradate,National_exp,Alabama_exp,Sales_exp,Inventory_exp,Price_exp,Credit_exp\n0,Dothan,South_Central-Montgomery-Auburn-Wiregrass-Dothan,Residential,Rural,1/15/2010,2,2,3,2,3,3\n10,Foley,South_Mobile-Baldwin,Residential,Suburban_Urban,1/15/2010,4,4,4,4,4,3\n12,Birmingham,North_Central-Birmingham-Tuscaloosa-Anniston,Commercial,Suburban_Urban,1/15/2010,2,2,3,2,2,3\n

The native pandas code that brings in the disk resident file looks like:

df = pd.io.parsers.read_csv('/home/tom/Dropbox/Projects/annonallanswerswithmaster1012013.csv',index_col=0,parse_dates=['Quradate'])

A "clean" solution would be helpful to many to provide an easy way to share datasets for Pandas use! I tried a bunch of alternative with no success and I'm pretty sure I'm missing something obvious again.

Just a Update note The new Google spreadsheet has a different URL pattern Just use this in place of the URL in the above example and or the below answer and you should be fine here is an example:

https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id

see solution below from @Max Ghenis which just used pd.read_csv, no need for StringIO or requests...

Seperti yang dapat kita lihat, data tersebut dipisahkan oleh koma, jadi ini termasuk jenis file CSV (Comma Separated Values) sehingga kita dapat menggunakan method read_csv() untuk import data.

Baca juga: Pengenalan Library Python Untuk Data Science

Di Python, untuk mengimport data ke jupyter notebook cukup mudah yaitu hanya dengan tiga langkah.

  1. Import pandas
  2. Definisikan variabel untuk menyimpan path url atau file dataset
  3. Gunakan method read_csv untuk mengimport data
import pandas as pd

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/autos/imports-85.data"
df = pd.read_csv(url)

Jika menggunakan file dari komputer lokal, kita harus menentukan lokasi file tersebut tersimpan.

import pandas as pd

path = "dataset/imports-85.data"
df = pd.read_csv(path)

Kita bisa melihat dataset tersebut dalam bentuk dataframe dengan method head() untk melihat data teratas.

df.head()

Atau tail() untuk melihat data terbawah.

df.tail()

Default dari method head() dan tail() di atas adalah menampilkan 5 baris data teratas ataupun terbawah. Namun, jika kita ingin menentukan jumlah yang spesifik bisa dilakukan dengan memberikan sebuah angka di dalam tanda kurung.

Misalnya :

df.head(10)

atau

df.tail(20)

Baca juga: Cara Mengecek Tipe dan Distribusi Data di Pandas Python

Method read_csv() mengasumsikan setiap data yang dibaca telah mengandung header, sehingga jika ternyata dataset tersebut belum mengandung header seperti dataset automobiles yang kita gunakan, maka otomatis baris pertama dataset tersebut akan dijadikan header seperti terlihat di bawah ini.

Cara menggunakan pandas to google sheets

Pengantar

Pandas merupakan salah satu library yang digunakan pada python yang digunakan untuk mengolah ataupu handling data seperti halnya kita mengelola data excel, baik itu merubah bentuk tabel, mencari data hilang dan lain sebagainya. Untuk informasi selengkapnya dapat dilihat website resminya https://pandas.pydata.org/

Dalam penjelasan tutorial kali ini kita akan menggunankan Google Colab sebagai text editor yang cukup praktis dan sangat mudah digunakan. Seluruh data yang dibahas dalam artikel ini akan di ringkas ke dalam file Google Colab dan dapat di download disini.

Pada bagian 1, kita akan mempelajari fitur-fitur dasar pada library Pandas yaitu membaca file, melakukan akses ke kolom dan baris, hingga menampilkan data pada kolom atau baris tertentu.

Library pandas dapat digunakan untuk membaca berbagai macam file seperti CSV, excel, dan lain-lain. Untuk sintaksnya adalah sebagai berikut:

a. Menggunakan file CSV yang diupload dari ekternal link

Dataset sudah sudah diupload menggunakan eksternal link “https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv” sehingga sintaks yang digunakan adalah sebagai berikut:

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print(csv_data)

Tampilan yang akan muncul adalah seperti ini:

b. Mengupload langsung dari Google Colab

Dataset yang kita miliki kita upload terlebih dahulu di Google Colab atau mengkoneksikannya langsung menggunakan Google Drive.

File yang sudah diupload langsung replace yang tadinya adalah https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv” menjadi “shopping_data.csv”

Untuk Excel file hampir sama dengan membaca CSV, untuk sintaksnya adalah sebagai berikut:

2. Membaca File Menggunakan Head()

Terkadang data yang harus di load sangat banyak. Untuk memastikan dataset yang kita punya terload, kita dapat menggunakan fungsi head(). Secara default, data yang akan ditampilkan sebanyak 5 data. Untuk prakteknya, bisa dituliskan kode dibawah ini:

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print(csv_data.head())

3. Melakukan Akses Data dari Kolom

Terkadang dataset yang kita miliki terdiri dari kolom yang sangat banyak. Pada Pandas, terdapat fitur yang dapat melihat semua kolom yang tersedia dan jenis data.

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print(csv_data.columns)

Selain itu, kita juga dapat memilih data apa saja yang ingin kita tampilkan.

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print(csv_data['Genre'])

4. Melakukan Akses Data dari Baris

Pandas juga dapat digunakan untuk mengakse baris. Terdapat fungsi .iloc[i] dimana [i] merupakan urutan baris yang akan ditampilkan untuk mengakses baris. [i] dimulai dari index 0 yang menunjukkan CustomerID urutan 1 pada dataset contoh yang kita olah ini.

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print(csv_data.iloc[0])

5. Menampilkan Data Baris dan Kolom Tertentu

Kita juga dapat menampilkan data baris dan kolom tertentu dengan menggabungkan fungsi-fungsi sebelumnya.

import pandas as pd
csv_data = pd.read_csv("https://storage.googleapis.com/dqlab-dataset/shopping_data.csv")
print(csv_data['Age'].iloc[1])

6. Menampilkan Data dalam Range Tertentu

Kita juga dapat menggunakan Pandas untuk mendapatkan data dalam range tertentu, misalnya kita ingin menampilkan hanya pada kolom “Age” pada baris 5 sd 10.

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print("Menampilkan data ke-5 sampai ke-9 :")
print(csv_data['Age'].iloc[5:10])

Atau semua data kolom kita tampilkan dengan sintaks berikut

import pandas as pd
csv_data = pd.read_csv("https://uprolil.com/wp-content/uploads/2021/10/shopping_data.csv")
print("Menampilkan data ke 5 sampai kurang dari 10 dalam satu baris:")
print(csv_data.iloc[5:10])

Gimana masih mudah bukan?

Silahkan download file google colabnya disini.

Di bagian ke-2, akan dijelaskan bagaimana menampilkan statistik pada dataset yang kita miliki.