Visualisasi data adalah proses representasi data secara grafis untuk memudahkan pemahaman, analisis, dan pengambilan keputusan. Tableau adalah salah satu tools populer yang digunakan untuk membuat visualisasi data interaktif dan menarik. Meskipun Tableau memiliki kemampuan visualisasi yang kuat, integrasi dengan Python dapat memperluas fungsionalitasnya, seperti :
-
Preprocessing data sebelum divisualisasikan di Tableau.
-
Otomatisasi pembuatan laporan.
-
Analisis statistik yang lebih mendalam sebelum visualisasi.
Dalam materi ini, kita akan mempelajari :
-
Dasar-dasar Tableau dan integrasinya dengan Python.
-
Cara mengekspor data dari Python ke Tableau.
-
Contoh visualisasi sederhana menggunakan Python sebelum diproses di Tableau.
Persiapan Data dengan Python untuk Tableau
Sebelum membuat visualisasi di Tableau, kita perlu mempersiapkan data terlebih dahulu menggunakan Python. Beberapa library yang berguna :
-
Pandas untuk manipulasi data.
-
Matplotlib/Seaborn untuk visualisasi awal.
-
Tableau Hyper API untuk ekspor data ke format
.hyper
yang kompatibel dengan Tableau.
Contoh 1 : Load dan Cleaning Data
import pandas as pd # Load dataset contoh data = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv") # Membersihkan data (handling missing values) data['age'] = data['age'].fillna(data['age'].median()) data['embarked'] = data['embarked'].fillna(data['embarked'].mode()[0]) # Simpan ke CSV untuk diimpor ke Tableau data.to_csv("titanic_cleaned.csv", index=False)
Contoh 2 : Ekspor Data ke Format Hyper (Tableau)
Tableau mendukung format .hyper
untuk data yang lebih efisien. Kita bisa menggunakan Tableau Hyper API untuk membuat file .hyper
dari Python.
from tableauhyperapi import HyperProcess, Connection, TableDefinition, SqlType, escape_string_literal # Membuat file .hyper baru with HyperProcess(telemetry=Telemetry.SEND_USAGE_DATA_TO_TABLEAU) as hyper: with Connection(hyper.endpoint, "data.hyper", create=True) as connection: # Mendefinisikan skema tabel table_def = TableDefinition( table_name="TitanicData", columns=[ TableDefinition.Column("survived", SqlType.int()), TableDefinition.Column("pclass", SqlType.int()), TableDefinition.Column("sex", SqlType.text()), TableDefinition.Column("age", SqlType.double()), ] ) # Membuat tabel connection.catalog.create_table(table_def) # Memasukkan data dari DataFrame Pandas for _, row in data.iterrows(): connection.execute_command( f"INSERT INTO TitanicData (survived, pclass, sex, age) VALUES " f"({row['survived']}, {row['pclass']}, {escape_string_literal(row['sex'])}, {row['age']})" )
Visualisasi Data di Tableau
Setelah data siap, kita bisa mengimpornya ke Tableau untuk visualisasi yang lebih interaktif. Berikut contoh visualisasi yang umum :
-
Bar Chart (Perbandingan kategori)
-
Scatter Plot (Hubungan dua variabel numerik)
-
Dashboard Interaktif (Gabungan beberapa visualisasi)
Contoh 3 : Membuat Visualisasi dengan Python (Seaborn) Sebelum Tableau
Kita bisa menggunakan Python untuk eksplorasi awal sebelum menggunakan Tableau.
import seaborn as sns import matplotlib.pyplot as plt # Contoh visualisasi: Distribusi Usia Penumpang Titanic plt.figure(figsize=(10, 6)) sns.histplot(data['age'], bins=30, kde=True) plt.title("Distribusi Usia Penumpang Titanic") plt.xlabel("Usia") plt.ylabel("Frekuensi") plt.show()
Integrasi Python dengan Tableau
Tableau mendukung integrasi dengan Python melalui Tableau Python Server (TabPy) atau Scripting dengan R/Python di Tableau Prep.
Contoh 4 : Menggunakan Python di Tableau dengan TabPy
-
Install TabPy :
pip install tabpy
-
Jalankan TabPy Server :
tabpy
-
Gunakan Python Script di Tableau :
-
Buka Tableau > Help > Settings and Performance > Manage Analytics Extension.
-
Pilih TabPy, masukkan
localhost
dan port9004
. -
Buat calculated field di Tableau dengan script Python :
SCRIPT_INT(" import pandas as pd return [x * 2 for x in _arg1] ", SUM([nilai]))
-
Kelebihan dan Kekurangan Tableau + Python
Kelebihan | Kekurangan |
---|---|
Visualisasi interaktif lebih mudah | Perlu belajar dua tools sekaligus |
Dukungan analisis statistik dari Python | Integrasi memerlukan setup tambahan |
Cocok untuk big data dengan Hyper API | Tidak semua fungsi Python didukung |
Kesimpulan
-
Tableau adalah alat visualisasi data yang powerful.
-
Python dapat digunakan untuk persiapan data, analisis tambahan, dan otomatisasi sebelum visualisasi di Tableau.
-
Integrasi Tableau + Python memungkinkan analisis yang lebih mendalam dan fleksibel.