Tableau as a Tools for Data Visualisation

Tableau as a Tools for Data Visualisation

Visualisasi data adalah proses representasi data secara grafis untuk memudahkan pemahaman, analisis, dan pengambilan keputusan. Tableau adalah salah satu tools populer yang digunakan untuk membuat visualisasi data interaktif dan menarik. Meskipun Tableau memiliki kemampuan visualisasi yang kuat, integrasi dengan Python dapat memperluas fungsionalitasnya, seperti :

  • Preprocessing data sebelum divisualisasikan di Tableau.

  • Otomatisasi pembuatan laporan.

  • Analisis statistik yang lebih mendalam sebelum visualisasi.

Dalam materi ini, kita akan mempelajari :

  1. Dasar-dasar Tableau dan integrasinya dengan Python.

  2. Cara mengekspor data dari Python ke Tableau.

  3. Contoh visualisasi sederhana menggunakan Python sebelum diproses di Tableau.

Persiapan Data dengan Python untuk Tableau

Sebelum membuat visualisasi di Tableau, kita perlu mempersiapkan data terlebih dahulu menggunakan Python. Beberapa library yang berguna :

  • Pandas untuk manipulasi data.

  • Matplotlib/Seaborn untuk visualisasi awal.

  • Tableau Hyper API untuk ekspor data ke format .hyper yang kompatibel dengan Tableau.

Contoh 1 : Load dan Cleaning Data

python
import pandas as pd

# Load dataset contoh
data = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv")

# Membersihkan data (handling missing values)
data['age'] = data['age'].fillna(data['age'].median())
data['embarked'] = data['embarked'].fillna(data['embarked'].mode()[0])

# Simpan ke CSV untuk diimpor ke Tableau
data.to_csv("titanic_cleaned.csv", index=False)

Contoh 2 : Ekspor Data ke Format Hyper (Tableau)

Tableau mendukung format .hyper untuk data yang lebih efisien. Kita bisa menggunakan Tableau Hyper API untuk membuat file .hyper dari Python.

python
from tableauhyperapi import HyperProcess, Connection, TableDefinition, SqlType, escape_string_literal

# Membuat file .hyper baru
with HyperProcess(telemetry=Telemetry.SEND_USAGE_DATA_TO_TABLEAU) as hyper:
    with Connection(hyper.endpoint, "data.hyper", create=True) as connection:
        # Mendefinisikan skema tabel
        table_def = TableDefinition(
            table_name="TitanicData",
            columns=[
                TableDefinition.Column("survived", SqlType.int()),
                TableDefinition.Column("pclass", SqlType.int()),
                TableDefinition.Column("sex", SqlType.text()),
                TableDefinition.Column("age", SqlType.double()),
            ]
        )
        
        # Membuat tabel
        connection.catalog.create_table(table_def)
        
        # Memasukkan data dari DataFrame Pandas
        for _, row in data.iterrows():
            connection.execute_command(
                f"INSERT INTO TitanicData (survived, pclass, sex, age) VALUES "
                f"({row['survived']}, {row['pclass']}, {escape_string_literal(row['sex'])}, {row['age']})"
            )

Visualisasi Data di Tableau

Setelah data siap, kita bisa mengimpornya ke Tableau untuk visualisasi yang lebih interaktif. Berikut contoh visualisasi yang umum :

  1. Bar Chart (Perbandingan kategori)

  2. Scatter Plot (Hubungan dua variabel numerik)

  3. Dashboard Interaktif (Gabungan beberapa visualisasi)

Contoh 3 : Membuat Visualisasi dengan Python (Seaborn) Sebelum Tableau

Kita bisa menggunakan Python untuk eksplorasi awal sebelum menggunakan Tableau.

python
import seaborn as sns
import matplotlib.pyplot as plt

# Contoh visualisasi: Distribusi Usia Penumpang Titanic
plt.figure(figsize=(10, 6))
sns.histplot(data['age'], bins=30, kde=True)
plt.title("Distribusi Usia Penumpang Titanic")
plt.xlabel("Usia")
plt.ylabel("Frekuensi")
plt.show()

Integrasi Python dengan Tableau

Tableau mendukung integrasi dengan Python melalui Tableau Python Server (TabPy) atau Scripting dengan R/Python di Tableau Prep.

Contoh 4 : Menggunakan Python di Tableau dengan TabPy

  1. Install TabPy :

    pip install tabpy
  2. Jalankan TabPy Server :

    tabpy
  3. Gunakan Python Script di Tableau :

    • Buka Tableau > Help > Settings and Performance > Manage Analytics Extension.

    • Pilih TabPy, masukkan localhost dan port 9004.

    • Buat calculated field di Tableau dengan script Python :

      SCRIPT_INT("
      import pandas as pd
      return [x * 2 for x in _arg1]
      ", SUM([nilai]))

Kelebihan dan Kekurangan Tableau + Python

Kelebihan Kekurangan
Visualisasi interaktif lebih mudah Perlu belajar dua tools sekaligus
Dukungan analisis statistik dari Python Integrasi memerlukan setup tambahan
Cocok untuk big data dengan Hyper API Tidak semua fungsi Python didukung

Kesimpulan

  • Tableau adalah alat visualisasi data yang powerful.

  • Python dapat digunakan untuk persiapan dataanalisis tambahan, dan otomatisasi sebelum visualisasi di Tableau.

  • Integrasi Tableau + Python memungkinkan analisis yang lebih mendalam dan fleksibel.

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *