Pengertian Descriptive Analytics
Descriptive Analytics adalah jenis analisis data yang bertujuan untuk merangkum dan menggambarkan data historis guna memahami apa yang telah terjadi di masa lalu. Analisis ini melibatkan teknik seperti agregasi, visualisasi, dan statistik deskriptif untuk menyajikan informasi dalam bentuk yang mudah dipahami.
Langkah-Langkah dalam Proyek Descriptive Analytics
a. Mengumpulkan Data
- Data dapat dikumpulkan dari berbagai sumber seperti database, file CSV, atau API.
- Pastikan data yang dikumpulkan relevan dengan tujuan analisis.
b. Membersihkan Data
- Menghapus data yang tidak lengkap, duplikat, atau tidak relevan.
- Mengatasi missing value dan outliers.
c. Menganalisis Data
- Menggunakan statistik deskriptif seperti mean, median, modus, dan standar deviasi.
- Membuat visualisasi data untuk memahami pola dan tren.
d. Membuat Laporan
- Menyajikan hasil analisis dalam bentuk laporan atau dashboard yang mudah dipahami.
Contoh Proyek Descriptive Analytics
Studi Kasus: Analisis Data Penjualan Toko Online
Kita akan menganalisis data penjualan toko online untuk memahami performa penjualan selama setahun terakhir.
Implementasi dengan Python
a. Mengimpor Library yang Dibutuhkan
import pandas as pd import matplotlib.pyplot as plt
b. Mengumpulkan dan Membersihkan Data
# Contoh data penjualan data = { 'Bulan': ['Jan', 'Feb', 'Mar', 'Apr', 'Mei', 'Jun', 'Jul', 'Agu', 'Sep', 'Okt', 'Nov', 'Des'], 'Penjualan (juta)': [150, 200, 180, 220, 250, 300, 280, 320, 350, 400, 380, 420] } # Membuat DataFrame df = pd.DataFrame(data) # Menampilkan data print("Data Penjualan Toko Online:") print(df)
Output:
Data Penjualan Toko Online: Bulan Penjualan (juta) 0 Jan 150 1 Feb 200 2 Mar 180 3 Apr 220 4 Mei 250 5 Jun 300 6 Jul 280 7 Agu 320 8 Sep 350 9 Okt 400 10 Nov 380 11 Des 420
c. Analisis Statistik Deskriptif
# Menghitung statistik deskriptif rata_rata = df['Penjualan (juta)'].mean() median = df['Penjualan (juta)'].median() std_dev = df['Penjualan (juta)'].std() total_penjualan = df['Penjualan (juta)'].sum() print("\nStatistik Deskriptif:") print("Rata-rata Penjualan:", rata_rata) print("Median Penjualan:", median) print("Standar Deviasi Penjualan:", std_dev) print("Total Penjualan Tahun Ini:", total_penjualan)
Output:
Statistik Deskriptif: Rata-rata Penjualan: 290.0 Median Penjualan: 290.0 Standar Deviasi Penjualan: 89.44271909999159 Total Penjualan Tahun Ini: 3480
d. Visualisasi Data
# Membuat grafik garis untuk tren penjualan plt.figure(figsize=(10, 6)) plt.plot(df['Bulan'], df['Penjualan (juta)'], marker='o', color='b', label='Penjualan') plt.title('Tren Penjualan Toko Online (2023)') plt.xlabel('Bulan') plt.ylabel('Penjualan (dalam juta)') plt.grid(True) plt.legend() plt.show()
Output:
Sebuah grafik garis yang menunjukkan tren penjualan bulanan.
e. Membuat Laporan
Berdasarkan analisis di atas, kita dapat membuat laporan sederhana:
- Rata-rata penjualan bulanan: 290 juta
- Total penjualan tahunan: 3.48 miliar
- Tren penjualan: Penjualan cenderung meningkat setiap bulan, dengan puncak penjualan terjadi pada bulan Desember.
Latihan
- Cari dataset publik (misalnya dari Kaggle) yang berisi data penjualan, keuangan, atau lainnya.
- Lakukan analisis deskriptif menggunakan Python:
- Hitung statistik deskriptif (mean, median, std dev, dll.).
- Buat visualisasi data (grafik garis, bar chart, dll.).
- Buat laporan singkat yang menyajikan temuan Anda.
Kesimpulan
Descriptive Analytics adalah langkah pertama dalam memahami data. Dengan teknik yang tepat, kita dapat merangkum dan memvisualisasikan data untuk mendapatkan wawasan yang berguna bagi pengambilan keputusan. Proyek ini menunjukkan bagaimana Python dapat digunakan untuk melakukan analisis deskriptif dengan mudah dan efektif.