Data Cleanup : Finding Outliers

Data Cleanup : Finding Outliers

Konsep Dasar Outlier Outlier adalah observasi yang secara signifikan berbeda dari data lainnya dalam dataset. Outlier dapat : Mewakili variasi alami dalam data Menunjukkan kesalahan pengukuran atau input Mengindikasikan kejadian…
Data Cleanup : Removing Duplicates

Data Cleanup : Removing Duplicates

Konsep Dasar Duplikasi Data 1 Definisi dan Jenis Duplikat Duplikat data terjadi ketika terdapat record yang identik atau hampir sama dalam dataset. Terdapat dua jenis utama: Exact Duplicates: Record yang…
Data Cleanup : Handling Missing Data

Data Cleanup : Handling Missing Data

Pengertian Missing Data Missing data adalah kondisi ketika dataset memiliki nilai yang hilang atau tidak tercatat. Nilai ini biasanya direpresentasikan sebagai: NaN (Not a Number) None (Python) NA (R/statistik) Nilai kosong ("", 0, atau -999)…
Data Collection – Web Scraping

Data Collection – Web Scraping

Konsep Dasar Web Scraping Web scraping adalah teknik ekstraksi data otomatis dari website dengan cara: Mengunduh konten halaman web Menganalisis struktur HTML/XML Mengekstrak informasi spesifik Menyimpan data dalam format terstruktur…
Data Collection – APIs

Data Collection – APIs

Pengertian API API (Application Programming Interface) adalah antarmuka yang memungkinkan komunikasi antara sistem berbeda. Dalam konteks pengumpulan data, API menyediakan akses terstruktur ke data dari sumber eksternal seperti: Platform media…