DATA SCIENCE 8_MIN_READ LEVEL: ADVANCED

Data Analytics Lagi Tren, Tapi Data Kita Sudah Layak Diolah Belum?

Kusuma Dewangga // INSIGHT // DIPUBLIKASI 2026.02.24

ARTICLE INTEGRITY

RETA DATE: ART-8-K

Language: Data Science

License: MIT

Bagikan: WhatsApp Twitter
Data Analytics Lagi Tren, Tapi Data Kita Sudah Layak Diolah Belum?
Fig: Data Analytics Lagi Tren, Tapi Data Kita Sudah Layak Diolah Belum?

Semua orang sekarang demam data analytics—beli tools mahal, rekrut data scientist, bikin dashboard cantik. Tapi jarang yang sadar: data kualitas sampah, hasil analisanya sampah. Prinsip Garbage In, Garbage Out ini udah ada sejak 1963 dan masih relevan sampai sekarang. Penelitian terbaru bahkan menunjukkan: lebih banyak data justru bisa bikin model machine learning makin buruk kalau datanya nggak dipilih dengan baik. Artikel ini mengajak mundur selangkah—ngecek ulang apakah data kita udah layak dianalisis, atau masih berantakan. Sebelum FOMO analytics, pastikan data lo akurat, lengkap, konsisten, dan punya pemilik yang jelas. Karena percayalah: lebih baik telat analytics tapi data bener, daripada cepet analytics tapi data sampah.

Jangan Ikut-ikutan Tren

Beberapa waktu terakhir, saya sering lihat fenomena yang cukup bikin waswas. Banyak perusahaan, mulai dari startup sampai perusahaan besar, mendadak keranjingan data analytics. Semua pengin punya dashboard canggih, semua pengin pakai machine learning, semua ngomong soal “data-driven decision making”. Jabatan Chief Data Officer muncul tiba-tiba. Software analytics dibeli mahal-mahal. Tim data science direkrut dengan gaji fantastis.

Masalahnya, begitu saya tanya, “Data-nya sendiri sudah siap belum?”
Jawabannya sering bikin geleng-geleng kepala.

“Nanti kan bisa dibersihin sama tim data science.”
“Yang penting kita punya dashboard dulu, biar kelihatan keren.”
“Pokoknya harus pakai AI, soalnya kompetitor sudah mulai.”

Nah, di sinilah masalahnya. Ini contoh nyata FOMO (Fear of Missing Out) di dunia data analytics. Semua takut ketinggalan tren, takut dianggap nggak update, takut kalah cepat dari pesaing. Tapi satu hal penting sering dilupakan:
kalau kualitas datanya buruk, hasil analisisnya juga nggak akan jauh beda, tetap menyesatkan.


Akar Masalah: FOMO Bikin Lupa Fundamentals

Dari obrolan dengan banyak klien, saya lihat pola yang sama:

  1. loncat ke  analytics, lompati data quality

  2. Belanja tools, lupa bersihin data lama

  3. Kejar tren, lupa fundamentals

Padahal, ada prinsip lama yang nggak bisa ditawar: Garbage In, Garbage Out. Istilah ini udah ada sejak 1963 . Lima puluh tahun lebih, dan masih relevan sampai sekarang. Bahkan penelitian terbaru dari Geiger et al. (2021) menegaskan: machine learning canggih sekalipun nggak akan berguna kalau data training-nya nggak reliable .

Penelitian dari NIH (2024) bahkan menemukan bahwa data yang menyesatkan atau tidak perlu bisa berdampak besar pada kesehatan dan akurasi model Machine Learning . Lebih data tidak selalu lebih baik. Bahkan dalam beberapa kasus, lebih data justru bikin performa model makin buruk—fenomena yang disebut sample-wise double descent .

Jadi kalau data kamu masih berantakan, mending berhenti dulu. Jangan nambah data terus, nanti modelnya makin kacau.


 

Teori: Framework Kualitas Data (Bukan Sekadar Wacana)

Kalau masih merasa urusan kualitas data itu soal selera atau insting, berarti masalahnya bukan di tools—tapi di cara berpikir. Ilmu tentang data quality sudah mapan dan punya standar. Artinya, perusahaan yang masih “coba-coba” sebenarnya sedang mengabaikan praktik yang sudah jelas-jelas ada rujukannya.

DAMA International (DAMA-DMBOK)

DAMA International sejak lama menyusun framework manajemen data yang komprehensif. Mereka membagi data management ke 11 knowledge areas, termasuk Data Quality dan Data Governance.
Pesannya keras dan jelas: kualitas data itu bukan kerjaan sambilan. Kalau masih dianggap tugas tambahan yang bisa “diberesin nanti”, berarti organisasinya belum siap ngomong soal data-driven.

Dimensi Kualitas Data

Menurut Monte Carlo Data (2025), kualitas data bisa diuji lewat beberapa dimensi utama:

  • Accuracy: Data lo beneran mencerminkan realita, atau cuma angka asal masuk?

  • Completeness: Berapa banyak kolom kosong yang selama ini pura-pura dianggap normal?

  • Consistency: Data dari sistem A dan B masih saling bantah-bantahan?

  • Timeliness: Ini data terbaru, atau laporan masa lalu yang dikira insight?

  • Validity: Sudah sesuai aturan bisnis, atau masih banyak format ngawur?

  • Uniqueness: Data pelanggan satu orang muncul berapa kali?

Enam pertanyaan ini kelihatannya simpel. Tapi kalau mayoritas jawabannya masih “nggak tahu” atau “ya emang gitu dari dulu”, satu kesimpulannya:
analytics lo berdiri di atas fondasi rapuh.

 

DMBOK dan DMM: Bahkan Raksasa Pun Nggak Asal Ngebut

Penelitian dari Universitas Padova (2022) tentang penerapan Data Management Maturity (DMM) di Michelin nunjukin fakta yang sering diabaikan:
perusahaan besar pun nggak langsung beli tools atau rekrut data scientist duluan. Mereka ukur dulu tingkat kematangan data management-nya. Kalau perusahaan sekelas Michelin aja perlu maturity assessment, pertanyaannya sederhana:
kenapa organisasi lain merasa bisa lompat langsung ke AI dan dashboard?

Framework seperti DAMA-DMBOK dan DMM bukan cuma cocok buat korporasi raksasa. Prinsipnya bisa dipakai di organisasi kecil sekalipun.Masalahnya bukan bisa atau tidak, tetapi masalahnya mau serius membangun fondasi, atau cuma ingin kelihatan modern.


 

Risiko Jika Kualitas Data Dianggap Sepele

Saya merangkum poin ini dari berbagai riset dan pengalaman di lapangan. Kesimpulannya sederhana:

Mengabaikan data quality bukan kesalahan teknis, tapi kesalahan strategis.

1. Keputusan Bisnis Bisa Menyesatkan

Riset dari Monte Carlo Data (2025) menyebutkan bahwa bad data sudah terbukti merusak keputusan, membuat pelanggan kecewa, dan menggerus uang perusahaan, bahkan sebelum disadari. Artinya, banyak organisasi merasa sudah “data-driven”, padahal arah keputusannya justru dikendalikan oleh data yang salah.

2. Model Machine Learning Bisa Salah Didik

Penelitian dari National Institutes of Health (2024) menemukan fakta yang sering diabaikan:
lebih banyak data tidak selalu berarti lebih baik. Kalau data yang dimasukkan tidak diseleksi dengan benar, model justru bisa makin buruk. Fenomena double descent menunjukkan bahwa algoritma yang seharusnya makin pintar bisa menjadi makin kacau karena belajar dari data yang menyesatkan.

3. Reputasi Bisa Hancur Seketika

Dashboard boleh terlihat canggih. Tapi kalau angkanya salah, dampaknya lebih memalukan daripada tidak punya dashboard sama sekali. Rapat direksi bisa berubah menjadi ruang interogasi, dan tim data menjadi sasaran pertama ketika angka-angka tidak bisa dipertanggungjawabkan.

4. Biaya Membengkak Tanpa Hasil

Tools analytics mahal.
Tim data science mahal.
Cloud storage mahal.

Namun kalau fondasi datanya buruk, semua itu berubah jadi biaya sia-sia.
Daripada menghabiskan anggaran untuk teknologi canggih, jauh lebih rasional jika investasi pertama dilakukan pada perbaikan kualitas data.

5. Risiko Pelanggaran Regulasi

Regulasi seperti General Data Protection Regulation di Eropa atau Undang-Undang Perlindungan Data Pribadi di Indonesia menuntut standar tinggi dalam pengelolaan dan keakuratan data. Studi sistematis yang terdokumentasi di Zenodo (2025) menunjukkan bahwa data governance yang baik adalah prasyarat utama kepatuhan regulasi. Kalau data kamu berantakan, persoalan hukum bukan lagi soal kalau,  tapi soal kapan.

 


Data Governance Maturity: Ukur Dulu, Baru Lompat

Model DG2M (Data Governance Maturity Model) yang dipublikasikan lewat Zenodo (2025) dibuat untuk satu tujuan:
mengecek apakah organisasi benar-benar siap mengelola data, atau cuma sok siap . nam hal yang dinilai:

  • Kebijakan & prosedur

  • Peran & tanggung jawab

  • Kualitas data

  • Keamanan & privasi

  • Arsitektur & integrasi

  • Keselarasan strategi

Mulai dari yang paling dasar:
apakah data sudah terdokumentasi?
apakah ada yang bertanggung jawab?
apakah ada standar kualitas?

Kalau tiga pertanyaan ini saja belum bisa dijawab, bicara analytics itu prematur.


Jangan Melompat, Jalan Dulu

Untuk kamu yang sedang FOMO data analytics, lakukan ini dulu:

  1. Inventarisasi data
    Kalau tidak tahu punya data apa dan di mana, berarti kamu tidak mengelola apa pun.

  2. Audit kualitas
    Uji: akurat, lengkap, konsisten, tepat waktu, valid, unik.
    Kalau gagal, catat. Jangan sok perbaiki sebelum tahu rusaknya di mana.

  3. Tetapkan standar minimum
    Transaksi harus punya ID.
    Nama pelanggan tidak boleh kosong.
    Tanggal harus masuk akal.
    Dasar. Tapi sering tidak ada.

  4. Tentukan owner
    Setiap data harus punya satu penanggung jawab.
    Kalau semua “punya bersama”, artinya tidak ada yang punya.

  5. Bersihkan yang paling penting
    Mulai dari data pelanggan dan transaksi.
    Bukan semuanya sekaligus.

  6. Baru beli tools
    Kalau data masih kacau, tools canggih cuma bikin kesalahan terlihat lebih profesional.


Berani Ngaku Belum Siap

Riset dari NHS England (2025) menegaskan: self-assessment adalah langkah pertama.

Tanya ke diri sendiri:

  • Data kamu dobel atau tidak?

  • Data transaksi kamu lengkap atau bolong?

  • Format tanggal kamu konsisten atau campur aduk?

  • Ditanya “penjualan kemarin berapa?”, jawab yakin atau ragu?

Kalau jawabannya masih ragu, berhenti dulu. Karena faktanya:

lebih baik telat analytics tapi datanya benar,
daripada cepat analytics tapi datanya salah.

 

Referensi:

  1. Monte Carlo Data. (2025). Data Quality Framework Guide: Components to Implementation 

  2. Zenodo. (2025). *Data Governance Maturity Models: A Systematic Review and a Multi-Dimensional Framework Proposal (DG2M)* 

  3. National Institutes of Health (NIH). (2024). Information FOMO: The Unhealthy Fear of Missing Out on Information—A Method for Removing Misleading Data for Healthier Models 

  4. IEEE Xplore. (2015). Data quality issues in big data [kutipan tentang "garbage in, garbage out" sejak 1963] 

  5. Geiger, R. S., et al. (2021). "Garbage In, Garbage Out" Revisited: What Do Machine Learning Application Papers Report About Human-Labeled Training Data? 

  6. DAMA International. (2025). DAMA-DMBOK Framework [via citation 6]

  7. NHS England Digital. (2025). Data Quality Framework for Providers 

  8. Università di Padova. (2022). Evaluation of data management maturity level and how to improve it: Use case Michelin 

  9. Repositório Universidade Nova de Lisboa. (2025). Assessing the Level of Data Governance Implementation in a Portuguese Insurance Company using DAMA DMBOK Framework 

BERLANGGANAN

Dapatkan Artikel Terbaru

Ingin dapat update artikel terbaru? Hubungi saya lewat form kontak.

KE HALAMAN KONTAK

Artikel Terkait

LIHAT SEMUA ARTIKEL