Apa yang harus diketahui pemasar tentang pembersihan data, pemodelan, dan tata kelola – Beragampengetahuan
Anda memiliki akses ke banyak data terkait pemasaran – mulai dari analisis web dan perilaku perjalanan pelanggan hingga analisis pesaing dan penggunaan produk.
Namun jika datanya tidak bersih, Anda tidak dapat membuka nilainya. Atau lebih buruk lagi, Anda bisa mengarahkan pemasaran Anda ke arah yang salah dan melihat hasil yang semakin berkurang.
James Hunt, konsultan utama di Vivanti, mengatakan pembersihan dan pemodelan data sangat penting untuk mengekstraksi nilai dari informasi dan memperoleh pengetahuan dan kebijaksanaan. Dalam ceramahnya di konferensi Analisis Pemasaran dan Ilmu Data, dia merinci mengapa hal ini diperlukan, dasar-dasar pembersihan data, serta peran tata kelola dan kemampuan observasi.
Contents
Apa itu pemodelan data?
Model data mengubah data menjadi sesuatu yang berguna, dan Anda perlu memahami pemodelan data sehingga Anda mengetahui opsi pembersihan terbaik. James menjelaskan bahwa pemodelan data melibatkan tiga bagian – lampiran, konteks, dan domain.
aditif Artinya Anda membiarkan mesin mencari cara untuk menormalkan data. Anda tidak perlu “memperbaiki” data secara manual, seperti menggunakan huruf kecil pada nama huruf kapital semua yang sporadis di spreadsheet Anda. Hal ini sebenarnya menghancurkan data karena, seperti yang dikatakan James, “Sebagai manusia, kita sangat buruk dalam melakukan hal yang sama berulang kali.”
konteks Atur data untuk menceritakan sebuah cerita. Anda tidak menambahkan informasi baru; Anda memperkirakan data yang ada. Misalnya, konteks transaksi penjualan dapat mencakup email pemasaran yang dilihat pembeli, konten media sosial yang berinteraksi dengan pembeli, dan produk lain yang mereka lihat.
bidang Adalah himpunan semua nilai data yang mungkin untuk suatu elemen tertentu. Ini bisa bersifat kualitatif dan kuantitatif. James menunjukkan lima jenis domain umum berikut:
- identitas — Nilai unik yang secara unik dan rahasia mengidentifikasi seseorang, seperti alamat email, nomor jaminan sosial, atau ID pelanggan
- nominatif — Identitas tambahan yang tidak cukup untuk berdiri sendiri, seperti nama lengkap atau nama produk seseorang
- rahasia —Grup yang menjangkau batas-batas yang berubah-ubah, seperti jenis pelanggan atau industri yang sering digunakan untuk segmentasi antrean
- mata uang — Mata uang yang dapat dibandingkan, diurutkan, dikumpulkan dan dipilah, seperti total pesanan atau harga satuan
- sementara — Titik atau rentang tanggal dan waktu, seperti tanggal pendaftaran, tanggal pembelian terakhir, atau periode loyalitas
Dengan pemahaman dasar tentang pemodelan, Anda dapat mempelajari cara membersihkan data Anda.
Jenis pembersihan data apa yang ada?
James merinci tiga jenis pembersihan data – pemetaan mekanis, eksplisit, serta pola dan aturan:
Dan Pembersihan mekanisdata dibersihkan tanpa mengubah arti informasi, seperti menormalkan kapitalisasi nama dan menghilangkan spasi yang tidak diperlukan. “Sebagai seorang data engineer, ini adalah hal-hal yang dapat saya lakukan sendiri dan tidak ada seorang pun yang akan marah,” kata James. “Tidak ada yang akan berkata, ‘Yah, kamu menghilangkan spasi dari namanya, jadi itu orang yang berbeda.'”
Pemetaan eksplisit Gunakan aktivitas yang disebut pengurangan kardinalitas untuk mengurangi jumlah nilai unik yang terkait dengan suatu atribut. Ini menyederhanakan kumpulan data dengan mengelompokkan nilai sambil mempertahankan informasi terkait. Kumpulan data ini lebih mudah dikelola dan dapat meningkatkan performa model.
Misalnya, kata James, mungkin bidang status pelanggan dimulai dengan dua nilai—aktif dan tidak aktif. Seiring waktu, bidang ini diperluas hingga mencakup jeda, penangguhan, dan opsi prospektif. Pembersihan peta secara eksplisit dapat mengubah status pelanggan “dijeda” menjadi nilai “aktif”.
Satu bersih pola dan aturan Identifikasi dan perbaiki ketidakkonsistenan, ketidakakuratan, atau kesalahan dalam data berdasarkan struktur yang dapat diidentifikasi (yaitu pola) dan batasan (yaitu aturan).
Skema standar berisi data seperti alamat email, string tanggal, dan nomor telepon. Penyimpangan dari struktur ini menunjukkan perlunya pembersihan data.
Aturan mengacu pada kondisi atau batasan logis. Jadi, misalnya, jika data moneter suatu kebijakan melebihi nilai maksimumnya, entri tersebut perlu dibersihkan.
Anda juga dapat menetapkan aturan dan pola untuk memetakan perjalanan pelanggan, kata James. Katakanlah sebuah merek tidak peduli berapa kali seseorang membuka dan mengklik emailnya. Sebaliknya, ini berkaitan dengan mengidentifikasi siapa yang cenderung membeli dari kampanye pemasaran email. Itu dapat membuat aturan untuk membersihkan data untuk mencapai tujuan tersebut.
Misalnya, semua email yang dikirim akan ditandai sebagai “E”, semua klik akan ditandai sebagai “C”, dan pesanan akan dikenali sebagai “O”. Aturan-aturan ini memperkecil data sehingga sangat berguna bagi merek dan tujuan pemasarannya.
Apa peran tata kelola dalam pembersihan data?
“Setiap kali Anda membersihkan data, Anda membuat keputusan. Anda memutuskan apa yang relevan; Anda memutuskan apa yang penting. Anda memutuskan apa yang harus disimpan dan apa yang akan ditampilkan,” kata James.
Anda harus mendokumentasikan keputusan pembersihan data ini di repositori internal, seperti spreadsheet, atau menggunakan sistem kontrol versi seperti Git open source.
Setiap keputusan harus menjawab empat pertanyaan berikut:
- Keputusan apa yang diambil?
- Kapan itu dibuat? Referensi pada titik waktu ini membantu analisis sejarah.
- Siapa yang membuat keputusan?
- Mengapa keputusan ini diambil? Hal ini membantu menginformasikan tindakan di masa depan. Misalnya, jika keputusan dibuat karena adanya pembaruan dari pemerintah, maka keputusan tersebut tidak dapat dibatalkan. Namun, kata James, jika keputusan tersebut diambil karena tim data menganggapnya sebagai pendekatan yang lebih baik, mengubah arah mungkin masih merupakan pilihan yang tepat.
Mari kita kembali ke contoh menciutkan kolom status pelanggan sehingga status “ditahan” dikelompokkan menjadi pelanggan “aktif”. Berikut cara mendokumentasikan keputusan tersebut:
“Pelanggan dalam ‘status jeda’ akan tetap dianggap sebagai pelanggan aktif mulai 22 Oktober 2024. Keputusan ini diambil oleh James Hunt karena analisis pemetaan menunjukkan bahwa mereka dapat dilayani dengan baik baik dalam status aktif atau tidak aktif. Evaluasi perilaku pelanggan.”
Manusia sangat penting dalam proses pemerintahan, kata James. Algoritme yang dihasilkan komputer dapat menyarankan langkah-langkah pembersihan data, namun manusia harus dilibatkan dalam meninjau saran tersebut dan menyetujui atau menolaknya.
Apa itu observabilitas?
Meskipun Anda menyiapkan aturan dan pola untuk memastikan data Anda bersih, beberapa data masih akan bertentangan dengan parameter ini. Daripada meneruskan data ini atau membersihkannya secara otomatis, Anda harus menerapkan kemampuan observasi, yang menurut James 10 kali lebih penting daripada tata kelola.
Metadata yang menunjukkan pembersihan data mungkin serupa dengan contoh untuk pelanggan James. Aturan pembersihan data menetapkan batas bawah ukuran kebijakan untuk menangkap data buruk. Hal ini berjalan dengan baik selama sekitar enam bulan sampai sebuah kebijakan masuk ke dalam sistem dengan batasan yang lebih rendah dari yang ditetapkan dalam peraturan.
James menandai catatan tersebut dan bertanya kepada pelanggan, “Apakah Anda ingin kami menyesuaikan batasnya?” Pelanggan menjawab ya, dan aturan data minimum diperbarui.
“Apa yang kami temukan dengan loop observabilitas adalah, ‘Data yang kami harapkan akan terlihat seperti ini. Tampilannya tidak akan seperti ini saat kami membersihkannya. Kami tidak bersedia mengambil keputusan ini (tanpa masukan dari pelanggan). Di sinilah letaknya observability akan Sesuatu yang dipersembahkan untuk Anda, kata James.
Dia menunjukkan bahwa menerapkan praktik observasi yang tepat dapat menghemat waktu berjam-jam, berhari-hari, berminggu-minggu, berbulan-bulan, dan banyak rasa malu.
Apakah Anda siap untuk pembersihan data?
Sekarang setelah Anda memahami pemodelan data, pembersihan, tata kelola, dan kemampuan observasi, Anda dapat menerapkannya pada pemasaran jika Anda:
- Integritas Data Kumpulan Data yang tidak asli atau sempurna
- Kumpulan data dengan sejumlah besar nilai unik (yaitu pengurangan kardinalitas membantu pemrosesan dan analisis)
Di mana Anda bisa menemukan data ini? Sumbernya bisa bermacam-macam, seperti:
- Platform manajemen hubungan pelanggan
- Catatan kontak pelanggan
- Kuesioner Pelanggan dan Formulir Umpan Balik
- tanggapan survei
- analisis jaringan
- perilaku pelanggan
- Informasi produk atau platform
- analisis pesaing
Mulailah dengan aspek-aspek yang paling mendapat manfaat dari satu atau lebih dari tiga jenis pembersihan data, tata kelola yang tepat, dan kemampuan observasi. Anda kemudian dapat memutuskan apakah akan bekerja dengan tim data di organisasi Anda untuk membantu.
Konten terkait unggulan:
Gambar sampul oleh Joseph Kalinowski/Institut Pemasaran Konten
strategi pemasaran
marketing
pemasaran, manajemen pemasaran, kantor pemasaran
, digital marketing, konsep pemasaran, marketing mix, apa itu marketing
#Apa #yang #harus #diketahui #pemasar #tentang #pembersihan #data #pemodelan #dan #tata #kelola