Posted by: tonyteaching | September 30, 2010

Cleansing Data: before doing any data analysis

Sebelum saya melakukan apapun analisis data, pertama-tama yang harus saya pastikan adalah data yang saya punya bener-bener VALID! karena sekali lagi inget: Secanggih apapun metode analisis data kita, Secanggih apapun software data analysis kita tetep aja “Garbage IN Garbage OUT!”
Nah, jadinya pastikan dulu data-data kamu valid, baru kamu olah!

Checking Error data pake’ SPSS

Sebenarnya screening, cleaning, and fixing data bisa saya lakukan dengan SPSS yakni dengan feature:

* Untuk Categorical variables (seperti Jenis Kelamin, Ya/Tidak, Pendidikan, dll):
dengan Analyze > Descriptive Statistics > Frequencies (pilih variable yang ingin kita analisis dan aktifkan pilihan ‘Statistics’: Minimum & Maximum)

maka saya akan memperoleh tabel yang menerangkan kepada saya
– Berapa case/item (N) yang Valid? berapa yang Missing?
– Berapa nilai Minimumnya? berapa nilai Maximumnya?

akan ada Table yg menerangkan data yang Valid aja tadi (misal jika kita analisis variable jenis kelami):
– Berapa jumlah case yang nilainya Laki-Laki? ini % dari seluruh case?
– Berapa jumlah case yang nilainya Perempuan? ini % dari seluruh case?
– Berapa Total semua item valid ini? apakah 100%?

* Untuk Continuous variables (seperti suhu, pendapatan, dll):
dengan Analyze > Descriptive Statistics > Descriptive (pilih variable yang ingin kita analisis dan aktifkan pilihan ‘Options’: mean, standard deviation, minimum, maximum)

maka kita akan memperoleh sebuah Table yang menerangkan kepada kita:
– Berada jumlah item/case yang valid?
– Berapa nilai Minimum yang ada? Berapa nilai Maximum yang ada? Mean? dan Standard Deviation?

apakah nilai-nilai itu Masuk Akal atau Sesuatu Perkiraanmu sebelumnya???

Kalo ada nilai yang sepertinya tidak cocok, kemudian kita bisa mencari item data itu dengan Edit> Find
Nah data ketemu, mau di hapus, direvisi, atau mau dicheck di questionnaire nya lagi..silahkan.

*******************

Apa yang saya Pilih: Pake Ms. Excel 🙂

Untuk screening, cleaning, and fixing data biasanya saya lebih seneng dengan Ms. Excel,
jadi data asli saya biasanya saya letakkan di Ms. Excel, selanjutnya saya select data saya dan saya aktifkan fasilitas “Filter” data yakni:

di “Data” tab > “Sort and Filter” group > klik Filter (gambar corong)

o iya jangan lupa ya di Baris pertama sheet kita kita bikinin Heading untuk tiap kolom kita!
maka selanjutnya saya akan bisa melihat nilai-nilai yang ada dalam setiap kolom..saya bisa sorting hanya nilai-nilai yang aneh saja yang muncul, langsung mengkoreksinya, bahkan langsung menghitung banyak item berdasar kombinasi nilai-nilai lebih dari satu kolom.

Kaya’nya lebih praktis ya🙂 Enjoy!


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Categories

%d bloggers like this: