Posted by: tonyteaching | November 15, 2010

Memperbaiki Normalitas dengan TRANSFORMATION data

Saya pernah ‘sakit perut’ gara-gara data yang saya kumpulkan meski sangat banyak (683) ternyata setelah saya check normalitas datanya untuk setiap variable ternyata Nggak Normal (baca posting Menganalisis Normality sebelumnya) .. ..Skewness nya besar (mengsle banget) atau Kurtosisnya gedhe (terlalu gemuk atau terlalu kurus). Emang susah sih dapatin data sample yang ideal normal. Tapi ingat, hasil penelitian sebelumnya dalam statistics (yg sampai saat ini masih dipercaya) bahwa “untuk data apapun dari suatu populasi yang sangat besar pasti distribusi datanya normal”.|
Jadi kalo distribusi data sample kita Nggak Normal, dapat dikatakan sample kita Nggak Mewakili Populasinya (krn populasinya dipercaya pasti normal). Yang berarti juga jika sample data kita akan kita analisis untuk inferential statistics yakni mengambil kesimpulan populasinya maka sample kita ini udah jelas “bermasalah” :)

Eit…nanti dulu. Masih ingat metode analisis statistik Parametrik dan Non-Parametrik kan?
Untungnya ahli statistics sebelumnya udah nemuin masalah-masalah umum terkait sample data ginian. Jadinya mereka udah mengembangkan metode-metode analisis statistics yang harus menggunakan sample yang terdistribusi normal (yakni metode analisis statistik Parametrik) maupun sample data yang nggak terdistribusi normal (yakni metode analisis statistik Non-Parametrik).

****************

Saya pengin pake metode analisis statistik Parametrik tetapi Sample Data saya Nggak Normal, gimana nih?? :(

Ini dia masalah klasik. Biasanya karena saya tahunya baru metode-metode dan aplikasi Parametrik (misal Anova atau aplikasi AMOS), tapi ternyata distribusi data saya “melarang” saya memakai mereka. Duaar!!

Santai dab…ada beberapa langkah untuk menghadapi masalah ini dan ‘mungkin’ nantinya bisa menyelesaikan masalah kita:

1. Bersihin data Mentahmu:
– Lihat distribusi datanya –> lihat ada yang Outlier nggak? (nilai yang melompat mbeda ama yang lain) –> Lihat ada yang cuman dikit banget nggak frequency-nya (misal cuman 1 respondent)? –> terus lihat data aslinya, lihat pola jawabannya, ada yang aneh nggak? (misal dia njawab setuju aja..atau tidak konsisten untuk pertanyaan yang mirip..banyak yang nggak dijawab atau missing data..dll)..begitu ketemu alasannya, DELETE aja tuch respondents!

Sekarang cek normality datanya (pake gambar dan tabel skewness dan kurtosis..caranya seperti link yg saya sediakan di awal)!

2. TRANSFORM data kita

Kalo ternyata masih nggak normal…ada cara lain. Data kita transformasikan.

looooh, ini kan artinya ngubah nilai data kita jadi nggak orisinil lagi donk?
Ini masih debatable. Peneliti yang setuju, bilang Transformasi data pada hakekatnya “tidak mengubah data” karena meski kita mengubah nilai datanya tetapi karena kita mengubah SEMUA nilai data maka PERBEDAAN Nilai tiap respondent akan TETAP. Yang musti diingat adalah jika data kita menyangkut lebih dari satu variable maka jika kita mentransformasikan satu variable maka kita harus Mentransformasikan Semua Variable (agar kita tidak mengubah hubungan/relationship antar variables)!

Transformasi ini bisa kita lakukan di SPSS di menu “Transform” > “Compute Variable

Ada 4 Pilihan Transformasi:

a. Log Transformation –> berguna untuk memperbaiki data yang terdistribusi Positive Skew dan Unequal Variances

syntax di SPSS:  LG10 ()

b.  Square root transformation –> bahasa Indonesianya di-‘akar pangkat dua’, berguna untuk memperbaiki data yang terdistribusi Positive Skew dan Unequal Variances

syntax di SPSS:  SQRT()

c. Reciprocal transformation –> bahasa Indonesianya di-‘1/X’, berguna untuk memperbaiki data yang terdistribusi Positive Skew dan Unequal Variances

syntax di SPSS:  1/()

d. Reverse score transformation –> berguna untuk memperbaiki data yang terdistribusi Negative Skew

Ke tiga metode transformasi di atas dapat juga untuk memperbaiki data yang terdistribusi Negative Skew.
Caranya: kita harus merubah nilai setiap data mentah kita dulu yakni membalik SEMUA data: yang besar jadi kecil, yang kecil jadi besar
Rumusnya: Nilai tertinggi – nilai yang akan ditranformasikan
Contoh: Contoh: karena nilai data saya pake Likert 1- 7 maka data dengan nilai 5 akan berubah menjadi 2 ( yakni 7-5=2), data dengan nilai 7 menjadi 0, data dengan nilai 1 menjadi 6.
atau Rumus lain: (Nilai tertinggi+1) – nilai yang akan ditranformasikan
agar nilai terendahnya tetap 1
Jadi Nilai 5 akan berubah menjadi 3 (yakni 8-5=3), nilai 7 menjadi 1, nilai 1 menjadi 7

syntax di SPSS: 8 – ()

INGAT:
Jika data kita ada yang bernilai 0, maka tentu kita tahu bahwa Tidak ada Nilai untuk Log 0 dan 1/0, maka untuk mentransformasikan variable itu, variable syntax data kita kita tambah konstanta misal 1.

Contoh:

COMPUTE logA = LG10 (day1 + 1)

COMPUTE recA= 1/ (day1 + 1)

Naaaah…..

Kalo semuanya udah dicoba dan tetep TIDAK NORMAL???! Gimana nih?? :(

Tenang aja…kalo intinya hanya pengin ngerti data sample kamu itu normal apa tidak “jika di re-sampling” dgn lebih banyak item data (misal item sampling kamu 100..kamu mau lihat kalo data kamu diperbanyak sampai 1000 item apakah normal atau tidak)..maka jika data kita Continuous masih ada lagi metode BOOTSTRAPPING

Lain Posting aja ya neranginnya…metode Bootstrapping ini terkait dengan SEM.

Done for now :)

About these ads

Responses

  1. Mas Tony, saya mohon bantuannya nih.
    Ada beberapa pertanyaan terkait dengan masalah transform data. Data yang saya olah adalah laporan keuangan bank-bank (exp: Leverage, Profitability, Size, Growth, Tax, etc) dari 2003-2009 (N=161). Naaah pertanyaannya adalah:
    1. Jika variabelnya ada 6 sedangkan yang tidak normal ada 4, apakah yg 2 (yg sudah normal) juga harus ditransform?
    2. Transform dengan cara apa yg paling tepat digunakan apabila ada datanya yg minus (-)?
    3. Saya sudah mencoba melakukan transformasi dengan menggunakan SQRT. Ternyata hasil dari SQRT ini menyebabkan beberapa data menjadi NOL. Akibatnya ketika dilakukan uji normalitas ada beberapa data yang hilang (MISSING). Dan setiap VAR yg datanya berubah menjadi NOL berbeda-beda. Misalnya VAR 1 yg missing ada 5, sedangkan VAR 2 yg missing ada 3. Apakah ini diperbolehkan ada tidak?
    4. Jika kita sudah lolos Uji Normalitas, maka untuk uji Multikolinear, Autokorelasi, Heterokedasitasnya menggunakan data yang sudah ditransform atau justru data yang awal (sebelum transform)?

    Mohon petunjukknya ya Mas. Terima kasih.

    • Mas Reza..
      menjawab pertanyaan no.1: tergantung analisis data yg mas pengin lakukan. Jika mas pengin mencari hubungan atau perbedaan antar keenam variable data tersebut, berarti mas memang musti men-transform semua variable tersebut. Tapi misal tiap analisis hanya menganalisis hubungan 2 variable maka 2 variable itu aja yg ditransform. Karena ingat saat kita melakukan uji relationship pada hakekatnya kita menganalisis variance dr data variable-variable itu, nah agar ‘tidak mengubah’ nilai data maka variable2 yg terlibat jika satu ditransform yg lain harus ditransform dgn metode yg sama.
      2) data bernilai minus…jika ingin ditransformasi bisa dijadikan positif semua dulu, misal data awal nilai minimal -4 dan nilai maksimal 4 maka sebelum ditransform pake fungsi, data bisa diubah menjadi positif semua dengan +5 misalnya sehingga nilai minimal menjadi +1 dan maksimal +9 baru ditransformasikan.
      3) Boleh aja mas..memang normal seperti itu, tinggal nanti dalam analysis data mas pengin mengikut sertakan data yang missing atau tidak, kalo di SPSS ada pilihan-pilihannya.
      4) ya pake data yang ditransformasi mas, karena nilai data itu yg normal yg memenuhi syarat metode parametrik yg kita pake.
      Semoga membantu mas REza

      • Dear Mas Tony,
        Pertama-pertama saya mengucapkan banyak terima kasih kepada Mas Tony. Blog mas Tony sangat-sangat membantu sekali. Saya yakin masih banyak kalangan akademis seperti saya yang masih awam atas ilmu statistik. Ditambah lagi masih sedikitnya panduan dalam melakukan pengolahan data statistik. Makanya ketika saya menemukan blog ini, saya masih H2C (harap-harap cemas), kira-kira dijawab gak ya pertanyaan saya. Alhamdulillah, ternyata dijawab :)

        Tapi ada yang yang ingin saya tanyakan lg nih Mas. Terkait dengan pertanyaan saya yang nomor 2 (data yg minus). Kalo data saya berupa data keuangan, bagaimana cara mengganti ya Mas? Kalo data keuangan kan sudah berupa angka riil. Bukan dalam bentuk skala. Apa langsung ditransform saja? Tanpa memperdulikan minusnya?

        Mohon pencerahannya ya Mas. Terima kasih.

  2. selamat malam mas
    saya mau tanya tentang transformasi box cox
    sebenarnya kapan trnasformasi ini bisa digunakana
    kemudian keunggulan dibanding yang lainnya apa mas?
    terimakasih

  3. Dear Mas Tony, sebelumnya terima kasih sudah mau sharing masalah transformasi data ini. Dari tulisan dan hasil googling, sebenarnya transformasi data itu dilakukan untuk membuat sebaran data kita terdistribusi normal (koreksi sy kalo salah). Tapi muncul pertanyaan, kenapa ga kita normalisasi saja datanya secara langsung..? Toh (mungkin) datanya secara otomatis terdistribusi normal. Dari pemikiran sy yg kurang jelas dan ngawur ini, inti pertanyaannya, apa bedanya transformasi data dengan normalisasi data..? kalo memang beda, kapan saatnya kita menggunakan transformasi data atopun normalisasi data..? Mohon pencerahannya..:)

  4. Dear Mas Tony,
    saya mau tanya, kalau data sudah ditransformasikan, ternyata data malah ada yang bernilai negatif dan 0…itu gapapa yah mas?tp memenuhi asumsi normal sih…

  5. kurang setuju kalau dibilang data gak normal. kalimatnya salah kalau kata dosen2 saya. seharusnya” data tidak berdistribusi normal, bukan berdistribusi tidak normal.. mana ada distibusi tidak normal.kenormalan hanya bentuk salah satu uji asumsi klasik, jika tidak berdistibusi normal, mungkin datanya berdistribusi F, t, dan sebagainya..

  6. mas mau dong tutorialnya mengenai transformasi data dengan metode BOOTSTRAPPING.

    apa bisa di emailkan ke saya..? Trims sebelumnya

  7. terima kasih ya Pak,,, ^^

  8. menurut saya, yang diuji normalitasnya bukan data tapi residualnya.
    Kalau residual tidak normal, baru deh lakukan transformasi terhadap data (respons maupun prediktor)

  9. Selamat siang Mas Tony, kenalkan nama saya Alex dari Ditjenhubud, udah lebih dari satu tahun tesis saya belum kelar-kelar sekarang udah sampe bab IV sih, nah yang aku masih bingung, yaitu mengatasi distribusi data tidak normal sementara data saya cuman 48 doang, memang sebagian variabel datanya ada yang normal tapi kalo cuman sepotong-sepotong sepertinya masih ada yang salah, saya coba buat LN di exel untuk transformasikan data tapi ada nilai
    -516,18
    -516,18
    -633,5
    -7,82
    -7,24
    -7,01
    yang kalo saya LN-kan semua ketemunya : #NUM! ; ini apa yang dimaksudkan

    makasih Mas Tony, semoga sehat selalu dan terimakasih tulisannya memberikan aspirasi untuk memperbaiki tulisan saya

  10. mau tanya nih mas,,
    dalam satu penelitian boleh gk gunkn 2 alat trnsformasi yg berbeda,,mis to variabel A di normalkan dengn Ln,,tetapi to varibel B dgn sqrt,,,ato harus menggunakan alat yg sama,,dgn sqrt smua ato Ln smua,,???

  11. asalamualaikum ,,Mau tanya ni mas….
    saya skrg sdang nyusun skripsi tntang pengruh rasio keuangan terhadap harga saham ,,,Variabel x saya terdiri dari 6 dan jumlah sampel 13 perusahaan waktu 5 tahun,,,nah,,,disini yg ingin saya tanyakan,,setelah data mentah saya olah,,,terus pke spss kolmogrov smirnov diuji normalitas hasilnya malah nggak normal…padahal udah brapa kali saya coba otak atik datanya tp tetap aja nggak normal. Hasilnya normalitas paling tinggi 0,04 mas……udah minta bantuan ama tmen yg lbh ngrti spss, eh dia juga nyerah. jadi sya aneh dimana letak “penyakit” data saya ini.
    jadi gimana solusi yang baik dan bagaimana cara mengobati uji normalitas tsb,,uji apakah yg plg baik spaya datanya normal…..
    oh ya..saya udah coba transform salah satu variabel, hasilnya ada data yg ksong,,,,
    jdi tlong saya harap beri penjelasan ya mas,,,ini sngt membantu saya……
    Wassalam dan trima Kasih sebelumnya……….

  12. saya mau tanya hasil perhitungan regresi linier berganda saya ada yg di SQRT, la itu bagaimana membacanya di persamaan regresi. apakah sama dengan membaca yg tidak di SQRT?

  13. mas mau tanya nih,,,,,smua sumber diatas ada dibuku apa yaa,,,,soalnya biar ada pegangganna buat ujian skripsi gt,,klu ujian mst ditnyakan drmna sumbernyaa

  14. mau tanya mas, data-data saya itu masih berbentuk nominal miliyaran-triliun. Apakah bisa langsung dimasukkan ke spss? sy sudah coba uji asumsi klasik tetapi terjadi gejala.

  15. mas saya mau tanya nih
    jadi saya melakukan penelitian dengan sample reputasi web e-commerce Indonesia.
    sample reputasi tsb menghasilkan data yang dari angka tertinggi dan terendah. pada penelitian ini saya menginginkan mengambil nilai reputasi yang baik saja. Namun karena baik itu relatif jadi saya tidak bisa memperkirakan ukuran baik pada reputasi tsb.
    pada akhirnya saya melakukan deskripsi data terlebih dahulu mencari sebaran data apakah data tsb normal atau tidak
    kemudian menghasilkan :

    Penyebaran normal pada data
    dapat dilihat dari grafik normal Q-Q plot yang
    dihasilkan dengan menggunakan software SPSS
    16.0 dan nilai skewness (lebar kurva normal)
    serta kurtosis (tinggi kurva normal) yang berada
    pada rentang nilai -2 dan 2. Adapun jika data
    reputasi tidak tersebar secara
    normal, akan diambil data sebesar 75% dengan
    melakukan pemotongan data pada percentil 25,
    dengan asumsi pengambilan data 75% pada data
    reputasi sudah dapat mewakili populasi.

    pertanyanyaan mas apakah langkah seperti diatas sudah benar mas untuk diterapkan???

  16. itu sebabnya knp?
    berikan pnjlsannya and klu pngin skripsi itu dljutkn dgn metode apa??
    biar mengut di heterokedastisitasnya

    klu lulus heterokedastisitas, itu knp?
    berikan penjlsnya, biar mengat juga skiripsinya???

    trm kash mas…

  17. klu tidak lulus heterokedastisitas, itu sebabnya knp?
    berikan pnjlsannya and klu pngin skripsi itu dljutkn dgn metode apa??
    biar menguat di heterokedastisitasnya klu tidak lulus hetero

    klu lulus heterokedastisitas, itu knp?
    berikan penjlsnya, biar mengat juga skiripsinya???

    mhn blsanya. sony_pm_gendut@yahoo.com
    trm kash mas…

  18. mas, saya mau nanya saya menggunakan 5 variabel (1 variabel dependen dan 4 variabel independen) dari semua variabel tersebut dalam satuannya berbeda-beda…..Y=(Rp.juta), X1=(Rp.juta), X2=(unit), X3=(%persen), dan X4=(Rp.ribuan)..untuk mengolah data tersebut apakah harus dibuat satuan yang sama atau bagaimana, jika iya mohon dibantu caranya. Terima kasih

  19. mas, saya mau nanya,, data saya yang uji normlitas, heterokedastisitas, sama multi udah bagus.. tapi durbin watson sama uji t tidak normal. gimana cara nya mas.. sudah saya LN, LUN,LOG10,SQRT tidak bisa..bisa kasi solusi gak mas

  20. mas saya mau tanya , apakah data rasio keuangan yang nilai tidak minus cocok menggunakan transformasi data square root (SQRT) ?? terrima kasih mas

  21. […] Susanto, Tony Dwi. (2010). Memperbaiki Normalitas dengan Tranfofrmation Data [Online]. Available: http://tonyteaching.wordpress.com/2010/11/15/memperbaiki-normalitas-dengan-transformation-data […]

  22. mas, kalau data dalam penelitian saya menggunakan nilai yang terdapat dalam laporan keuangan.. tapi ga ad yg normal.. walaupun untuk uji hetero, autokol, multikol semuanya baik.. tapi untuk uji normalitasnya ga normal.. mohon solusi dan bantuannya ya.. dan untuk salah satu variabel saya datanya hampir semua minus(nilai minus didapat dari perhitungan)
    terima kasih.. jawabannya saya tunggu..

  23. mas, mau nanya nih
    apa pengaruh data yang telah ditransformasi???
    bagaimana penjelasan pada hasil regresi?
    teima kasih

  24. saya mau tanya mas,, aya punya sekitar 1000 data dengan nilai bervariasi, bagaimana cara mendelet data saya, data dengan range atau nilai berapa, atau ada ujinya ?


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Categories

Follow

Get every new post delivered to your Inbox.

%d bloggers like this: