16 November 2010

ANALISIS KORELASI

KORELASI adalah istilah statistik yang menyatakan derajat hubungan linier antara dua variabel atau lebih, yang ditemukan oleh Karl Pearson pada wal 1900, oleh sebab itu terkenal dengan sebutan korelasi Pearson Product Moment (PPM). korelasi adalah salah satu teknik analisis statistik yang paling banyak digunakan oleh para peneliti. karena para peneliti umumnya tertarik terhadap peristiwa-peristiwa yang terjadi dan mencoba untuk menghubungkannya. 


Misalnya kita ingin menghubngkan antara tinggi badan dengan berat badan, antara umur dengan tekanan darahnya, antara motivasi dengan prestasi belajar atau bekerja dan seterusnya. Hubungan antara dua variabel didalam teknik korelasi bukanlah dalam arti hubungan sebab akibat (timbal-balik), melainkan hanya merupakan hubungan searah saja. hubungan sebab akibat, misalnya : kemiskinan dengan kejahatan, kebersihan dengan kesehatan, kemiskinan dengan kebodohan.. dalam korelasi hanya mengenal hubungan searah saja (Bukan timbal balik) , misalnya tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah. akibatnya dalam korelasi dikenal penyebab dan akibatnya. dan data akibat atau yang dipengaruhi disebut variabel terikat. istilah bebas disebut juga dengan independen yang biasaya dilambangkan dengan huruf X atau X1. sedangkan istialh terikat disebut dependen yang biasanya dilambangkan dengan huruf Y. bagaimanakah menentukan bahwa variabel itu bebas atau terikat? jawaban ialah tergantung dari landasan teori yang kita pakai.

Korelasi merupakan teknik analisis yang  termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures of association). Pengukuran asosiasi   merupakan istilah umum yang mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi Rank Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik korelasi lain, seperti Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal, Somer, dan Wilson.

Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua variabel tersebut disebut independen.

Korelasi bermanfaat untuk mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan skala-skala tertentu, misalnya Pearson data harus berskala interval atau rasio; Spearman dan Kendal menggunakan skala ordinal; Chi Square menggunakan data nominal. Kuat lemah hubungan diukur diantara jarak (range) 0 sampai dengan 1. Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed). Korelasi searah jika nilai koefesien korelasi diketemukan positif; sebaliknya jika nilai koefesien korelasi negatif, korelasi  disebut tidak searah. Yang dimaksud dengan koefesien korelasi ialah suatu pengukuran statistik kovariasi atau asosiasi antara dua variabel. Jika koefesien korelasi diketemukan tidak sama dengan nol (0), maka terdapat ketergantungan antara dua variabel tersebut. Jika  koefesien korelasi diketemukan +1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) positif.

Jika  koefesien korelasi diketemukan -1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) negatif.
Dalam korelasi sempurna tidak diperlukan lagi pengujian hipotesis, karena kedua variabel mempunyai hubungan linear yang sempurna. Artinya variabel X mempengaruhi variabel Y secara sempurna. Jika korelasi sama dengan nol (0), maka tidak terdapat hubungan antara kedua variabel tersebut.
                                         
Dalam korelasi sebenarnya tidak dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel kedua. Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja, maka variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan variabel Y.

 Variabel yang akan kita hubngkan terdiri atas berbagai tingkatan data. tingkatan data meliputi data nominal, interval, dan rasio. tingkatan data tersebutt menentukan alaisis korelasi mana yang paling tepat digunakan. oleh sebab itu, sebelum mempelajari analisis korelasi, maka macam-macam tingkatan data tersebut hasrus sudah dipahami sepenuhnya.

Kegunaan
Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) hubungan antar dua variabel atau lebih. Contoh: mengukur hubungan antara variabel:
  • Motivasi kerja dengan produktivitas
  • Kualitas layanan dengan kepuasan pelanggan
  • Tingkat inflasi dengan IHSG
Pengukuran ini hubungan antara dua variabel untuk masing-masing kasus akan menghasilkan keputusan, diantaranya:
  • Hubungan kedua variabel tidak ada
  • Hubungan kedua variabel lemah
  •  Hubungan kedua variabel cukup kuat
  •  Hubungan kedua variabel kuat
  •  Hubungan kedua variabel sangat kuat
Penentuan tersebut didasarkan pada kriteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin kuat; sebaliknya jika hubungan mendekati 0, maka hubungan semakin lemah.

Teori Korelasi

Korelasi dan Kausalitas
Ada perbedaan mendasar antara korelasi dan kausalitas. Jika kedua variabel dikatakan berkorelasi, maka kita tergoda untuk mengatakan bahwa variabel yang satu mempengaruhi variabel yang lain atau dengan kata lain terdapat hubungan kausalitas. Kenyataannya belum tentu. Hubungan kausalitas terjadi jika variabel X mempengaruhi Y. Jika kedua variabel diperlakukan secara simetris (nilai pengukuran tetap sama seandainya peranan variabel-variabel tersebut ditukar)  maka meski kedua variabel berkorelasi tidak dapat dikatakan mempunyai hubungan kausalitas. Dengan demikian, jika terdapat dua variabel yang berkorelasi, tidak harus terdapat hubungan kausalitas.

 Terdapat dictum yang mengatakan “correlation does not imply causation”. Artinya korelasi tidak dapat digunakan secara valid untuk melihat  adanya hubungan kausalitas dalam variabel-variabel. Dalam korelasi aspek-aspek yang melandasi terdapatnya hubungan antar variabel mungkin tidak diketahui atau tidak langsung. Oleh karena itu dengan menetapkan korelasi dalam hubungannya dengan variabel-variabel yang diteliti tidak akan memberikan persyaratan yang memadai untuk menetapkan hubungan kausalitas kedalam variabel-variabel  tersebut. Sekalipun demikian bukan berarti bahwa korelasi tidak dapat digunakan sebagai indikasi adanya hubungan kausalitas antar variabel. Korelasi dapat digunakan sebagai salah satu bukti adanya kemungkinan terdapatnya hubungan kausalitas tetapi tidak dapat memberikan indikasi hubungan kausalitas seperti apa jika memang itu terjadi dalam variabel-variabel yang diteliti, misalnya model recursive, dimana X mempengaruhi Y atau non-recursive, misalnya X mempengaruhi Y dan Y mempengaruhi X.

Dengan untuk mengidentifikasi hubungan kausalitas tidak dapat begitu saja dilihat dengan kaca mata korelasi tetapi sebaiknya menggunakan model-model yang lebih tepat, misalnya regresi, analisis jalur atau structural equation model
           
Korelasi dan Linieritas
Terdapat hubungan erat antara pengertian korelasi dan linieritas. Korelasi Pearson, misalnya, menunjukkan adanya kekuatan hubungan linier dalam dua variabel. Sekalipun demikian jika asumsi normalitas salah maka nilai korelasi tidak akan memadai untuk membuktikan adanya hubungan linieritas. Linieritas artinya asumsi adanya hubungan dalam bentuk garis lurus antara variabel. Linearitas antara dua variabel dapat dinilai melalui observasi scatterplots bivariat. Jika kedua variabel berdistribusi normal dan behubungan secara linier, maka  scatterplot berbentuk oval; jika tidak berdistribusi normal scatterplot tidak berbentuk oval. 

Asumsi
            Asumsi dasar korelasi diantaranya seperti tertera di bawah ini:
  • Kedua variabel bersifat independen satu dengan lainnya, artinya masing-masing variabel berdiri sendiri dan tidak tergantung satu dengan lainnya. Tidak ada istilah variabel bebas dan variabel tergantung.
  • Data untuk kedua variabel berdistribusi normal. Data yang mempunyai distribusi normal artinya data yang distribusinya  simetris sempurna. Jika digunakan bahasa umum disebut berbentuk kurva bel. Menurut Johnston (2004) ciri-ciri data yang mempunyai distribusi normal ialah sebagai berikut:
  1. Kurva frekuensi normal menunjukkan frekuensi tertinggi berada di tengah-tengah, yaitu berada pada rata-rata (mean) nilai distribusi dengan kurva sejajar dan tepat sama pada bagian sisi kiri dan kanannya. Kesimpulannya, nilai yang paling sering muncul dalam distribusi normal ialah rata-rata (average), dengan setengahnya berada dibawah rata-rata dan setengahnya yang lain berada di atas rata-rata.
  2. Kurva normal, sering juga disebut sebagai kurva bel, berbentuk simetris sempurna.
  3. Karena  dua bagian sisi dari tengah-tengah benar-benar simetris, maka frekuensi nilai-nilai diatas rata-rata (mean) akan benar-benar cocok dengan frekuensi nilai-nilai di bawah rata-rata.
  4. Frekuensi total semua nilai dalam populasi akan berada dalam  area dibawah kurva.  Perlu diketahui bahwa area total dibawah kurva mewakili kemungkinan munculnya karakteristik tersebut.  
  5. Kurva normal dapat mempunyai bentuk yang berbeda-beda. Yang menentukan bentuk-bentuk tersebut adalah nilai rata-rata dan simpangan baku (standard deviation) populasi.Koefesien Korelasi
Koefesien korelasi ialah pengukuran statistik kovarian atau asosiasi antara dua variabel. Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan kekuatan (strength) hubungan linear dan arah hubungan dua variabel acak. Jika koefesien korelasi positif, maka kedua variabel mempunyai hubungan searah. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan tinggi pula. Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel mempunyai hubungan terbalik. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah (dan sebaliknya). Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel penulis memberikan kriteria sebagai berikut (Sarwono:2006):
  • 0 : Tidak ada korelasi antara dua variabel
  • >0 – 0,25: Korelasi sangat lemah
  • >0,25 – 0,5: Korelasi cukup
  • >0,5 – 0,75: Korelasi  kuat
  • >0,75 – 0,99: Korelasi  sangat kuat
  • 1: Korelasi sempurna
Signifikansi
Apa sebenarnya signifikansi itu? Dalam bahasa Inggris umum, kata, "significant" mempunyai makna penting; sedang dalam pengertian statistik kata tersebut mempunyai makna “benar” tidak didasarkan secara kebetulan. Hasil riset dapat benar tapi tidak penting. Signifikansi / probabilitas / α memberikan gambaran mengenai bagaimana hasil riset itu mempunyai kesempatan untuk benar. Jika kita memilih signifikansi sebesar 0,01, maka artinya kita menentukan hasil riset nanti mempunyai kesempatan untuk benar sebesar 99% dan untuk salah sebesar 1%.
  
Secara umum kita menggunakan angka signifikansi sebesar 0,01; 0,05 dan 0,1. Pertimbangan penggunaan angka tersebut didasarkan pada tingkat kepercayaan (confidence interval) yang diinginkan oleh peneliti. Angka signifikansi sebesar 0,01 mempunyai pengertian bahwa tingkat kepercayaan atau bahasa umumnya keinginan kita untuk memperoleh kebenaran dalam riset kita adalah sebesar 99%. Jika angka signifikansi sebesar 0,05, maka tingkat kepercayaan adalah sebesar 95%. Jika angka signifikansi sebesar 0,1, maka tingkat kepercayaan adalah sebesar 90%.

Pertimbangan lain ialah menyangkut jumlah data (sample) yang akan digunakan dalam riset. Semakin kecil angka signifikansi, maka ukuran sample akan semakin besar. Sebaliknya semakin besar angka signifikansi, maka ukuran sample akan semakin kecil. Unutuk memperoleh angka signifikansi yang baik, biasanya diperlukan ukuran sample yang besar. Sebaliknya jika ukuran sample semakin kecil, maka kemungkinan munculnya kesalahan semakin ada.

Untuk pengujian dalam SPSS digunakan kriteria sebagai berikut:
  • Jika angka signifikansi hasil riset < 0,05, maka hubungan kedua variabel signifikan.
  • Jika angka signifikansi hasil riset > 0,05, maka hubungan kedua variabel tidak signifikan
Interpretasi Korelasi
Ada tiga penafsiran hasil analisis korelasi, meliputi: pertama, melihat kekuatan hubungan dua variabel; kedua, melihat signifikansi hubungan; dan ketiga, melihat arah hubungan.
Untuk melakukan interpretasi kekuatan hubungan antara dua variabel dilakukan dengan melihat angka koefesien korelasi hasil perhitungan dengan menggunakan kriteria sbb:
  • Jika angka koefesien korelasi menunjukkan 0, maka kedua variabel tidak mempunyai hubungan
  • Jika  angka koefesien korelasi mendekati 1, maka kedua variabel mempunyai hubungan semakin kuat
  • Jika  angka koefesien korelasi mendekati 0, maka kedua variabel mempunyai hubungan semakin lemah
  • Jika angka koefesien korelasi sama dengan 1, maka kedua variabel mempunyai hubungan linier sempurna positif.
  • Jika angka koefesien korelasi sama dengan -1, maka kedua variabel mempunyai hubungan linier sempurna negatif.
Interpretasi berikutnya melihat signifikansi hubungan dua variabel dengan didasarkan pada angka signifikansi yang dihasilkan dari penghitungan dengan ketentuan sebagaimana sudah dibahas di bagian 2.7. di atas. Interpretasi ini akan membuktikan apakah hubungan kedua variabel tersebut signifikan atau tidak.

Interpretasi ketiga melihat arah korelasi. Dalam korelasi ada dua arah korelasi, yaitu searah dan tidak searah. Pada SPSS hal ini ditandai dengan pesan two tailed.  Arah korelasi dilihat dari angka koefesien korelasi. Jika koefesien korelasi positif, maka hubungan kedua variabel searah. Searah artinya jika variabel X nilainya tinggi, maka variabel Y juga tinggi. Jika koefesien korelasi negatif, maka hubungan kedua variabel tidak searah. Tidak searah artinya jika variabel X nilainya tinggi, maka variabel Y akan rendah.
Dalam kasus, misalnya hubungan antara kepuasan kerja dan komitmen terhadap organisasi sebesar 0,86 dengan angka signifikansi sebesar 0 akan mempunyai makna bahwa hubungan antara  variabel kepuasan kerja dan komitmen terhadap organisasi sangat kuat, signifikan dan searah. Sebaliknya dalam kasus hubungan antara variabel mangkir kerja dengan produktivitas sebesar -0,86, dengan angka signifikansi sebesar 0;  maka hubungan kedua variabel sangat kuat, signifikan dan tidak searah.
Contoh: Hubungan antara kepuasan kerja dengan loyalitas pegawai

Hipotesis berbunyi sbb:
  • H0: Tidak ada hubungan antara kepuasan kerja dengan loyalitas pegawai
  • H1: Ada hubungan antara kepuasan kerja dengan loyalitas pegawai
Hasil t hitung sebesar 3,6
T table dengan ketentuan α= 0,05 Degree of freedom: n-2, dan n = 30 diketemukan sebesar: 2,048. Didasarkan ketentuan di atas, maka t hitung 3,6 > t table 2,048. Dengan demikian H0 ditolak dan H1 diterima. Artinya  ada hubungan antara kepuasan kerja dengan loyalitas pegawai

Disamping menggunakan cara diatas, cara kedua ialah menggunakan angka signifikansi. Caranya sebagai berikut:

Hipotesis berbunyi sbb:
  • H0: Tidak ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
  • H1: Ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
Angka signifikansi hasil perhitungan sebesar 0,03. Bandingkan dengan angka signifikansi sebesar 0,05. Keputusan menggunakan kriteria sbb:

    • Jika angka signifikansi hasil riset < 0,05, maka H0 ditolak.
    • Jika angka signifikansi hasil riset > 0,05, maka H0 diterima

Didasarkan ketentuan diatas maka signifikansi hitung sebesar 0,03 < 0,05, maka H0 ditolak dan H1 diterima. Artinya  Ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai.

Dalam SPSS pengujian dilakukan dengan menggunakan angka signifikansi. Oleh karena itu dalam contoh analisis pada bab berikutnya akan hanya menggunakan angka signifikansi.

 Koefesien Determinasi
Koefesien diterminasi dengan simbol r2 merupakan proporsi variabilitas dalam suatu data yang dihitung didasarkan pada model statistik. Definisi berikutnya menyebutkan bahwa r2 merupakan rasio variabilitas nilai-nilai yang dibuat model dengan variabilitas nilai data asli. Secara umum r2 digunakan sebagai informasi mengenai kecocokan  suatu model.  Dalam regresi r2 ini dijadikan sebagai pengukuran seberapa baik garis regresi mendekati nilai data asli yang dibuat model. Jika r2 sama dengan 1, maka angka tersebut menunjukkan garis regresi cocok dengan data secara sempurna.

Interpretasi lain ialah bahwa r2 diartikan sebagai proporsi variasi tanggapan yang diterangkan oleh regresor (variabel bebas / X) dalam model. Dengan demikian, jika r2 = 1 akan mempunyai arti bahwa model yang sesuai menerangkan semua variabilitas dalam variabel Y. jika r2 = 0 akan mempunyai arti bahwa tidak ada hubungan antara regresor (X) dengan variabel Y. Dalam kasus misalnya jika r2 = 0,8 mempunyai arti bahwa sebesar 80% variasi dari variabel Y (variabel tergantung / response) dapat diterangkan dengan variabel X (variabel bebas / explanatory); sedang sisanya 0,2 dipengaruhi oleh variabel-variabel yang tidak diketahui atau variabilitas yang inheren. (Rumus untuk menghitung koefesien determinasi (KD) adalah KD = r2 x 100%) Variabilitas mempunyai makna penyebaran / distribusi seperangkat nilai-nilai  tertentu. Dengan menggunakan bahasa umum, pengaruh variabel X terhadap Y adalah sebesar 80%; sedang sisanya 20% dipengaruhi oleh faktor lain.

Dalam hubungannya dengan korelasi, maka  r2  merupakan kuadrat dari koefesien korelasi yang berkaitan dengan variabel bebas (X) dan variabel Y (tergantung). Secara umum dikatakan bahwa r2  merupakan kuadrat korelasi antara variabel yang digunakan sebagai predictor (X) dan variabel yang memberikan response (Y). Dengan menggunakan bahasa sederhana r2  merupakan koefesien korelasi yang dikuadratkan. Oleh karena itu, penggunaan koefesien determinasi dalam korelasi tidak harus diinterpretasikan sebagai besarnya pengaruh variabel X terhadap Y mengingat bahwa korelasi tidak sama dengan kausalitas. Secara bebas dikatakan dua variabel mempunyai hubungan belum tentu variabel satu mempengaruhi variabel lainnya. Lebih lanjut dalam konteks korelasi antara dua variabel maka pengaruh variabel X terhadap Y tidak nampak. Kemungkinannya hanya korelasi merupakan penanda awal bahwa variabel X mungkin berpengaruh terhadap Y. Sedang bagaimana pengaruh itu terjadi dan ada atau tidak kita akan mengalami kesulitan untuk membuktikannya. Hanya menggunakan angka r2 kita tidak akan dapat membuktikan bahwa variabel X mempengaruhi Y.

Dengan demikian jika kita menggunakan korelasi sebaiknya jangan menggunakan koefesien determinasi untuk melihat pengaruh X terhadap Y karena korelasi hanya menunjukkan adanya hubungan antara variabel X dan Y. Jika tujuan riset hanya untuk mengukur hubungan maka sebaiknya berhenti saja di angka koefisien korelasi. Sedang jika kita ingin mengukur besarnya pengaruh variabel X terhadap Y sebaiknya menggunakan rumus lain, seperti regresi atau analisis jalur.

Bentuk korelasi

Salah satu jenis korelasi yang paling populer adalah koefisien korelasi momen-produk Pearson, yang diperoleh dengan membagi kovarians kedua variabel dengan perkalian simpangan bakunya. Meski memiliki nama Pearson, metode ini pertama kali diperkenalkan oleh Francis Galton.

Koefisien korelasi momen-produk Pearson

Sifat-sifat matematis


Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).
Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dan simpangan baku σX dan σY didefinisikan sebagai:
\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y}.
Karena μX = E(X), σX2 = E(X2) − E2(X) dan demikian pula untuk Y, maka dapat pula ditulis


\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian ketidaksamaan Cauchy-Schwarz, koefisien korelasi tak akan melebihi dari 1 dalam nilai absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat dependensi linier antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, dan Y = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X, sehingga

Koefisien korelasi non-parametrik

Koefisien korelasi Pearson merupakan statistik parametrik, dan ia kurang begitu menggambarkan korelasi bila asumsi dasar normalitas suatu data dilanggar. Metode korelasi non-parametrik seperti ρ Spearman and τ Kendall berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang kuat bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.

Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak

 Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakan rasio korelasi, yang mampu mendeteksi hampir segala dependensi fungsional

Kopula dan korelasi

Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pula kopula antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalam fungsi distribusi kumulatif pada distribusi normal multivariat.

Matriks korelasi

Matriks korelasi n peubah acak X1, ..., Xn adalah n  ×  n matrik dimana i,j adalah corr(XiXj). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama dengan matriks kovarians peubah acak yang telah distandarkan Xi /SD(Xi) untuk i = 1, ..., n. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.
Matriks korelasi selalu simetris, yakni korelasi antara Xi dan Xj adalah sama dengan korelasi antara Xj and Xi).

"Korelasi tak selalu berarti sebab-akibat"

Diktum konvensi bahwa "korelasi tak selalu berarti sebab-akibat" dibahas dalam artikel hubungan artifisial (spurious relationship). Lihat pula korelasi mengarah ke hubungan sebab-akibat (kekeliruan logis). Bagaimanapun, korelasi tak diasumsukan selalu akausal, meski penyebab tersebut bisa pula tidak diketahui.

Menghitung korelasi secara akurat dengan metode numerik

Berikut adalah algoritma (dalam pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik
sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
    sweep = (i - 1.0) / i
    delta_x = x[i] - mean_x
    delta_y = y[i] - mean_y
    sum_sq_x += delta_x * delta_x * sweep
    sum_sq_y += delta_y * delta_y * sweep
    sum_coproduct += delta_x * delta_y * sweep
    mean_x += delta_x / i
    mean_y += delta_y / i 
pop_sd_x = sqrt( sum_sq_x / N )
pop_sd_y = sqrt( sum_sq_y / N )
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)


 Sumber :

 Usman, Husaini, Prof.Dr, et.al, Pengantar statistik, Bumi Aksara, Jakarta, 2009

http://id.wikipedia.org/wiki/Korelasi

18 komentar:

  1. pusing. ~~ hahaha njelimet ya statistik ituu..
    btw, izin copaas ya mass. buat referensi memahami statistik utk ngerjain skripsi.. makasih!

    BalasHapus
  2. he..he..tidak se njelimet PSSI dan gayus...tetap semangat untuk menyelesaikan skripsi anda, mau copas monggo, tapi jangan sampai defresi...

    BalasHapus
  3. korelasi itu sebenernya apa mas???
    hehe... numpang tanya....
    misal ketemu r nya sekian (pk PPM) trus pembahasannya apa aja ya mas.... tolong bantu dong... :)
    apa cuma menggambarkan kuat tidak na sama berapa % sumbangan na getu aja ato perlu tambah lagi... bingung aku.... toeng...toeng...

    BalasHapus
  4. susahnyaaa..
    mas mo tanya, bedanya data parametrik n non parametrik tu apa??
    trus kl variabel penelitiannya banyak lbh efektif pake teknik korelasi yang mana??
    makasih..

    BalasHapus
  5. Anonim :"korelasi yang sudah dijelaskan diatas, hubungan yang kuat atau tidaknya dari variabel judul penelitian kita, batasannya kalau r>/=o,50 berarti korelasinya cukup sedang kalau r<0,50 berari tingkat korelasinya rendah, sementara kuat-tidaknya korelasi tergantung tingkat korelasi yang akan diambil sehingga kita kenal perhitungan regresi untuk mengetahui tingkat kedalaaman sebuah hubungan..jangan bingung terus dicoba.."
    Anne Rosana :"data identik dengan informasi yang sudah distandarkan parameternya dengan ketentuan yang sudah disepakati bersama oleh para ahli sedangkan non-parametrik lebih ditentukan oleh si peneliti itu sendiri berdasarkan pertimbangan tertentu dilihat dari ketersediaan data, biaya, situasi,tenaga dan tingkat waktu yang disedikaan dalam penelitian, lebih lanjut coba anda buka artikel yang berhubungan dengan penelitian parametrik dari kategori yang sudah disampaikan dalam blog ini."

    BalasHapus
  6. mas mau tanya ni..
    klo udah dpt nilai r trus udah tau tingkat korelasinya kuat atau lemah.. kira2 langkah selanjutnya apa? apa tinggal memberi penjelasan secara bahasa?
    trus hipotesis sama signifikansi masih perlu dicari ga..?? buat apa??
    (mohon bantuannya saya pemula >,<)

    BalasHapus
  7. Syukron atas kunjungannya,

    Dari hasil korelasi nilai r-nya sudah diketahu selanjutnya anda analisa hubngan antara r hitung dengan r tabel untuk menguji hipotesa korelatif yang sudah anda ajukan :"adakah hubungan signifikan antara variabel x dengan variabel Y, dengan melihat H0 dan Ha...dan dimana H0 bersifat terbalik bunyi hipotesanya dan hasil perbandingan antara r hitung dan r tabel harus bisa terbalik dari H0=jika r hitung > r tabel maka hasilnya harus sebaliknya r hit < r tabel, maka hubngan signifikan...buka kembali di buku-buku penelitian tentang hipotesa nol.

    BalasHapus
  8. jadi untuk pengambilan keputusan ada dua cara ya mas?
    pake pembanding r hitung dan r tabel sama nilai signifikan seperti penjelasan diatas?
    cara mencari angka signifikan dari riset gmn mas? untuk dibandingkan dgn angka signifikan 0,5

    BalasHapus
  9. kalo skala datny interval ma ordinal korelasinya pke apa??

    BalasHapus
  10. maaf mas mo tanya lagi..
    data yg sy gunakan data ordinal.
    untuk variabel yg akan digunakan apakah jumlah skoringnya harus sama? atau boleh berbeda? misalnya untuk variabel pertama skornya 1-5, sedangkan variabel lainnya hanya 1-3.
    kl sy ingin menggunakan spss apa bisa pake bivariat dgn data sperti itu?

    BalasHapus
  11. Deni Popay : "alfa=0,5 adalah tingkat toleransi kesalahan untuk menegtahui derajat dari r=tabel".

    Anne Rosana : "Untuk penyesuaian alangkah baiknya skala pengukurannya sama antara variabelnya sama biar derajat peng-skoran berimbang sehingga memudahkan anda dalam mentabulasi data angket anda, secara teks cara bivariat bisa digunakan..."

    BalasHapus
  12. Mas, tolong berikan contoh data riil dengan minimal 5 variabel dengan 1 dependent variabel dan 4 independent variabel dengan ukuran sampel n minimal 50...thanks mas

    BalasHapus
  13. salam kenal,mas..
    saya punya data variabel terikat merupakan data rasio dan variabel bebas merupakan data ordinal.
    bagaimana uji korelasinya,mas??
    trim's..

    BalasHapus
  14. mas mau tanya, saya kan mau lihat kesamaan hasil antara dua variabel, yaitu kesamaan hasil untuk soal berbahasa inggris dan soal berbahasa indonesia, kira2 langkah2 yang harus saya lakukan apa ya??

    BalasHapus
  15. pak mau tnya...
    blog ni msh aktif kan y??
    sy mhon pnjelasan ny mas
    dalam analisi korelasi nila r+ ato r- tu hanya sebagai arah hubunganny sj kan yah???
    tp saat masuk pengujian hipotesis (konversi nilai r menjadi t hitung) r- tdk dmasukan negatif ny tp hnya nilai r ny sj.. apa benar demikian pak ?
    trmksh pak tuk jwbn ny

    BalasHapus
  16. ass. pak mau tanya
    saya punya data yang tidak signifikan
    gmana caranya untuk menyelesaikan selanjutnyanya dalam analisis korelasi kanonik???
    tolong dijawab ya pak....
    terimakasih sebelumnya

    BalasHapus
  17. ass. pak achmad
    pak mau minta pencerahan pak, bagaimana tahapan yang dilalui dalam menyelesaikan pengolahan data untuk judul skripsi : "Pengaruh Hubungan motivasi kerja dan budaya kerja terhadap kinerja pegawai"
    terima kasih pak atas pencerahannya

    BalasHapus
  18. salam pak, saya mau tanya
    apakah dasar yang menyatakan bahwa nilai 1 mempunyai nilai valid pada perhitungan korelasi, dan bagaimana dasarnya pernyataan tersebut?
    terimakasih

    BalasHapus

Tulisan Lainnya:

Related Posts Plugin for WordPress, Blogger...

Formulir Kontak

Nama

Email *

Pesan *