KORELASYON DOĞRUSALDIR – İstatistik Alanları- İstatistik Fiyatları – Ücretli İstatistik – İstatistik Yaptırma

KORELASYON DOĞRUSALDIR
Veri girişine veya dağılım grafiklerine dayalı olarak korelasyon sayılarını hesaplayabilen birçok bilgisayar programı vardır. Bu kitapta, korelasyonu hesaplamak için kullanılan gerçek formüllere girmeyeceğiz. Formüller, en basitleştirilmiş örnekler dışındaki tüm örnekler için dağınık ve sıkıcıdır. Bu giriş düzeyinde, korelasyonun bir dağılım grafiğindeki noktaların en küçük kareler çizgisine yakın yoğunlaşma derecesinin bir ölçüsü olduğunu hatırlamanız yeterlidir.
Korelasyon belirlemede anahtar kelime “çizgi” kelimesidir. Bir dağılım grafiğindeki korelasyon, noktaların grafik üzerindeki noktalardan belirlenen belirli bir düz çizgiye yakınlığı ile tanımlanır. Noktalar tamamen düz bir çizgi boyunca uzanıyorsa, o zaman ya r 1⁄4 1 veya r 1⁄4 þ1. Her iki değişkenin değerleri birlikte artarsa r’nin değeri pozitiftir. Diğer değer arttıkça bir değer azalırsa r’nin değeri negatiftir.
Arada bir, tüm noktaların düz bir eğri boyunca uzandığı, ancak bu eğrinin düz bir çizgi olmadığı bir dağılım grafiği görürsünüz. Bu, değişkenler arasındaki ilişkide özel bir mükemmelliktir; birinin diğerinin matematiksel bir işlevi olduğunu gösterir. Ancak düz olmayan bir eğri üzerindeki noktalar, 1 veya þ1’in korelasyonunu göstermez. Şekil 7-1A, korelasyonun +1 olduğu bir dağılım grafiğini gösterir. Şekil 7-1B, noktaların düzgün bir eğri boyunca uzanması anlamında korelasyonun mükemmel olduğu, ancak gerçekte korelasyonun + 1’den çok daha az olduğu bir dağılım grafiğini göstermektedir.
Korelasyon katsayısı hesaplama
Korelasyon Nedir
Pearson korelasyon katsayısı
Regresyon Analizi
Regresyon Nedir
Regresyon katsayısı Nedir
Korelasyon Analizi
Bağımlı ve bağımsız değişken arasındaki ilişkiye ne denir
İLİŞKİ VE ÇIKIŞLAR
Bazı dağılım grafiklerinde, noktalar düzgün eğrilerin veya çizgilerin yakınında yoğunlaşmıştır, ancak herhangi bir dağılım grafiğinin Şekil 7-1A veya B’de gösterilenler kadar düzenli noktalar içermesi nadirdir. Arada bir neredeyse tüm noktaların düz bir çizgiye yakın olduğu, ancak ana gruptan uzakta birkaç nokta bulunan dağılım grafiği. Bu türden başıboş noktalar, aykırı değerler olarak bilinir. Bu noktalar, bazı yönlerden, istatistiksel dağılımlarda bulunan aykırı değerler gibidir.
Bir veya iki “aşırı uç değer”, iki değişken arasındaki korelasyonu büyük ölçüde etkileyebilir. Şekil 7-2’deki örneği düşünün. Bu, iki nokta hariç tüm noktaların Şekil 7-1A’daki ile tam olarak aynı konumlarda olduğu bir dağılım grafiğidir. Ancak iki aykırı değer, en küçük kareler çizgisinden uzaktır.
Bu noktalar, çizgiden eşit uzaklıklardadır (d ile gösterilir), dolayısıyla çizginin konumu üzerindeki net etkileri birbirini götürür. Dolayısıyla, Şekil 7-2’deki en küçük kareler çizgisi, Şekil 7-1A’daki en küçük kareler çizgisi ile aynı konumdadır. Ancak korelasyon değerleri çok farklı. Şekil 7-1A’da r 1⁄4 + 1. Şekil 7-2’de gösterilen durumda, r, þ1’den çok daha küçüktür.
DEĞİŞKENLERİN İLİŞKİSİ VE TANIMI
İşte korelasyonla ilgili bir başka önemli kural. Hangi değişkenin bağımlı, hangi değişkenin bağımsız olarak tanımlandığı önemli değildir. Değişkenlerin tanımları değiştirilirse ve gerçek senaryo hakkında hiçbir şey değişmezse, korelasyon tamamen aynı kalır.
İki şehir için ortalama aylık sıcaklıklar ile ortalama aylık yağış miktarları arasındaki korelasyonu analiz ettiğimiz önceki bölümü tekrar düşünün. Dağılım grafiklerini oluşturduğumuzda, sıcaklığı yatay eksende çizdik ve sıcaklığı bağımsız bir değişken olarak değerlendirdik.
Ancak, yağış miktarlarını yatay eksende de çizebilir ve bunları bağımsız değişkenler olarak tanımlayabilirdik. Ortaya çıkan dağılım grafikleri farklı görünebilirdi, ancak matematiksel analiz üzerine, korelasyon rakamları aynı çıkacaktı.
Bazen belirli bir değişken, sezgisel olarak bağımsız değişkenin rolüne katkıda bulunur. (Zaman bunun mükemmel bir örneğidir, ancak bazı istisnalar vardır.) Önceki bölümde yer alan Happyton ve Blissville vakalarında, hangi değişkenin bağımsız, hangisinin bağımlı olduğu önemli değildir. Aslında bu etiketler yanıltıcı olabilir çünkü nedensellik öneriyorlar. Yıl boyunca sıcaklık değişimi Happyton veya Blissville’deki yağış miktarını gerçekten etkiler mi? Eğer öyleyse, etkiler iki şehir arasında tam tersi. Yoksa tam tersi mi – yağış miktarları sıcaklığı etkiliyor mu? Yine, eğer bu doğruysa, etkiler iki şehir arasında zıttır. Her iki varsayımda da biraz garip bir şey var. Belki başka bir faktör veya hatta birden fazla faktörün bir kombinasyonu, her iki kasabadaki hem sıcaklığı hem de yağış miktarını etkiler.
BİRİMLER (GENEL OLARAK) ÖNEMLİ DEĞİLDİR
İşte ilginç bir korelasyon özelliği. Seçtiğimiz birimler, aynı fenomeni veya özelliği ifade ettikleri sürece önemli değildir. Her iki değişkenin ölçü birimi boyut olarak değiştirilir ancak özünde değişmezse, bir çubuk grafiğin veya dağılım grafiğinin görünümü değişir. Çizim, dikey veya yatay olarak “uzatılmış” veya “sıkıştırılmış” tır. Ancak iki değişken arasındaki korelasyon rakamı r etkilenmez.
Son bölümü ve Happyton ve Blissville için sıcaklığa karşı yağış dağılım grafiklerini tekrar düşünün. Yağış miktarları ayda santimetre cinsinden belirtilir ve sıcaklıklar Santigrat derece olarak gösterilir. Yağış miktarlarının bunun yerine aylık inç cinsinden ifade edildiğini varsayalım. Grafikler biraz farklı görünebilir, ancak bir bilgisayar tarafından analiz edildiğinde, korelasyon rakamları aynı olacaktır.
Sıcaklıkların Fahrenheit cinsinden ifade edildiğini varsayalım. Yine, grafikler farklı görünecek, ancak r etkilenmeyecektir. Ortalama aylık yağış, ayda mil cinsinden ve sıcaklıklar Kelvin cinsinden çizilse bile (0 K mutlak sıfırı, mümkün olan en soğuk sıcaklığı temsil eder), r’nin değeri aynı olacaktır.
Bu kuralı uygularken dikkatli olmalıyız. Birimlerin boyutları değiştirilebilir, ancak temsil ettikleri miktarlar veya fenomenler aynı kalmalıdır. Bu nedenle, ortalama yağış miktarını aylık yerine inç, santimetre veya mil cinsinden çizecek olsaydık, korelasyonun aynı kalacağından artık emin olamazdık.
Dağılım grafikleri artık aynı işlevleri göstermeyecektir. Dikey ölçekteki değişken – aylık dönemler yerine haftalık dönemler üzerinden ortalaması alınan yağış miktarı – artık aynı şeyi temsil etmeyecektir. Bu ince bir ayrım, ancak kritik bir fark yaratıyor.
PROBLEM 7-1
Şekil 7-2’deki en küçük kareler çizgisinden aykırı değerlerin mesafelerinin Şekil 7-3’te gösterildiği gibi ikiye bölündüğünü (d yerine d / 2’ye) varsayalım. Bunun korelasyon üzerinde nasıl bir etkisi olacak?
ÇÖZÜM 7-1
Korelasyonu artıracaktır, çünkü en küçük kareler çizgisinden tüm noktaların ortalama uzaklıkları daha küçük olacaktır.
PROBLEM 7-2
Şekil 7-3’teki senaryoda aykırı değerlerden birinin çıkarıldığını varsayalım. Bu, en küçük kareler çizgisinin konumunu etkiler mi?
ÇÖZÜM 7-2
Evet. Sol üst-dış değer kaldırılırsa, en küçük kareler çizgisinin konumu hafifçe aşağıya ve sağa kaydırılır; sağ alt aykırı değer kaldırılırsa, en küçük kareler çizgisi hafifçe yukarı ve sola kaydırılır.
Bağımlı ve bağımsız değişken arasındaki ilişkiye ne denir Korelasyon Analizi Korelasyon katsayısı hesaplama Korelasyon Nedir Pearson korelasyon katsayısı Regresyon analizi Regresyon katsayısı Nedir Regresyon nedir