Korelasyon ve Regresyon – İstatistik Alanları- İstatistik Fiyatları – Ücretli İstatistik – İstatistik Yaptırma

Korelasyon ve Regresyon
Korelasyon
• Bölüm 3’te, iki değişken arasında bir ilişki veya korelasyon olup olmadığını belirlemeye yardımcı olmak için kullanılabilecek dağılım grafiklerini tartıştık.
Terminoloji
• Güçlü bir ilişki, bir çizgiyi veya eğriyi sıkı bir şekilde takip eden bir dağılım grafiğiyle sonuçlanır.
• Pozitif bir ilişki, soldan sağa doğru yükselen bir dağılım grafiğiyle sonuçlanır.
• Negatif bir ilişki, soldan sağa inen bir dağılım grafiğiyle sonuçlanır.
• Dağılım grafiği düz bir çizgiyi izleyen bir model ortaya koyarsa, iki değişken doğrusal olarak ilişkilidir.
• Bir şekilde ilişkili olduklarında iki değişken arasında bir ilişki vardır.
• Doğrusal olarak ilişkili olduklarında iki değişken arasında bir korelasyon vardır.
• Sıranız: İşte bazı dağılım grafikleri. Her ilişkiyi zayıf / güçlü, pozitif / negatif, doğrusal / doğrusal olmayan, ilişki / korelasyon olarak tanımlayın.
• Doğrusal korelasyon katsayısı r, bir örnekteki eşleştirilmiş x− ve y − kantitatif değerler arasındaki doğrusal ilişkinin yönünü ve gücünü ölçer. Resmi olarak Pearson’un korelasyon katsayısı olarak adlandırılır. Aşağıdaki özelliklere sahiptir:
• −1≤r≤1.
• r, 1’e ne kadar yakınsa, pozitif doğrusal ilişki o kadar güçlüdür.
• r -1’e ne kadar yakınsa, negatif doğrusal ilişki o kadar güçlüdür.
• R, 0’a ne kadar yakınsa, doğrusal ilişki o kadar zayıftır.
• Eğer r = 0 ise doğrusal bir ilişki yoktur.
• Değişkenler farklı bir ölçeğe dönüştürüldüğünde r’nin değeri değişmez.
• Seçimlerden etkilenmeyen değer.
• r nasıl hesaplanır?
Burada x ̄, x değerlerinin ortalamasıdır, y ̄ y değerlerinin ortalamasıdır, sx x değerlerinin standart sapmasıdır, sy y değerlerinin standart sapmasıdır, zx ve zy sırasıyla her bir x ve y ile ilişkili z-skorları ve n, veri çiftlerinin sayısıdır.
R’yi elle hesaplamaktan kaçınmalısınız. Tüm istatistiksel yazılım paketleri, dağılım grafiği oluşturma ve r’yi hesaplama işlevlerine sahiptir.
• Bir korelasyon ne zaman önemlidir?
• Tablo 4’ü kullanma (sayfa 292)
Korelasyon katsayısının mutlak değeri, örneklem büyüklüğünüz için tabloda sunulan kritik değerlerden büyükse, korelasyon anlamlıdır. Örnek boyutunuz listelenmemişse, en yakın küçük değeri kullanın.
Korelasyon ve Regresyon Analizi
Regresyon analizi Nedir
Regresyon analizi örnekleri
Korelasyon katsayısı
Çoklu regresyon analizi örnekleri
Regresyon Analizi soru ve cevapları
Korelasyon örnekleri
Regresyon katsayısı
• Yazılımın Kullanılması
Yazılım paketleri genellikle korelasyon katsayısı için bir P değeri verecektir. P değeri ne kadar küçükse, korelasyon o kadar önemlidir. Genellikle 0,05’ten küçük bir P değeri önemli kabul edilir. Örnekler www.StevensStats.com adresinde bulunabilir.
• Örnekler: Verilen korelasyonun anlamlı olup olmadığını belirlemek için Tablo 4’ü kullanın.
1. Araba ağırlığı ile yakıt ekonomisi arasında ilişki kurulurken, yedi kişilik bir örnekten korelasyon katsayısı
arabalar r = -0.944 idi.
Tablo 4’e göre n = 7 olduğunda r’nin kritik değeri 0.754’tür. Mutlak değerinden beri
korelasyon katsayısı 0,754’ten büyükse, korelasyonun anlamlı olduğu sonucuna vardık.
2. Sıranız: Annenin boyuyla kızının boyunu ilişkilendirirken, 8 çiftten oluşan bir örnekten alınan korelasyon katsayısı 0,693’lük bir korelasyon katsayısı ile sonuçlandı. Ya numunede 20 çift olsaydı?
• Aykırı değerler bir korelasyonu yapabilir veya bozabilir. Hatalı oldukları biliniyorsa, ortadan kaldırılmalıdır. Değilse, daha fazla araştırmalısınız.
Aykırı, Korelasyon Yapar:
Burada n = 15 ve r = 0.694 Bu önemli bir korelasyondur çünkü 0.694> 0.514.
Korelasyon, aykırı değerden kaynaklanmaktadır. Bu nokta kaldırılırsa, şunları yapabilirsiniz:
Bakın hiçbir korelasyon olmayacak.
Aykırı Değer Korelasyonunu Kırar:
Burada n = 12 ve r = 0.545
Bu önemli bir korelasyon değildir çünkü 0.545 <0.576.
Aykırı tarafından harap oldu.
Bu nokta kaldırıldıysa oldukça güçlü bir korelasyon görebilirsiniz.
• Yorumlama r – Açıklanan Varyasyon:
R2’nin değeri, x ve y arasındaki doğrusal ilişki ile açıklanan y’deki varyasyon oranını temsil eder.
• Örnekler – Açıklanan Varyasyon:
1. Sıcaklık ve kriket cıvıltısı oranı arasındaki korelasyon katsayısı 0,936 ise, cırcır böceği cıvıltısı oranındaki varyasyonun yaklaşık% 87,6’sı sıcaklıkla doğrusal ilişkiyle açıklanabilir. (çünkü 0.9362 = .876). Buradan çıkarımı değiştirmeyi deneyin.
2. Sıranız: Araba ağırlığı ile yakıt ekonomisi arasında ilişki kurulurken, yedi arabalık bir örneklemden alınan korelasyon katsayısı r = -0.944 idi. Bir arabanın yakıt ekonomisinin, bir arabanın ağırlığıyla doğrusal ilişkisine atfedilebilecek oranını tahmin etmek?
3. Sıranız: On bir ABD şehrinden oluşan bir örnekte, nüfus ve cinayet oranı arasındaki korelasyon katsayısı 0,727 idi. Cinayet oranının nüfusa bağımlılığı hakkında bir açıklama yapın.
• Korelasyon, Nedensellik ve Gizlenen Değişkenlerle İlgili Sorunlar:
• İlişkilendirmeyi kastettiğinizde korelasyon demeyin. Korelasyon kelimesi,
doğrusal bir ilişki. İlişkilendirme terimi kasıtlı olarak belirsizdir.
• Korelasyon −vs− Nedeni.
Dağılım grafikleri ve korelasyonlar hiçbir zaman tek başına nedensellik kanıtlamaz. Bazı ilişkiler gerçekten nedensel olsa da, nedenselliğin doğasını ve yönünü belirlemek çok zor olabilir. Her zaman pusuda bekleyen değişkenler için tetikte olun. Gizlenen bir değişken, dağılım grafiğine dahil edilmeyen ancak iki değişkenin birlikte yükselmesine veya düşmesine neden olabilen değişkendir.
Bir korelasyon iki değişken arasındaki nedenselliği kanıtlamasa da, meydana gelen bir tür nedensel ilişki olduğuna dair kanıt sağlar. Başlangıçta beklediğiniz olmayabilir ve çalıştığınız iki değişken arasında bile olmayabilir. Bununla birlikte, insanlar genellikle kendilerine hitap etmeyen ve korelasyonun nedensellik olmadığını iddia eden bir korelasyonu göz ardı edeceklerdir. Bu da iyi bir uygulama değil. Bölüm 10.4’te, neden ve sonucu açıklığa kavuşturmaya yardımcı olan çoklu doğrusal regresyon aracılığıyla değişkenlerin nasıl kontrol edileceğine dair bir giriş vardır.
• Örnekler:
1. Sigara ve Akciğer Kanseri: Sigara ve akciğer kanseri arasında çok güçlü bir bağlantı olmasına rağmen, sigaranın akciğer kanserine neden olduğunu kanıtlamak uzun bir zaman aldı (yaklaşık 100 yıl). Tütün endüstrisi tarafından finanse edilen Tütün Araştırma Konseyi, neden-sonuç ilişkisine dair hiçbir ikna edici kanıt bulamadı ve hava kirliliği gibi çeşitli gizli değişkenler önerdi. Hatta erken evre kanserin sigara içme eğilimine neden olabileceğini bile öne sürdüler. Kontrollü deneyler ve gen çalışmaları nihayet 1980’lerde ve 90’larda tütün endüstrisine karşı davayı kapattı.
2. Küresel Isınma: Bilimsel toplulukta, küresel sıcaklıkların yükseldiği konusunda güçlü bir fikir birliği vardır ve bu yükselişin başlıca nedeni, insan çabalarının ürettiği sera gazlarındaki artıştır. Bununla birlikte, popüler medyada neden-sonuç ilişkisi ve bunun kapsamı hakkında tartışmalar devam etmektedir. Tütün Araştırma Konseyi’nin de gösterdiği gibi, aşırı güçlü kanıtlar karşısında bile bir sebep sonuç kararını yıllarca ertelemek mümkündür. Ne yazık ki, küresel ısınma üzerine kontrollü deneyler yapmak imkansız çünkü tek bir dünya var.
3. Kitaplar ve Sınıflar: Bir çocuğun evindeki kitap sayısı ile ilkokuldaki performansı arasında güçlü bir ilişki vardır. Bu, evinize kitap koymanın çocuğunuzun okulda daha başarılı olmasına neden olacağı anlamına mı geliyor? Gizlenen değişkenler nelerdir?
Cevap: Elbette hayır. Gizlenen değişken muhtemelen ev atmosferi ve genel olarak okuma ve eğitimin vurgulanması / takdir edilmesidir.
Çoklu regresyon analizi örnekleri Korelasyon katsayısı Korelasyon örnekleri Korelasyon ve regresyon analizi Regresyon analizi Nedir Regresyon Analizi örnekleri Regresyon Analizi soru ve cevapları Regresyon katsayısı