Regresyon – İstatistik Alanları- İstatistik Fiyatları – Ücretli İstatistik – İstatistik Yaptırma
Regresyon
Regresyon, iki değişkenin ne ölçüde ilişkili olduğunu tanımlamanın bir yoludur. Regresyon, bir şeyleri tahmin etmek için kullanılabilir, ancak bu yanıltıcı olabilir. Değişkenler arasında bir korelasyonun varlığı, her zaman aralarında bir neden-sonuç bağlantısı olduğu anlamına gelmez.
EŞLEŞTİRİLEN VERİLER
Biri Happyton, diğeri Blissville adında iki şehir hayal edin. Bu şehirler kıtada birbirinden uzaktadır. Hakim rüzgarlar ve okyanus akıntıları, bu iki şehirde yıl boyunca çok farklı sıcaklık ve yağış modelleri üretir. Happyton’dan Blissville’e taşınmak üzere olduğumuzu varsayalım ve bize Happyton’un “ vıcık vıcık yazları ve kurak kışları olduğu ” söylendi, Blissville’de ise “ yazların kavrulmuş ve kışların Ayrıca yaz ve kış arasındaki sıcaklık farkının Blissville’de Happyton’dakinden çok daha küçük olduğu söylendi.
İnternete gidiyoruz ve iki kasaba hakkında veri toplamaya başlıyoruz. Dünyanın birçok yerinde ortalama aylık sıcaklığı Santigrat derece (8C) cinsinden ve ortalama aylık yağış miktarını santimetre (cm) olarak gösteren bir tablo koleksiyonu bulduk. Happyton ve Blissville tablolarda gösterilen şehirler arasındadır. Tablo 6-1A, Happyton için son 100 yılda toplanan ortalama aylık sıcaklık ve yağış miktarını göstermektedir.
Tablo 6-1B, aynı dönemde Blissville için ortalama aylık sıcaklık ve yağış miktarını göstermektedir. Bulduğumuz verilere eşleştirilmiş veriler denir, çünkü iki değişken miktarı, sıcaklık ve yağış miktarını yan yana gösterir.
Tabloları inceleyerek her iki kasabanın yaz ve kış havası hakkında fikir edinebiliriz. Ancak çubuk grafiklerden yararlanarak daha görsel bir tasvir elde edebiliriz.
Regresyon ne demek
Regresyon terapisi nedir
Psikolojide regresyon nedir
Evde regresyon
Regresyon analizi Nedir
Regresyon Analizi
Doğrusal regresyon nedir
Spiritüel regresyon nedir
EŞLEŞTİRİLMİŞ ÇUBUK GRAFİKLERİ
Happyton için ortalama aylık sıcaklığı ve ortalama aylık yağış miktarını grafiksel olarak karşılaştıralım. Şekil 6-8A, oradaki ortalama aylık sıcaklığı ve yağış miktarını gösteren eşleştirilmiş bir çubuk grafiktir. Grafik, Tablo 6-1A’daki verilere dayanmaktadır. Yatay eksende her biri yılın bir ayını gösteren 12 aralık vardır. Zaman bağımsız değişkendir. Sol taraftaki dikey ölçek, ortalama aylık sıcaklıkları gösterir ve sağ taraftaki dikey ölçek, ortalama aylık yağış miktarlarını gösterir. Bunların her ikisi de bağımlı değişkenlerdir ve yılın zamanının işlevleridir.
Ortalama aylık sıcaklıklar açık gri çubuklarla gösterilir ve ortalama aylık yağış miktarları koyu gri çubuklarla gösterilir. Bu verilerden hem sıcaklığın hem de yağışın yıllık modelleri izlediğini görmek kolaydır. Genel olarak Happyton’da sıcak aylar soğuk aylara göre daha ıslaktır. Şimdi Blissville için benzer bir karşılaştırma yapalım. Şekil 6-8B, Tablo 6-1B’deki verilere dayalı olarak, oradaki ortalama aylık sıcaklığı ve yağış miktarını gösteren eşleştirilmiş bir çubuk grafiktir.
Bu verilerden, kış ve yaz arasındaki sıcaklık farkının Blissville’de Happyton’a göre daha az telaffuz edildiğini görebiliriz. Ancak bu çubuk grafikte öne çıkan ana şey bu değildir! Yılın zamanına bağlı olarak yağış miktarının çok farklı olduğuna dikkat edin. Blissville’de kışlar, özellikle Ocak ve Şubat ayları yağışlı geçer. Yazları, özellikle Haziran, Temmuz ve Ağustos aylarında neredeyse hiç yağış olmaz. Happyton ve Blissville arasındaki genel iklimdeki zıtlık dikkat çekicidir. Bu bilgiler elbette tablo verilerinde yer almaktadır, ancak görmek daha kolaydır
çift çubuk grafiklere bakar.
DAĞILIM PLOTLARI
Şekil 6-8A’yı incelediğimizde, Happyton kasabası için sıcaklık ve yağış arasında bir ilişki olduğu görülmektedir. Genelde sıcaklık arttıkça yağmur miktarı da artar. Blissville’de sıcaklık ve yağış arasında da bir ilişki olduğu aşikar, ancak tam tersi bir ilişki var: sıcaklık arttıkça yağış azalır. Bu ilişkiler ne kadar güçlü? Bulmak için dağılım grafikleri çizebiliriz.
Şekil 6-9A’da, ortalama aylık yağış, Happyton için ortalama aylık sıcaklığın bir fonksiyonu olarak çizilir. Tablo 6-1A’daki verilere dayalı olarak her ay için bir nokta çizilir. Bu grafikte bağımsız değişken, yılın zamanı değil, sıcaklıktır. Noktaların düzenlenmesinde bir model var.
Sıcaklık ve yağış arasındaki ilişki Happyton için pozitiftir. Oldukça güçlü, ancak aşırı derecede değil. Korelasyon olmasaydı (yani korelasyon 0’a eşit olsaydı), noktalar grafiğin her tarafına rastgele dağılmış olurdu. Ancak korelasyon mükemmel olsaydı (ya þ1 veya -1), tüm noktalar düz bir çizgi boyunca uzanırdı.
Şekil 6-9B, Blissville için ortalama aylık sıcaklığın bir fonksiyonu olarak ortalama aylık yağış grafiğini göstermektedir. Tablo 6-1B’deki verilere dayalı olarak her ay için bir nokta çizilir. Şekil 6-9A’da olduğu gibi sıcaklık bağımsız değişkendir. Burada da noktaların düzenlenmesi için bir kalıp var. Bu durumda korelasyon pozitif yerine negatiftir. Oldukça güçlü bir korelasyon, belki de Happyton için pozitif korelasyondan biraz daha güçlü, çünkü noktalar daha yakın dizilmiş görünüyor. Ancak korelasyon mükemmel olmaktan uzaktır.
GERİLME EĞRİLERİ
Bölüm 1’de öğrendiğimiz eğri uydurma tekniği, Şek. 6-9A ve B. “Sezgisel tahmin” e dayalı örnekler, Şek. 6-10A ve B. Şekil 6.10A, Happyton için ortalama aylık sıcaklık ve yağış miktarlarını temsil eden Şekil 6-9A’dakilerle aynı 12 noktayı göstermektedir (işleri karıştırmamak için aylar için etiketler olmadan).
Kesikli eğri, iki değişkeni ilişkilendiren düzgün bir fonksiyonun yaklaşıklığını temsil eder. Şekil 6-10B’de, Blissville için ortalama aylık sıcaklık ve yağış miktarı ile ilgili bir fonksiyonu yaklaşık olarak tahmin etmek için benzer bir eğri uydurma egzersizi yapılmıştır.
Varsayımsal senaryolarımızda, Tablo 6-1A ve B, Şek. 6-8A ve B, Şek. 6-9A ve B ve Şek. 6-10A ve B’nin tümü, 100 yıl boyunca toplanan kayıtlara dayanmaktadır. Bunun yerine son 1000 yılda toplanan kayıtlara erişimimiz olduğunu varsayalım! Ayrıca, verilerin aylık ortalamasına sahip olmak yerine, haftalık ortalamalı verilere sahip olduğumuzu hayal edin. Bu durumlarda devasa tablolar alırdık ve çubuk grafiklerin okunması tamamen imkansız olurdu.
Ancak dağılım grafikleri çok daha ilginç bir hikaye anlatırdı. 12 puan yerine, her grafik yılın her haftası için bir tane olmak üzere 52 puana sahip olacaktır. Düz eğriler boyunca noktaların Şekil 1 ve 2’de olduğundan çok daha yakından hizalandığını varsaymak makuldür.