İstatistik – Sosyal Bilimlerde İstatistik (50) – Eksik Verileri Dahil Etme – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Sonuç olarak, arka tahmin kontrolleri, OLS regresyon modelinin tolerans maddesine pek uymadığını ve bu nedenle belki de bu madde için alternatif bir modelin düşünülmesi gerektiğini göstermektedir. Spesifik olarak, bu sonucu sıralı bir ölçü olarak ele almayı ve sonraki bölümde tartışıldığı gibi genelleştirilmiş bir doğrusal model kullanarak modellemeyi düşünebiliriz. Yeni bir model tahmin edecek olsaydık, benzer testler uygulayabilir ve hangi modelin resmi veya gayri resmi olarak daha uygun olduğuna karar verebilirdik. Örneğin, resmi olarak, yeni model için R2 değerlerinin oranının ilk model için maksimum R2 değerini aştığını test ederek başlayabiliriz. Bu oran, yeni modelin verilere orijinal modelden daha iyi uyma olasılığının bir ölçüsü olacak ve bu nedenle hangi modelin tercih edileceğine karar vermek için bir temel oluşturacaktır. Bu tür bir karşılaştırmanın modellerin iç içe geçmesini gerektirmediğine dikkat edin, çünkü Bayesci bir perspektiften bakıldığında, herhangi iki olasılık dağılımı, onları karşılaştırmak mantıklıysa karşılaştırılabilir.
Eksik Verileri Dahil Etme
Önceki bölümlerde, eksik verilere sahip vakaların basitçe liste halinde silindiği ve bize orijinal örneğin% 85,8’ini (% 14,2’si eksik) bıraktığı modellerin sonuçlarını tartışmıştım. Sosyal bilimlerde geleneksel bilgelik, bu miktardaki eksik verinin kabul edilemez olduğunu ve bu nedenle, eksik verilerle gözlemlerin liste halinde silinmesine alternatif olarak düşünülmelidir. MCMC simülasyonunu kullanan Bayes paradigması, eksik verileri ele almak için nispeten basit ancak uygun yöntemler sunar.
Eksiklik Türleri
Eksik verilerin nasıl ele alınacağına karar vermeden önce, eksik veri mekanizmasının – yani eksik verileri oluşturan işlemin – göz ardı edilebilir mi yoksa göz ardı edilemez mi olduğuna karar vermeliyiz. Little ve Rubin (1987), eksik verilerin sonuçlarını anlamak için artık klasik bir şema geliştirdi:
• Y’deki eksiklik X’in bir fonksiyonu değilse Y’de eksik olan veriler rastgele (OAR) olarak gözlenir. Başka bir şekilde ifade edilirse, X, Y’deki eksikliği belirlerse, veriler OAR değildir.
• Y üzerindeki eksiklik Y’nin bir fonksiyonu değilse, Y’de eksik olan veriler rastgele (MAR) eksiktir. Başka bir deyişle, Y, Y’deki eksikliği belirlerse, veriler MAR değildir.
• Y’deki eksiklik X veya Y ile ilgiliyse veriler tamamen rastgele (MCAR) eksiktir. Başka bir deyişle, MCAR = OAR + MAR.
Veriler MCAR veya en azından MAR ise, eksik veri mekanizması “göz ardı edilebilir” olarak kabul edilir. Aksi takdirde, eksik veri mekanizması “önemsiz” olarak kabul edilir.
Bu fikirleri somut hale getirmek için, eğitimin gelir üzerindeki etkisini incelediğimizi varsayalım. Gelirdeki eksiklik eğitimin bir işleviyse (örneğin, yüksek eğitimli bireyler gelirlerini bildirmiyorsa), veriler OAR değildir. Gelir eksikliğinin bir gelir fonksiyonu olması durumunda (örneğin, yüksek gelire sahip kişiler gelirlerini bildirmiyorsa), diğer yandan eksik veriler MAR değildir ve eksik veri mekanizması göz ardı edilemez.
MAR olan ancak OAR göz ardı edilemeyen veriler neden eksik? Eksik veriler OAR değilse, tahmin ediciler ile sonuç arasındaki temel model değişmez. Bunun yerine, sonuç, bazı x değerlerinin temsil edilmediği bir örneğe sahip olmakla hemen hemen aynıdır. Aşağıda bu gösterilmektedir. İki set 10.000 N (0,1) gözlemi simüle ettim. X değişkeni olarak düşündüğüm ilk küme; ikinci kümenin hata olduğunu düşündüm. Daha sonra bir Y = 5 + 3X + 10e vektörü kurdum, bu da regresyon modellemesinin varsaydığı gibi Y’nin X ile doğrusal bir ilişkisi olduğunu ima ediyor.
Üst soldaki şekil, bu 10.000 gözlemin bir alt kümesini, noktalardan geçen regresyon çizgisiyle birlikte göstermektedir. Simülasyon parametrelerine göre, regresyon katsayıları 5 ve 3 olmalı ve bu model için R2, R2 = 1− [var (10e) / (var (5 + 3X + 10e)] = 1− (100/109 ) = .083 Bu özel örnek, katsayılar için 4.98 ve 3.06 vermiştir ve R2 .081’dir.
Sağ üstteki grafik, x <0 değerlerine sahip durumların verilerden çıkarıldığı, yani y verilerinin OAR olmadığı anlamına gelen verilerin bir alt kümesini gösterir. Şekilde görüldüğü gibi, yeni gerileme çizgisi, 4.99 ve 3.07’ye eşit katsayılarla, orijinal çizgiyle neredeyse aynıdır (aslında, orijinal çizgiden ayırt edilemez). R2 önemli ölçüde daha azdı, ancak .032’de, dağılımın sol yarısındaki bilgi kaybından kaynaklanan ek belirsizliği yansıtıyordu.
Sol alttaki grafik, aksine, y <5 değerlerine sahip gözlemler elendiğinde sonuçları gösterir, bu da verilerin MAR olmadığı anlamına gelir. Bu durumda, regresyon katsayıları büyük ölçüde etkilenir (13.1 ve 1.3’te; R2 = .04). Sapma, y için dağılımın sistematik olarak kesilmesi ve x ve y arasındaki ilişkiyi bozması nedeniyle oluşur.
Sosyal bilim araştırmalarında eksik verilerle karşılaşabileceğimiz birkaç yol vardır, bunların tümü önemsiz olmayan eksik veriler üretmez. Örneğin, bir panel çalışmasında, bazı kişiler tasarımla takip edilmeyebilir. Benzer şekilde, bazı bireyler, ilgili sonuç değişkeniyle ilgili olmayan nedenlerle çalışmanın dalgaları arasında hareket ettikleri için takipte kaybolabilirler.
Bu durumlarda, eksik veri mekanizması göz ardı edilebilir ve eksik verilerle gözlemlerin liste halinde silinmesi hiçbir şekilde önyargı oluşturmaz. Ancak çoğu durumda, eksik veri mekanizmasının göz ardı edilebilir olup olmadığı belirsizdir. Sosyal anketlerdeki ortak bir eksiklik kaynağı olan soruya yanıt vermeme rastgele olabilir veya yanıtlayanın aşırı ve potansiyel olarak istenmeyen bir yanıt değişkeni değeri seçmiş olmasından kaynaklanıyor olabilir.
Örneğin, siyah bir kadın görüşmeci tarafından sorulan önyargılı tutumlarla ilgili soruları yanıtlayan oldukça önyargılı beyaz bir erkek katılımcıyı düşünün. Eksik yanıtın yanıtın değerine bağlı olduğu bu gibi durumlarda, eksik veri mekanizması göz ardı edilemez.Eksik veri mekanizmasının göz ardı edilebilir olup olmadığını nasıl belirleriz? Sosyal bilim literatüründe çeşitli x değişkenlerinin başka bir x veya y üzerindeki eksikliği öngörüp öngörmediğini bildirmek yaygın bir uygulama olsa da, resmi olarak bu yaklaşım bize sadece verilerin OAR olup olmadığını söyler. Verilerin MAR olup olmadığını belirlemenin kesin bir yolu yoktur, çünkü bu belirlemeyi yapmamız için gereken veriler elbette eksiktir.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
arka tahmin kontrolleri eğitimin gelir üzerindeki etkisi eksik veri mekanizması eksik verilere sahip vakalar Eksik Verileri Dahil Etme Eksik verilerin nasıl ele alınacağı Eksiklik Türleri göz ardı edilemeyen veriler İstatistik – Sosyal Bilimlerde İstatistik (50) – Eksik Verileri Dahil Etme – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma siyah bir kadın görüşmeci Sosyal bilim araştırmaları Verilerin MAR olup olmadığı