İstatistik – Sosyal Bilimlerde İstatistik (52) – Eksik Verileri Dahil Etme – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Yalnızca iki ek değişiklik şunları içerir: (1) Sonuç vektörünün, eksik verilerin simülasyonu nedeniyle her yinelemede değiştiği göz önüne alındığında, β için koşullu posterior için ortalama her yinelemede hesaplanmalıdır (yani, bu şu satırdır: b [i,] <- katsayılar (lm (ystar x-1)) …); ve (2) σe2 için ters gama dağılımının ikinci parametresi, y ‘güncellendikten sonra tüm verileri kullanır.;
- for (i in 2: m) {
# eksik verileri simüle edin
ystar = y ystar [y == 999] = rnorm (uzunluk (ystar [y == 999]),
ortalama = x [y == 999,]% *% (b [i-1,]), sd = sqrt (s2 [i-1]))
# çok değişkenli normal koşulundan betayı taklit et b [i,] <- katsayılar (lm (ystar ~ x-1)) +
t (rnorm (9, ortalama = 0, sd = 1))% *% chol (s2 [i-1] * xtxi)
# sigmayı ters gama dağılımından simüle et s2 [i] <- 1 / rgamma (1, uzunluk (y) / 2,
.5 * t (ystar-x% *% (b [i,]))% *% (ystar-x% *% (b [i,])))
…
Gibbs örnekleyicisini bu modifikasyonlarla yeniden çalıştırdım ve liste şeklinde silme işleminden elde edilenlerle neredeyse aynı sonuçları elde ettim. Aslında, orijinal parametre ortalamalarının klasik bir regresyonu ve değiştirilmiş algoritma kullanılarak elde edilen parametre ortalamalarındaki posterior standart sapmalar ve standart sapmalar, .02 (se = .02) ve .997 (se = .002) değerinde bir kesme noktası sağladı (R2 = .999) tahmin kümeleri arasında neredeyse bire bir yazışma önermektedir. Eksik verilerin mevcut olduğu yalnızca 34 gözlemimiz olduğu ve eksik vakaların gözlemlenen vakalara benzer olduğunu varsaydık (yani, aynı modeli izlediklerini) varsayarsak, bu sonuç şaşırtıcı değildir.
Şimdiki örneğe dönersek, şimdi gelirle ilgili eksik gözlemleri de ekleyelim. Orijinal verilerde 302 kişi gelir konusunda kayıptı. Geliri olmayan ve acil durum sonucu değişkeninde eksik olan bireyleri de dahil edersek, 2,696’nın tam örneğine sahibiz. Eksikliğin gelire dahil edilmesi, belki de sonuçta eksikliğin dahil edilmesinden daha basittir, çünkü gelir modelde dışsal bir değişkendir. Bu nedenle, gelir eksikliğini gidermeye yönelik basit bir yaklaşım, eksik gelir verilerinin MAR olduğunu varsaymaktır. Bu varsayım altında, Gibbs örnekleyicisine, eksik gelir değerlerinin simüle edilmiş değerlerle değiştirildiği basit bir adım ekleyebiliriz.
Gelir için hiçbir koşullu model olmadan ve MAR varsayımı altında, gözlemlenen durumlar arasında gelir dağılımına dayalı olarak gelir değerlerini simüle etmek mantıklıdır. Gelirin normal olarak dağıtıldığını varsayarsak (ki bu iyi bir varsayım olmayabilir), o zaman gelir üzerinde gözlemlenenler arasındaki ortalama ve standart gelir sapmasını kullanarak bu değişkende eksik olanlar için gelir değerlerini simüle edebiliriz. Bu, Gibbs örnekleyicide yalnızca aşağıdaki değişiklikleri yapmamız gerektiği anlamına gelir:
- …
for (i in 2: m) {
xstar = x xstar [x [, 6] == 999,6] = rnorm (uzunluk (xstar [x [, 6] == 999,6]),
ortalama = ortalama (x [x [, 6]! = 999,6]), sd = sd (x [x [, 6]! = 999,6]))
ystar = y ystar [y == 999] = rnorm (uzunluk (ystar [y == 999]),
ortalama = x [y == 999,]% *% (b [i-1,]), sd = sqrt (s2 [i-1]))
# çok değişkenli normal koşulundan betayı taklit et b [i,] = katsayılar (lm (y ~ x-1)) +
t (rnorm (9, ortalama = 0, sd = 1))% *% chol (s2 [i-1] * çöz (t (xstar)% *% xstar)) …
Bu değişikliğin, y üzerindeki eksik verileri dahil etmek için yaptığımız değişikliği yansıttığına dikkat edin. Temel fark, y için eksik değerlerin, ortalama olarak regresyon öngörülen değer ve varyans olarak hata varyansı kullanılarak simüle edilmiş bir değerle değiştirilmesidir; oysa gelir için eksik değerler, sadece gözlemlenen ortalama ve varyans kullanılarak simüle edilmiştir. gelir değerleri. Şimdi her yinelemede (X T X) -1 hesaplamamız gerektiğine de dikkat edin, çünkü X matrisi, eksik X simüle edildiği her seferinde değişir.
Bu yaklaşım kapsamında elde edilen parametre tahminleri, listeye göre silme kullanılarak elde edilenlerden önemli ölçüde farklılık göstermez veya bir Güney göçmeni olmanın etkisi hariç, sonuç değişkenine ilişkin eksik verileri dahil etmek için önceki değişikliği kullanmaz ( bkz. Egzersizler). Bununla birlikte, artan örneklem büyüklüğünün bir sonucu olarak, arka standart sapmalar daha küçüktür ve eksik olanların eksik olmayan modelle aynı modeli takip ettiği varsayımıyla birleştiğinde (yani, bunlar MAR’dır).
Not: İlk sütun, yalnızca eksiksiz bilgi içeren vakalar kullanıldığında sonuçları gösterir. İkinci sütun, Y’de eksik olan kişiler analize dahil edildiğinde elde edilen sonuçları gösterir (metne bakın). Üçüncü sütun, eksik gelir değerleri, gözlenen durumlar için olanlara eşit bir ortalama ve varyans ile normal bir dağılımdan simüle edilmiş değerler kullanılarak stokastik olarak değiştirildiğinde sonuçları sunar. Dördüncü sütun, eksik gelir değerleri stokastik olarak tahmin edilen değerlerle değiştirildiğinde sonuçları ve diğer tüm yordayıcı değişkenleri kullanarak gözlemlenen durumlar için geliri tahmin eden bir regresyon modelinden gelen hata varyansını sunar.
Aşağıda çeşitli modeller için parametre tahminlerini ve arka standart sapmaları göstermektedir. Tablodaki son sütun, gelir kalemiyle ilgili eksik verileri ele almaya yönelik ek bir yaklaşımın sonuçlarını gösterir: regresyon temelli simülasyon. Önceki yaklaşıma göre, eksik vakalar için ortak değişkenlerin değerlerine bakılmaksızın, tüm gözlemlerde ortak olan bir dağılımdan eksik geliri basitçe simüle ettik. Alternatif bir yaklaşım, diğer tüm öngörücüler üzerindeki gelirin regresyonunu tahmin etmek ve normal dağılımdan elde edilen gelir değerini, gelir için regresyon temelli tahmin edilen puana eşit bir ortalama ve kalan varyansa eşit bir varyans ile simüle etmektir. 5 Değişikliği bırakıyorum Gibbs örnekleyicisinin bu yaklaşımı bir egzersiz olarak ele almasını sağladı. Bu sonuçlar seti, gelir eksikliğini ele almak için önceki yaklaşım kullanılarak elde edilenlerle hemen hemen aynıdır.
Genel olarak, sonuçlar parametre tahminleri arasındaki farklılıklardan daha fazla benzerlik ortaya koymaktadır, ancak son iki yaklaşım, parametrelerin arka standart sapmalarında önemli bir azalma göstermektedir. Bunun nedeni, eksik veriler nedeniyle silinmiş olabilecek gözlemler tutularak örneklem büyüklüğünün artırılmasıdır. Standart hatadaki bu azalma meşru mudur; yani, modellerimizin mevcut eksik verilerin belirsizliğini fark etmesine rağmen, daha küçük posterior standart sapmalar görmeli miyiz? Evet, aslında, Merkezi Limit Teoreminin önerdiği gibi, gözlemlerin eksik verilerle birleştirilmesiyle elde edilen örnek büyüklüğünün karekökündeki kazançla orantılı olarak arka standart sapmalar azaltılır.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Bu yaklaşım kapsamında elde edilen parametre tahminleri çeşitli modeller için parametre tahminleri eksik verilerin simülasyonu Gelir için hiçbir koşullu model Gibbs örnekleyicisi İstatistik – Sosyal Bilimlerde İstatistik (52) – Eksik Verileri Dahil Etme – İstatistik Nedir – İstatistik Fiyatları – Ücretli İstatistik Yaptırma parametre tahminleri arasındaki farklılıklar varyans ile normal bir dağılım y üzerindeki eksik verileri dahil etmek