İstatistik – Sosyal Bilimlerde İstatistik (53) – Genelleştirilmiş Doğrusal Modeller – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Eksik veriler için basitçe tek bir sabit değer atamak gibi ortak bir yaklaşımı benimsemiş olsaydık (regresyon uygulamasını veya ortalama yüklemeyi kullanarak), eksik veriler tarafından sunulan belirsizliğin göz ardı edileceğini bilmek önemlidir. ve arka standart sapmalar daha da küçük olacaktır.
Bu modellerde parametre tahminlerinin tutarlı olması, sonuçların eksik verilere karşı sağlamlığı konusunda bize güven veriyor mu? Sonuçların bu tür tutarlılığının sağlamlık gösterdiğine inanmak cazip olsa da, bu sorunun cevabı “kesinlikle hayır” dır. Yaptığımız yaklaşımların her biri, eksik verilerin MAR olduğunu (ancak muhtemelen OAR değil) varsaymıştır. Eksik veri stratejimizde bu varsayım korunduğu sürece sonuçlar tutarlı bir şekilde benzer olacaktır.
Farklı sonuçlar elde etmek için, MAR varsayımının olası ihlallerini telafi eden modelde ayarlamalar yapmamız gerekir. Elbette bu durumda, o noktada elde ettiğimiz sonuçların gerçekçi olup olmadığını bilmemiz mümkün değil: Bu belirleme, eksik veri üretme mekanizmasına ilişkin ön bilgilerimize dayanmaktadır. Kısacası, MAR varsayımının ihlali söz konusu olduğunda ücretsiz öğle yemeği yoktur. Veriler MAR değilse, eldeki verilerden tarafsız parametre tahminlerinin nasıl elde edileceğini bilemeyiz.
Sonuçlar
Bu bölümde, Metropolis-Hastings örnekleme algoritması ve iki Gibbs örnekleyici kullanarak çoklu regresyon modeline Bayesci yaklaşımı gösterdik. Bu süreçte, algoritmaların ne kadar iyi performans gösterdiğini değerlendirmek ve modellerin verilere ne kadar iyi uyduğunu değerlendirmek için önceki bölümde tartışılan tekniklerden birkaçını kullandım. Son olarak, Gibbs örneklemesinin, MAR olan eksik verilerle başa çıkmak için nasıl kolayca uyarlanabileceğini gösterdim. Bir sonraki bölümde, sonuç değişkeni sürekli olmadığında yararlı olan bazı temel genelleştirilmiş doğrusal modelleri ele alacağız.
Egzersizler
1. Doğrusal regresyon modelinde (yani Denklem 7.5) regresyon vektörü (β) için maksimum olabilirlik tahminini türetin.
2. Tüm regresyon parametrelerini aynı anda örnekleyen doğrusal regresyon modeli için bir MH algoritması geliştirin. Makul bir kabul oranı sağlayan bir teklif yoğunluğu bulmak ne kadar zor? İyi bir teklif yoğunluğu bulmak için bazı olası stratejiler nelerdir?
3. Taşma / yetersizlik sorunları hakkında endişelenmeden orijinal arka yoğunluk (kayıtlı sürümle değil) ile nasıl çalışabiliriz. İpucu: Oranı durum bazında hesaplamayı düşünün. R kodunu yazın ve test edin.
4. Gibbssampler’ı geliştirinGibbsörnekleyici, diğer tüm ortak değişkenler üzerinde gelişmeye bağlı gelişmeyle ilgili eksikliklere karşı gelir simülasyonu.
5. Verilerin MAR olduğunu varsayan çeşitli eksik veri yaklaşımları altında, önemli ölçüde değişen katsayıların yalnızca bazı bölge katsayıları olduğunu keşfettik. Neden değiştiler?
6. Kendi verilerinizi kullanarak, sonuç değişkenini her onuncu durum için eksik olarak kabul edin ve sonuçtaki eksiklikle ilgilenen Gibbs örnekleyicisini yeniden çalıştırın. Eksik olarak değerlendirilen her beşinci vakayla işlemi tekrarlayın. Son olarak, diğer tüm vakalar eksik (% 50 eksik) ile işlemi tekrarlayın. Parametrelerin arka ortalamalarına ve standart sapmalarına ne olur?
Genelleştirilmiş Doğrusal Modeller
Son bölümde, doğrusal regresyon modelini tartıştık. Bu modeli kullanmak için bir gereklilik, sonuç değişkeninin sürekli ve normal olarak dağıtılmış olmasıdır. Sosyal bilim araştırmalarında, sürekli bir sonuç değişkenine sahip olmak nadirdir. Daha sık olarak, ikili, sıralı veya nominal sonuçlara sahip olma eğilimindeyiz. Bu durumlarda, önceki bölümde tartışılan doğrusal regresyon modeli birkaç nedenden dolayı uygun değildir.
İlk olarak, değişken varyans ve normal olmayan hatalar, sonuç sürekli olmadığında garanti edilir ve parametreler üzerindeki istatistiksel testlerin gerekçesini geçersiz kılar. İkinci olarak, doğrusal model genellikle imkansız olan değerleri tahmin edecektir. Örneğin, son bölümdeki tolerans öğesinin aralığı 5 olmasına rağmen, modeldeki hiçbir şey tahmin edilen değerlerin [0,5] aralığının dışına çıkmasını engellemiyor. Üçüncüsü, doğrusal model tarafından belirtilen işlevsel form genellikle yanlış olacaktır .
Örneğin, bir ortak değişkendeki artışların, aşırı uçlardaki bağımlı değişken üzerinde ortaya doğru elde edileceği gibi aynı getirileri sağlayacağından şüphe etmeliyiz. Bu konuyu önceki bölümde incelememiş olsak da, eğitimin hoşgörü üzerindeki etkisinin, örneğin eğitim dağılımının ortasında, her iki uçta olduğundan daha büyük olacağı açıktır. Bir üniversite derecesinin ötesinde birkaç yıllık eğitim eklemek veya birkaç yıl eklemek, ancak 8’in altında bir sınıf düzeyini korumak, muhtemelen bir bireyin hoşgörüsünü etkilemede 11 ila 12 yıllık eğitimden veya 12 ila 16 yıllık eğitime geçiş kadar etkili olmayacaktır.
Genelleştirilmiş doğrusal modeller (GLM’ler) bu sorunları ele almak için bir yol sağlar. Temel OLS regresyon modelinin şu şekilde ifade edilebileceğini hatırlayın:
- μ i = X iT β,
μi = E (yi) olduğu yerde. Bu belirtimde hata terimi bulunmadığına dikkat edin: Bunun nedeni, beklenen yi değerinin basitçe doğrusal öngörücü olmasıdır. Genelleştirilmiş doğrusal modeller şu şekilde ifade edilebilir:
- F (μ i) = X iT β, μi = E (yi).
Yani, beklenen yi değerinin bir F fonksiyonu, zaten aşina olduğumuz doğrusal tahmin ediciye eşittir. Bu işleve “bağlantı” işlevi adı verilir, çünkü doğrusal olmayan / sürekli olmayan değişken yi’yi doğrusal öngörü XiT β ile ilişkilendirir. Sosyal bilimlerde kullanılan en yaygın GLM’ler ve bunların bağlantı işlevleri Tablo 8.1’de bulunabilir. Tabloda gösterildiği gibi, bağlantı işlevi basitçe F (μ) = μ olduğunda, doğrusal regresyon modeline sahibiz; bağlantı fonksiyonu F (μ) = ln (μ / (1 – μ)) olduğunda, lojistik regresyon modeline sahibiz.
Not: Görünüşe göre, hiçbir ortak değişken kombinasyonu gerçekten izin verilen aralığın dışında tahmin edilen değerler üretmeyecektir, ancak bunun nedeni modelin kötü uymasıdır, belirtildiği gibi ortak değişkenlerin sonuç üzerinde fazla etkisi yoktur.
Bağlantı fonksiyonunu ifade etmenin alternatif bir yolu, μi dönüşümünden ziyade XiT β dönüşümü anlamındadır. Bu durumda, lojistik regresyon modelini örneğin şu şekilde yazabiliriz:
- T e X iT β μ = G (X ben β) ≡ 1 + e X iT β,
Burada G = F − 1. İkili logit ve probit modellerinde, E (yi) = p (yi = 1) ve bu nedenle model olasılıklar açısından yazılabilir:
- p (yi = 1) = G (XiT β).
Bu gösterimde G, bağlantı işlevidir. Lojistik regresyon modeli için G, kümülatif standart lojistik dağılım fonksiyonudur, oysa bir probit modeli için G, kümülatif standart normal dağılım fonksiyonudur.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Bağlantı fonksiyonu Bu belirtimde hata terimi doğrusal tahmin edici Egzersizler Eksik veriler Genelleştirilmiş doğrusal modeller İstatistik – Sosyal Bilimlerde İstatistik (53) – Genelleştirilmiş Doğrusal Modeller – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma Lojistik regresyon modeli