İstatistik – Sosyal Bilimlerde İstatistik (45) – Biçimsel Karşılaştırma ve Birleştirme Modelleri – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Doğrusal Regresyon Modeli
Bu kitabın ilk altı bölümü, matematiksel bir olasılık bakış açısıyla istatistiksel modelleme geliştirdi, veri analizine Bayes yaklaşımını tanıttı, istatistiksel çıkarım yapmak için Bayes posterior dağılımlarından nasıl örnek alınacağını gösterdi ve MCMC’yi değerlendirmenin temellerini gösterdi ve algoritma performansı, model uyumunu değerlendirme ve modellerinin karşılaştırmasını içerir.
Şimdiye kadar modeller nispeten basitti; yine de sosyal bilim araştırmalarında istatistiksel modelleme genellikle teorik olarak önemli bir dizi öngörücü ve kontrolün etkisini değerlendirmek istediğimiz sonuçlar olarak bir veya daha fazla değişkeni seçmeyi içerir. Kısacası, çoğu sosyal bilim veri analizi bir tür regresyon modellemesi içerir.
Bu yazı dizisinin geri kalan bölümleri, bu tür analizlerin Bayesçi bir çerçevede nasıl gerçekleştirileceğini göstermeye yöneliktir. Temel modellerin kendileri oldukça tanıdık olmalıdır ve bu nedenle yeni içerik, bunların Bayes uygulaması olacaktır. Bir Bayesçi’nin bu modellere nasıl yaklaşabileceğini gösterme sürecinde, Bayesci bir yaklaşımın, eksik verileri işleme kolaylığı, modellerdeki parametrelerin fonksiyonları için istatistiksel çıkarım yapma yeteneği dahil bazı avantajlarını göstereceğim. model uyumunu değerlendirmek için olası yöntemlerin genişliği.
Doğrusal Regresyon Modelinin Geliştirilmesi
Doğrusal regresyon modeli – genellikle “sıradan en küçük kareler (OLS) Regresyon Modeli” olarak adlandırılır – tüm sosyal bilimsel araştırmaların temel modelidir. Son birkaç on yılda daha karmaşık modeller, özellikle genelleştirilmiş doğrusal modeller ve hatalar arasındaki seri korelasyonu idare edebilen modeller (örneğin, sabit ve rastgele etkiler modelleri) ile değiştirilmiş olsa da, temel varsayım bir sonuç değişkeni y (veya bunun bir fonksiyonu) yordayıcı değişkenlerin doğrusal bir kombinasyonu olarak ifade edilebilir ve bazı stokastik hatalar, günümüzde sosyal bilimdeki hemen hemen tüm parametrik modellerin temelidir.
Doğrusal regresyon modeli çoğu lisansüstü programda tartışılan ilk model olduğu için, modeli ve teoriyi geliştirmek için fazla zaman harcamıyorum (doğrusal modelin ayrıntılı tartışması için bkz. Fox 1997 veya Neter ve diğerleri 1996). Bunun yerine, öncelikle modelin parametrelerini tahmin etmek için kullanılabilecek birkaç MCMC yaklaşımını göstermeye odaklanıyorum.
OLS regresyon modeli genel olarak iki yoldan biriyle temsil edilir; biri sonuç değişkeni y için bir dağılımın doğrudan spesifikasyonunu içerir ve diğeri e hatası için bir dağılımın spesifikasyonunu içerir. Klasik ve tipik sosyal bilim spesifikasyonuna göre, yi’nin bir dizi yordayıcı, XiT β artı hata ei’nin doğrusal bir kombinasyonuna eşit olduğunu ve hata teriminin normal olarak bir ortalama 0 ve bir miktar varyansla dağıtıldığını varsayıyoruz, σe2. Numunenin tamamı için matris formunda:
- Y = Xβ + e, (7.1)
- e ∼ N (0, σe2In), (7,2)
Burada, n boyutlu bir kimlik matrisidir. Çoğu zaman, bu terim spesifikasyonda ihmal edilir, ancak vektörün dağılımı teknik olarak çok değişkenli normaldir ve bir 0 ortalama vektör ve bir n × n kovaryans matrisi ile. Bu matrisin köşegen öğelerinin tümü eşittir (hata varsayımının eş varyansını temsil eder) ve bu matrisin köşegen dışı öğeleri 0’dır (hataların bağımsızlığı varsayımını temsil eder).
Hata terimi için normallik varsayımı OLS tahmini için gerekli değildir, ancak maksimum olabilirlik tahmini ve parametreler üzerinde klasik istatistiksel testler (t-testleri) için gereklidir. Maksimum olabilirlik yaklaşımı altında, normal bir hata varsayımı, aşağıdaki olasılık fonksiyonunu verir.
Β ve σe2’nin (sırasıyla βˆ ve σˆ2) en iyi tahminlerini ve bunların standart hatalarını bulmak için maksimum olasılık çözümü, Bölüm 2’de tartışılan adımların ardından bu olasılık fonksiyonunun logunun birinci ve ikinci türevlerini alarak bulunabilir. Türevden sonra şunu buluruz:
- βˆ = (XT X) −1 (XT Y),
Burada e, errors altında elde edilen hataların vektörüdür. Parametreler için tahmin edilen standart hatalar, parametrelerin asimptotik kovaryans matrisinin köşegen elemanlarının karekökü alınarak bulunabilir ve hata varyansı için standart hata da bulunabilir1:
- ACOV (βˆ) = σˆe2 (XT X) −1, (7.7)
Hata terimi üzerinde normal bir dağılım belirtmek yerine, bir Bayes belirtimi tipik olarak y | üzerinde bir normallik varsayımıyla başlar. x (genellikle koşullandırma bastırılırken): yi ∼ N (XiT β, σe2) Bu belirtim, klasik çözümle aynı olasılık işlevini verir. Modeli tamamen Bayesçi yapmak için geriye kalan şey, β ve σe2 için bir önceliğin belirtimidir ve bu genellikle her parametre için bağımsız önseller belirleyerek yapılır. Normal dağılım modeli için önceki ortak referans 1 / σe2 — genellikle hata varyans parametresi için belirtilirken, gerçek doğrunun üzerinde uygunsuz bir tekdüze bir önceki genellikle regresyon parametreleri için belirtilir. Bu, aşağıdaki gibi görünen bir arka dağılım sağlar:
- P (β, σe2 | X, Y) ∝ (σe2) – (n / 2 + 1) (Y − Xβ) T (Y − Xβ)
Bu posteriorun, olasılık işlevinden yalnızca baştaki üsde farklı olduğunu unutmayın. Σe2 için üssün mutlak değeri n / 2’den n / 2 + 1’e yükseltilir ki bu, olabilirlik fonksiyonunun asimptotik olarak ilgisiz bir modifikasyonu olan. Bu sonuç bir kez daha, büyük örneklerle, öncekinin arka çıkarımı etkilemede çok az önemli olabileceğini vurgulamaktadır.
Posterior bir dağılım verildiğinde, Bayesci yaklaşımın amacı, önceki bölümlerde tartıştığımız gibi, parametre ve onun standart hatası için basitçe bir nokta tahmininden daha fazlasını üretmektir. Bu nedenle, şimdi bu arka dağıtımdan örnekleme için birkaç stratejiyi tartışıyorum. Bu model iyi çalışılmış ve tüm koşullu parametreler için iyi bilinmesine rağmen, iki farklı Gibbs örnekleyicisiyle birlikte bir MH algoritması geliştireceğim.
NOT : Bu standart hata neredeyse hiç kullanılmaz ve hatta klasik regresyon analizinde rapor edilmez, çünkü kısmen ona dayalı normal teori testleri (örneğin, regresyon katsayıları gibi t-testleri) uygun değildir. Varyanslar ters gama dağılımlıdır ve dolayısıyla negatif değildir. Bu nedenle, bir varyans parametresinin istatistiksel önemini değerlendiren tipik bir t testi, sadece mantıksız bir testtir. Ne yazık ki, varyans parametrelerinin standart hatalarının yaygın olarak bildirildiği bir ortam olan yapısal eşitlik modellemesinde, kullanıcılar genellikle bu tür t-testlerinin sonuçlarını rapor eder ve varyansın 0’dan küçük olduğu hipotezini test etme mitini sürdürür.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Doğrusal regresyon modeli Doğrusal Regresyon Modelinin Geliştirilmesi Hata terimi için normallik varsayımı Hata terimi üzerinde normal bir dağılım İstatistik – Sosyal Bilimlerde İstatistik (45) – Biçimsel Karşılaştırma ve Birleştirme Modelleri – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma klasik regresyon analizi n boyutlu bir kimlik matrisi olasılık işlevi Parametreler için tahmin edilen standart hatalar Posterior bir dağılım regresyon modeli