İstatistik – Sosyal Bilimlerde İstatistik (44) – Biçimsel Karşılaştırma ve Birleştirme Modelleri – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
Denklem 6.5’in sağ tarafındaki ilk terim, her bir özel modelin altındaki parametrenin arka dağılımıdır ve ikinci terim, her modelin kendisi için arka olasılıktır. Her model için son olasılık, Bayes faktörlerine ilişkin önceki bölümde sunulan arka olasılıkların payıdır; bu nedenle, veriler göz önüne alındığında, marjinal olasılığıyla birlikte değerlendirilen her model için bir önceki içerir.
Bu nedenle, BMA altındaki bir parametrenin posterior dağılımı, sonuçta tüm modellerde parametrenin posterior dağılımının ağırlıklı bir karışımıdır.
Model ortalamasını almak çekici olsa da zordur. İlk olarak, incelenen sınıftaki her model için bir tane olmak üzere çok sayıda önceki dağıtımın oluşturulmasını gerektirir.
Bu nedenle, örneğin, yukarıda J ortak değişkenleriyle bahsedilen OLS regresyon modelinde, 2J öncüllerine ihtiyacımız olacaktır. Elbette, basitçe agnostik olabilir ve tüm modellere eşit ağırlık verebiliriz, ancak bunu yapmak bizi arka tarafta birbirine çok benzeyen modelleri tercih etmeye sevk edebilir. İkinci olarak, model ortalama hesaplama potansiyel olarak inanılmaz derecede hesaplama açısından yoğundur. J ortak değişkenleri ile model alanı, tahmin edilmesi gereken 2J modellerinden oluşur.
Model alanını daha yönetilebilir sayıda modele indirmenin yolları olsa da (örneğin, Occam’ın penceresi; bkz. Hoeting ve diğerleri, 1999), bunu yapmak parametre için model ortalamalı posterior dağıtımı tam olarak geçersiz kılar. Bir alternatif, tüm modellerde marjinalleştirmek (ortalama) için MCMC örneklemesini kullanmaktır. Bununla birlikte, bu yaklaşım hesaplama açısından çok yoğun olabilir.
Birkaç nedenden ötürü, bu kitapta BMA örnekleri sunmuyorum. İlk olarak, bu kitap Bayesian istatistiklerine ve MCMC tahminine bir giriş niteliğindedir ve BMA oldukça karmaşık bir süreçtir. Yukarıda belirtildiği gibi, bir sınıftaki tüm modeller için uygun öncelikleri seçmek oldukça zor olabilir ve BMA hesaplama açısından inanılmaz derecede yoğundur. Örneğin, bu kitabın ikinci bölümünde tartışılan modellerden bazılarının tek bir model için çalışması saatler sürebilir.
BMA’yı 2J olası modellerle gerçekleştirmeye çalışmak, önemli programlama uzmanlığı ve çok güçlü bilgisayar sistemlerine (örneğin, bir Beowulf kümesi gibi) erişim olmadan gerçekleştirilemez olabilir. İkincisi ve belki de bu kitapta BMA’yı tartışmamamın en önemli nedeni, sosyal bilimciler tarafından benimsenen temel araştırma yaklaşımı ile bazı açılardan çelişkili görünmesidir. Yani, sosyal bilim araştırması tipik olarak değişkenlerin seçiminde ve bir modelin genel tasarımında bize rehberlik eden bir teori ve bir dizi hipotezle başlar.
BMA’nın mantığı bu yaklaşıma ters düşüyor gibi görünüyor: BMA, verilerin bize belirli değişkenlerin önemli olup olmadığını söylemesine izin veriyor. Tabii ki, hangi değişkenlerin / modellerin bir sınıfta en önemli olduğu önceki beklentilerimizi, modeller için önceki spesifikasyonlarımız aracılığıyla birleştirebiliriz, ancak bunu yaparsak, neden öncelikle test etmek istediğimiz modeli basitçe belirtmeyelim!
Bu strateji, BMA’yı yürütmeye ve değerlendirmekte olduğumuz modeller sınıfındaki tüm modeller için önceden 0 olasılığını atamaya benzer, ancak teorimizin uygun olduğuna inanmamıza neden olduğu ve ona önceden 1 olasılığını veren model hariç.
Sonuçlar
Bu bölümde aşağıdakileri tartıştık;
(1) MCMC algoritmalarının performansını değerlendirmek ve
(2) model uyumunun değerlendirilmesi.
MCMC algoritma performansının değerlendirilmesi önemli bir süreçtir, çünkü model yakınsamış ve iyi karıştırılmamışsa, sonuçlar model parametreleri hakkında çıkarım yapmak için kullanılamaz. Tartıştığımız gibi, algoritma değerlendirmesi çok yönlü bir yaklaşım gerektirir, çünkü tek bir yaklaşım rutinin yakınsayıp iyi karışmış olup olmadığını belirlemek için yeterli bir test oluşturmaz.
Gerçekten de, performansı değerlendirmenin daha iyi yollarını geliştirmek ve belirli problemler için daha iyi performans gösteren algoritmalar geliştirmek, son on yılda MCMC yöntemlerinde önemli bir araştırma alanı olmuştur. Bu bölümde, performansı değerlendirmek için en sık kullanılan yöntemleri ele aldık ve eksik olduğu tespit edilirse performansı iyileştirmek için birkaç stratejiyi tartıştık.
MCMC algoritmamızın ilginin posterior dağılımından tamamen örneklendiğini belirledikten sonra, bir sonraki adımımız modelin verilere gerçekten iyi uyup uymadığını değerlendirmek olmalıdır. Bu bölümde, model uyumunu değerlendirmek ve modelleri karşılaştırmak için çeşitli yöntemleri tartıştık, ancak asıl odak noktası posterior tahmin kontrolleriydi.
Derinlemesine tartışmayı bu yaklaşımla sınırladım, çünkü posterior tahmine dayalı simülasyonun gerçekleştirilmesi kolaydır ve modelin ilgilendiğimiz verilerin herhangi bir özelliğine ne kadar iyi uyduğunu değerlendirmek için oldukça esnek bir yaklaşımdır.
Bu iki konudaki kapsamımız nispeten basittir ve büyük ölçüde uydurma örneklerle sınırlıdır. Kalan bölümlerde, MCMC performansını değerlendirmek ve ortak sosyal bilim modellerini ve gerçek sosyal bilim modellerini kullanarak model uyumunu değerlendirmek için çeşitli stratejiler kullanacağız.
sosyal bilim verileri.
Egzersizler
1. Kalıntı analizi ve son tahmin simülasyonu birbirine nasıl benzer?
2. Posterior tahmine dayalı simülasyon nasıl basitçe tek bir modeli değerlendirme yöntemi değil, modelleri karşılaştırmak için bir yöntem olarak düşünülebilir?
3. Parametreleri tahmin etmek için bir MH algoritması kullanarak son bölümdeki iki değişkenli normal dağılım örneğini yeniden yürütün, ancak bunlar için son derece zayıf başlangıç değerleri seçin. Algoritmayı bu tür kötü başlangıç değerlerinin farklı kümeleriyle beş kez çalıştırın ve ölçek azaltma faktörü R’yi hesaplayın. Ayrıca izleme grafikleri oluşturun. R hesaplaması, iz grafiklerinden daha fazla yanmanın nerede bittiğini düşünmeniz gerektiği konusunda sizi farklı bir sonuca götürüyor mu?
4. Son normal dağılım örneğini bir MH algoritması ile tekrar yürütün. Bu sefer iyi başlangıç değerleri kullanın, ancak algoritmayı araçlar için teklif dağıtımı için farklı genişlikler kullanarak en az yedi kez çalıştırın. İstenilen bir kabul oranı verildiğinde uygun teklif yoğunluğu genişliğini / varyansını belirlemek için bir kural (bu model için) geliştirebilir misiniz?
5. Örnekte olduğu gibi, ortalaması 5 ve varyansı 4 olan normal bir dağılımdan 100 gözlem oluşturun. Şimdi bu değerlerin karesini alın, normal bir dağılımdan geldiklerini varsayın ve bir Gibbs örnekleyici veya bir MH algoritması kullanarak bu normal dağılım için parametreleri tahmin edin. Ardından, modelin verilere uyup uymadığını belirlemek için posterior tahmine dayalı simülasyonu kullanın.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
BMA'nın mantığı Egzersizler İstatistik – Sosyal Bilimlerde İstatistik (44) – Biçimsel Karşılaştırma ve Birleştirme Modelleri – İstatistik Nedir – İstatistik Fiyatları – Ücretli İstatistik Yaptırma Kalıntı analizi MCMC algoritma performansı MCMC algoritmamızın Model ortalaması sağ tarafındaki ilk terim