İstatistik – Sosyal Bilimlerde İstatistik (80) – Çizimlerin Simülasyonu – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
İlk adım olan başlangıç değerlerini bulmak kolaydır. Genelde tüm regresyon parametrelerini 0’da ve hata kovaryans matrisini Σ bir kimlik matrisi olarak başlatırım. Dördüncü adım, regresyon katsayılarının simülasyonu – çok az tartışma gerektirir. Gizli veriler Z, gözlemlenen Y sıralı verilerini değiştirdiğinde ve uygun bir Σ matrisi mevcut olduğunda, regresyon parametrelerinin koşullu dağılımı, önceki bölümde sunulan çok değişkenli regresyon modelininkiyle aynıdır. İkinci, üçüncü ve beşinci adımlar ise biraz tartışmayı gerektirir.
Kesilmiş Çok Değişkenli Normal Dağılımlardan Çizimlerin Simülasyonu
Kesilmiş çok değişkenli normal dağılımlardan çizimlerin simülasyonu, kesilmiş tek değişkenli normal dağılımlardan gelen çizimleri simüle etmekten önemli ölçüde daha karmaşıktır. Bu tür çizimleri simüle etmenin bir yöntemi, Bölüm 8’de tartıştığımız saf yaklaşımdır: Uygun bölgeden bir çekiliş elde edene kadar kesilmemiş normal dağılımlardan simülasyon yapıyoruz.
Örneğin, mevcut örneği kullanarak, gözlemlenen bir y = (2,3) yanıtı olan bir kişi için gizli bir puanı simüle etmek isteseydik, Şekil 10.1’de örneklenen iki değişkenli normal dağılımın tamamından şunu elde edene kadar simüle ederdik. koyu çerçeveli bölgeye düşen bir beraberliği lekelemiştir.
Bu naif yaklaşımın son derece verimsiz olduğunu ve sorunun boyutu arttıkça ve sıralı değişkenlerdeki kategori sayısı arttıkça giderek daha fazla hale geldiğini görmek kolaydır. Temel olarak, çok değişkenli normal eğrinin altındaki toplam alana göre bir hücredeki çok değişkenli normal eğrinin altındaki alanın oranını azaltan herhangi bir şey, naif yaklaşımın etkinliğini azaltır.
Kısaltılmış tek değişkenli normal dağılımlardan nasıl simüle edileceğini zaten tartışmıştık ve bu nedenle, kesik çok değişkenli normal dağılımımızdan simülasyonu bir dizi kesilmiş tek değişkenli normal dağılım simülasyonlarına ayırabilirsek, sorunumuz çözülmüş gibi görünüyor.
Çok değişkenli simülasyon problemini bir dizi tek değişkenli probleme ayırmanın bir yolu, f (x1, x2, …, xK − 1, xK) ortak yoğunluk fonksiyonunu koşullu dağılımların ürününe (bizim gibi f (A, B) = f (A | B) f (B) şeklindeki koşullu olasılık kuralını kullanarak Bölüm 9’da hiyerarşik modeller oluşturmayı başardı. Bu ayrıştırmayı iki değişkenin ötesine taşıyabiliriz:
- f (x1, x2, …, xK) = f (xK | xK − 1, …, x1) … f (x3 | x1, x2) f (x2 | x1) f (x1).
Bu ayrıştırmanın doğru olduğu, sağ uçtan başlayarak ve ilk marjinal zamanların ilk koşulun iki değişken için ortak bir dağılıma yol açtığını kabul ederek görülebilir. Bu ortak dağılım, daha sonra, bir sonraki koşullu dağılımla çarpıldığında, üç değişken için ortak bir dağılım sağlayan yeni bir marjinal dağılımdır ve böyle devam eder:
- f (x1, x2, …, xK) = … f (x4 | x1, x2, x3) f (x3 | x1, x2) f (x2 | x1) f (x1)
Böylece, x1’i uygun tek değişkenli normal dağılımından ilk olarak çizebiliriz. Sonra, bu çekilişe koşullu olarak, f (x2 | x1) ‘den x2 çizebiliriz. Sonra, bu çizimlere koşullu olarak, f (x3 | x1, x2) ‘den x3’ü çizebiliriz, vb. Daha önce, bir değişkenin (örneğin x2) standart iki değişkenli normal dağılımdan diğerine (örneğin x1) verilen koşullu dağılımının ρx1 ve varyans 1 – ρ2 ile tek değişkenli normal olduğunu tartışmıştık. Daha genel olarak, çok değişkenli bir normal dağılımdaki tek bir değişken için koşullu dağılımın kendisinin normal olduğu bilinmektedir. Z ∼ MVN (μ, Σ) ise, (Za | μ (−a) = M) ∼ N (μ ∗, Σ ∗), burada:
- μ ∗ = μa + Σa.Σ − 1 μ (−a) – M olur.
Bu ifadelerde, Σ (−a), satır ve a, Σa sütunlarının çıkarılmasıyla elde edilen çok değişkenli kovaryans matrisidir. Σ’nin ath satırıdır (benzer şekilde, Σ.a, Σ’nin ath sütunudur) ve M, diğer (yani −a) boyutlar için normal çekilişlerin mevcut değeridir.
Bu nedenle, çok değişkenli normal dağılımdan örnekleme, ilk değişkeni tek değişkenli marjinal dağılımından basitçe örneklemeyi içerir; daha sonra ikinci değişkeni, yalnızca birinci değişkene bağlı olan tek değişkenli koşullu dağılımından örneklemek, ardından üçüncü değişkeni yalnızca birinci ve ikinci değişkenlere bağlı olan tek değişkenli koşullu dağılımından örneklemek ve bunun gibi yaklaşımlarda bulunmak gerekir.
Aşağıda, 10.000 numunenin ortalama vektör ile beş boyutlu normal dağılımdan aldığı bir R alt yordamı bulunmaktadır.
μT = [12345] ve tüm kovaryansları .5’e eşit ve varyansları σ2 = [5 4 3 2 1] olan kovaryans matrisine bakılır. Örnekleme, son eleman (x5) ile başlar ve uygun koşullu dağılımdan x1’e geri hareket eden örneklerle başlar.
Böylece, dördüncü eleman koşullu dağılımından örneklenirken, ilgili kovaryans matrisi x4 ve x5 değişkenleri için 2 × 2 matristir. Üçüncü eleman örneklenirken, ilgili kovaryans matrisi değişkenler için 3 × 3 kovaryans matrisidir.
x3, x4 ve x5, vb .:
d = 5
x <-matris (NA, 10000; d)
mu = matris (c (1,2,3,4,5), d)
sig = matris (.5, d, d)
sig [1,1] = 5; sig [2,2] = 4; sig [3,3] = 3; sig [4,4] = 2; sig [5,5] = 1
için (1: 10000’de)
{
# simüle 5. öğe x [i, d] = rnorm (1, mu [d], sqrt (sig [d, d]))
#simulate 4th, 3rd … for (d: 2’de j)
{
m = mu [j-1] +
sig [(j-1), (j: d)]% *% çöz (sig [j: d, j: d])% *% (x [i, j: d] -mu [j: d]) s = sig [j-1, j-1] –
sig [(j-1), (j: d)]% *% (çöz (sig [j: d, j: d]))% *% sig [(j: d), (j-1)]
x [i, j-1] = rnorm (1, m, sqrt (s))}
baskı (c (i, x [i,]))
}
10.000 çekilişin ortaya çıkan ortalama vektörü şöyledir:
- x ̄T = [1.001.973.044.005.00],
Bu sonuçlara dayanarak, öyle görünüyor ki, kesik çok değişkenli normal dağılımlardan örnekleme stratejisi bu yaklaşımı basitçe uygulamayı içerebilir, ancak her tek değişkenli çekim için Bölüm 8’de yaptığımız gibi tek değişkenli kesme gereksinimlerini uyguladığımızı garanti eder.
Bir sonraki yazıda bu tür simülasyonu, korelasyon / kovaryans ile kesilmiş standart iki değişkenli normal dağılım üzerinde gerçekleştirmek için basit bir R programı verilecektir. Bu, her iki boyutta da kesme noktası 0’dır, böylece çekimler her boyutta 0’ın yukarısından gelmelidir. Program, hem saf simülasyonu hem de koşullu ayrıştırma yaklaşımını kullanarak bu dağılımdan 2.000 çizimin simülasyonunu yapar.
On yılı aşkın süredir ödev yapma desteği veren Ödevcim Akademik, size İstatistiğin her alanında yardımcı olacaktır. Sosyal Bilimlerde İstatistik, İstatistik Nedir, İstatistik Fiyatları, Ücretli İstatistik Yaptırma, Analiz Yaptırma, Veri Analizi Yaptırma aramalarında sizde Ödevcim Akademik destek olsun istiyorsanız yapmanız gerekenler çok basit. Öncelikle İstatistik ile ilgili belgelerinizi akademikodevcim@gmail.com sayfamızdan gönderebilir ödevleriniz, tezleriniz, makaleleriniz ve projeleriniz ile ilgili destek alabilirsiniz.
çok değişkenli normal dağılımdan örnekleme Çok değişkenli simülasyon problemi dördüncü eleman koşullu dağılım İstatistik – Sosyal Bilimlerde İstatistik (80) – Çizimlerin Simülasyonu – İstatistik Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma Kesilmiş Çok Değişkenli Normal Dağılımlardan Çizimlerin Simülasyonu normal dağılımlardan örnekleme stratejisi standart iki değişkenli normal dağılım tek değişkenli normal dağılım tüm regresyon parametreleri