Extremes (Uç-Aşırı Değerler) İstatistikleri – Aşırılık İstatistikleri – (31) – Aşırılık İstatistiği Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

DURUM ÇALIŞMALARI
Condroz Verileri
Bu vaka çalışmasında, Condroz bölgesindeki belirli bir şehirden (NIS kodu 61072) gelen toprak örneklerinin Ca içeriğine (mg / 100 g kuru toprak cinsinden ifade edilir) odaklanacağız. Ca içeriği, pH seviyesi gibi diğer faktörlere açıkça bağlı olsa da, şu an için bu ortak değişken bilgisini göz ardı ediyor ve tek değişkenli özellikleri inceliyoruz. Şekil 6.1 (a), bu şehirden alınan toprak örneklerinin Ca ölçümlerinin histogramını göstermektedir.
Ana ilgi kuyruk modellemede olduğunda, üstel kuantil arsa ve ortalama fazlalık grafiği (birincisinin türev grafiği olarak düşünülebilir) iyi bir başlangıç noktası oluşturur. Bu grafikler Şekil 6.1 (b), (c) ve (d) ‘de verilmiştir. Üstel kuantil grafiğin dışbükey şekli ve en büyük gözlemlerdeki ortalama fazla grafiklerin artan davranışı, Ca içerik dağılımının kuyruğunun H T E doğasının kanıtını verir.
Bir Pareto-tipi modelin uyumunu değerlendirmek için, bu veriler için Şekil 6.2’de verilen bir Pareto kuantil grafiği oluşturulmuştur. Son yedi nokta dışında, Pareto kuantil grafiği daha büyük gözlemlerde doğrusaldır. Pareto kuantil grafiğinin nihai doğrusallığını takip etmeyen en büyük gözlemler, Pareto-tipi modele göre şüphelidir.
Ancak bu analizde şehri koşullandırdık ancak pH seviyesi gibi diğer değişkenlerle olası bağlantıyı hesaba katmadık. Aslında, Şekil 6.3’te verilen Ca’ya karşı pH dağılım grafiğinden görülebileceği gibi, her iki değişken de bağımlı görünmektedir. Dahası, aşırı Ca ölçümleri daha yüksek pH seviyelerinde daha sık meydana gelme eğilimindedir, bu da ortak değişken pH’a bağlı bir kuyruk analizine ihtiyaç olduğunu gösterir. Bu koşullandırma konusuna daha sonra bu vaka çalışmasında döneceğiz.
Bölüm 2’de açıklandığı gibi, Pareto kuantil grafiğinin nihai doğrusallığı, kuyruk indeksi γ için tahmin ediciler oluşturmak için kullanılabilir. Şekil 6.4 (a) ‘da, üstel regresyon modeline uygulanan maksimum olasılık prosedürünün sonuçlarını, γˆ + (düz çizgi) ve Hill tahminleri, Hk, n (kesik çizgi), k’nin bir fonksiyonu olarak gösteriyoruz. Maksimum olasılık tahminleri γˆML 0.26 değeri civarında sabittir ve bu 450 ile 1500 arasındaki k değerleri için, Hill tahminleri ise bu kararlılığı sadece 250 ile 500 arasındaki k değerleri için gösterir.
Bununla birlikte, maksimum olasılık tahmincisi, Pareto-tipi modele göre şüpheli olarak değerlendirilen yedi gözleme karşı daha duyarlı görünmektedir: yaklaşık k = 400, ML algoritması tarafından bulunan optimumda ani bir kayma vardır. Hill tahmincisi için bir optimal k değerinin seçimi, k’nin bir fonksiyonu olarak tahmin edilen asimptotik ortalama kare hatayı çizdiğimiz Şekil 6.4 (b) ‘de gösterilmektedir.
Minimuma kˆopt = 402’de ulaşılır. Şekil 6.4 (a) ve (b) ‘deki dikey referans çizgisi bu tahmini optimal k-değerini temsil eder. Kˆopt’un ötesinde, Hill tahmincisinin maksimum olasılık tahmincisinden saptığını unutmayın. Goegebeur ve ark. (2004), Burr regresyon modelleri bu kalsiyum ölçümlerine uyduruldu, böylece pH seviyesi eş değişken olarak alındı.
Analizleri, koşullu Burr modeline göre altı noktayı şüpheli olarak tanımladı. Şekil 6.4 (c), k’nin bir fonksiyonu olarak bu şüpheli noktaların ML’nin silinmesinden sonra elde edilen γˆ + ve Hk, n’yi göstermektedir. Hk, n’nin karşılık gelen tahmini AMSE’si Şekil 6.4 (d) ‘de verilmiştir; burada optimuma k = 391’de ulaşılır.
Son olarak, sapma düzeltmeli tahminci qˆ (1) (düz çizgi) ve Weissman tahminci k, p qˆ + (kesik çizgi) Q (0.9995) için Şekil 6.5’te k’nin bir fonksiyonu olarak verilmiştir.
Veri ne Demek
Veri Nedir örnek
İstatistik veri nedir
Veri örnekleri
Bilgisayarda veri Ne demek
Matematikte veri nedir
Telefonda veri nedir
Ham veri Nedir
Şimdi, γ ∈ R genel durumu için geliştirilen aşırı değer tekniklerini kullanarak verileri analiz ediyoruz. Şekil 6.6 (a), genelleştirilmiş nicelik grafiğini (log n + 1, k + 1 logUHk, n), k = 1, … , n − 1, Ca ölçümleri için ele alın. Bu genelleştirilmiş kuantil grafik üzerindeki noktaların nihai doğrusal ve artan görünümü, yine Pareto tipi bir model lehine kanıt sağlar.
Ayrıca, Bölüm 5’te verilen tartışmayı takiben, bu grafiğin nihai doğrusal kısmının eğimi, γ için tahmin ediciler oluşturmak için tekrar kullanılabilir. Her ikisi de eğim tahmincisi olan genelleştirilmiş Hill tahmincisi γˆH ve Zipf tahmincisi, n mator γˆZ, bu nihai doğrusallıktan yararlanır ve k, n’de çizilir.
Γˆ Z’nin (kesik çizgi) γ için k’den biraz daha yüksek değerler verdiğine dikkat edin, n γˆH (düz çizgi). Şekil 6.6 (b) aynı zamanda moment tahminlerini Mk, n (noktalı çizgi) k, n ve GP maksimum olasılık tahminlerini γˆML (kesik-noktalı çizgi) göstermektedir. K’nin aksine, n. Hk, n ve γˆ + grafiğinde, Şekil 6.6 (b) gerçekten kararlı bir bölge göstermez, bu da makine öğreniminin γ değeri hakkında çıkarımını daha zor hale getirir.
Son olarak, GP dağılımına dayalı olarak ekstrem niceliklerin tahmini Şekil 6.5’te gösterilmektedir. qˆ (1) ve qˆ + için, Q (0.9995) (kesik noktalı çizgi) için GP tahminini de gösteriyoruz.
Şimdi koşullandırma konusuna dönüyoruz. Özellikle regresyon problemleri için geliştirilen aşırı değer yöntemleri Bölüm 7’de kapsamlı bir şekilde açıklanacak olsa da, şimdiye kadar tartışılan tek değişkenli uç değer metodolojisi temelinde bazı basit analizler yapılabilir.
İlk olarak, Pareto-tipi bir modelin, kovaryant (lar) verildiğinde bağımlı değişkenin koşullu dağılımına uygunluğu, kovaryat uzayda dar kutulardaki yanıt ölçümlerinin Pareto nicelik grafiklerinin incelenmesi ile görsel olarak değerlendirilebilir. Kuşkusuz, gruplandırmaya dayalı böyle bir prosedürün, yalnızca bağımlı değişkenin koşullu dağılımı, ortak değişken (ler) in bir fonksiyonu olarak düzgün bir şekilde değiştiğinde iyi performans göstermesi beklenebilir.
Bu, Şekil 6.7’de gösterilmektedir. Kovaryat pH’ın ayrık doğası göz önüne alındığında, burada kümeleme gerçekten gerekli değildir ve belirli bir pH seviyesindeki tüm yanıt gözlemleri kullanılabilir. Pareto kuantil grafiklerinin nihai doğrusallığı, Pareto-tipi modellerin pH seviyesi verilen Kalsiyumun koşullu dağılımlarına uygun uyumu sağladığını gösterir. Bununla birlikte, Şekil 6.7 (b) ‘deki en büyük gözlemin, diğer büyük gözlemler tarafından belirlenen doğrusal modeli takip etmediğini unutmayın. Bu nedenle, ağır kuyruklu bir modelle karşılaştırıldığında bile bu nokta şüphelidir ve özel dikkat gerektirir.
Bilgisayarda veri Ne demek Ham veri Nedir İstatistik veri nedir Matematikte veri nedir Telefonda veri nedir Veri ne Demek Veri Nedir örnek Veri örnekleri