Extremes (Uç-Aşırı Değerler) İstatistikleri – Aşırılık İstatistikleri – (16) – Aşırılık İstatistiği Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

MAKSİMUMDAN UZAKTA
Basit bir gözlemle başlıyoruz. Bir örneğin maksimumunun bir dağılımın kuyruğu hakkında değerli bilgiler içerdiğini varsaymak gerçekçi olmayacaktır. Diğer büyük sipariş istatistikleri de bunu yapabilir. Bu bölümde, maksimumdan ne kadar uzaklaşabileceğimizi araştırıyoruz. Maksimuma yakın kalırsak, yalnızca birkaç sıra istatistiği kullanılır ve tahmin edicilerimiz büyük sapmalar gösterecektir. Maksimumdan kaçmak, faydalı sipariş istatistiklerinin sayısı arttıkça varyasyonu azaltacaktır; ancak, bir yan sonuç olarak, önyargı daha da artacaktır. Sipariş örnek değerlerinin {Xn − k + 1, n, Xn − k + 2, n, …, Xn, n} alt kümesini kullanmayı planlıyorsak;
- X1, n ≤ X2, n ≤ ··· ≤ Xn − k + 1, n ≤ ··· ≤ Xn − 1, n ≤ Xn, n olur.
Daha sonra, Xn − k + 1, n sıra istatistiğinde en iyi şekilde k sırasını nasıl seçeceğimizi bulmamız gerekir. Açık olan, k’nin örneklem büyüklüğüyle birlikte ∞ eğilimi göstermesine izin verilmesi gerektiğidir. Ancak k / n’nin küçük tutulması gerekip gerekmediği o kadar açık değildir.
Bu bölümde, daha büyük sipariş istatistiklerinin asimptotiklerine daha yakından bakılarak geliştirilen sezgisel bir kılavuz sunuyoruz. Yine, bir pratisyen için, kuyruk miktarlarını tahmin etmek için yalnızca bir numunedeki en büyük değeri kullanmak garip görünebilir, özellikle de bu değer o kadar büyük görünebilir ki, örneklemle pek alakalı görünebilir. Bu analizden, faydalı daha büyük sıra istatistiklerinin sayısının seçiminin, (C second) ve (Cγ ∗) ilişkilerindeki ikinci dereceden davranışa da bağlı olacağı takip edilecektir. Bunlar da bu bölümde geliştirilecektir. Matematiksel detaylar son bölüme ertelenir.
Maksimuma Yakın Sipariş İstatistikleri
Bireysel sipariş istatistikleri için çok çeşitli olası limit kanunları vardır. Eğer k endeksi küçükse, Xn − k + 1, n’nin sınır davranışının maksimum Xn, n’ye benzer olmasını bekleyebiliriz. İlk önce ilgili teoremleri türetiyoruz.
K’inci en büyük sıra istatistiğiyle açık bir şey yapmak için, dağılımına ihtiyacımız var. Bu, kombinatoryal bir tartışmadan kolaylıkla elde edilebilir. Xn − k + 1, n’nin x değerini aşmama olasılığını arıyoruz. Bunu yapmak için, numunedeki n elemanlarından herhangi birini alın ve onu en fazla x’te bir u değerine sahip olmaya zorlayın. Kalan n – 1 değerleri, diğer örnek değerlerinin k – 1’i u’nun sağında, kalan n – k değerleri ise u’nun solunda kalacak şekilde ikili olarak dağıtılmalıdır. Bu nedenle,
Durum 1: k düzeltildi.
Bize aşırı limit probleminin çözümünü veren prosedürü takip ediyoruz. Biz tekrar Teorem 2.1’i kullanın ve gerçek, sınırlı ve sürekli bir fonksiyon olan z’yi alın. Ardından, F (x) = 1 – u ikamesi bunu forma dönüştürür.
Maksimum hakkında öğrendiklerimizden, k = 1 olduğunda, z’nin argümanı k’ye bağlı değildir. Bu nedenle, maksimum durumunda olduğu gibi hala bn = U (n) ve an = a (n) alabiliriz. Çok fazla sorun yaşamadan, F’nin Cγ (a) ‘yı tatmin etmesi durumunda n → ∞ olarak görürüz. Çünkü büyük n ve sabit k için, n! / (n – k)! ∼ nk. Sağ tarafı gama yoğunluğuna ilişkin bir beklenti olarak yorumlayabiliriz. {Ej} ∞j = 1 ile i.i.d dizisini belirtirsek. ortalama 1 olan üstel rastgele değişkenler, daha sonra (3.2) şeklinde yazılabilir
Sınıf orta değeri nedir
Çarpımlar toplamı istatistik
İstatistikte sınıf aralığı hesaplama
Bir dağılımda en çok tekrarlanan değeri ifade eden kavram
İstatistik sembolleri
Test istatistiği
Mod nedir
Durum 2: k → ∞, n – k → ∞
Aşağıda, k, n – k ve bu nedenle n’nin hepsinin ∞ eğilimi olduğunu varsayıyoruz. Elbette bu noktada ne tür bir merkezleme ve normalleştirme kullanılması gerektiğini önceden bilmiyoruz. Öyleyse, a − 1 (X – b) ‘nin n n n − k + 1, n n dağılımda yakınsak olacağı, gerçek sayılardan oluşan bir merkezleme dizisini {bn} ve pozitif gerçeklerin normalleştirme dizisini {a} alın. Formül (3.1) ‘i hatırlayın ve z tekrar R üzerindeki herhangi bir gerçek değerli sınırlı ve sürekli fonksiyon olsun. Sonra, sırasıyla sabitleri ortalayan {an} ve {bn}’ nin norming olduğu of’nin sınırlayıcı davranışını araştırmak istiyoruz.
Önceki analizde olduğu gibi, altta yatan dağılımın özelliklerine bakılmaksızın, z’nin argümanından ayrı olarak diğer tüm bileşenlerin kontrol edilebilmesi şaşırtıcı değildir. Bu, dönüşümle x’i v’ye değiştirerek yapılır. Bu özel dönüşümün neden işe yaradığı kısım 3.4.1’de tam olarak açıklanmıştır. Yukarıdaki denklemi x için çözer ve Zn ifadesinde x = x (k, n, v) ‘yi değiştirirsek, tek yapmamız gereken, v için sınırlı olacak şekilde uygun an ve bn seçimleri bulmaktır. Aslında, 3.4.1 bölümünde gösterildiği gibi, aşağıdaki kapsama sonucuna sahibiz.
(3.3) ‘teki kj = 1 Ej toplamı, k ↑ ∞ olduğunda nihayetinde normal bir değişken tarafından yaklaşık olarak tahmin edileceğinden, normal dağılımın görünümü, merkezi limit teoremi açısından da şaşırtıcı olmamalıdır.
Bir seçiminin k / n oranının sınırlayıcı davranışı tarafından belirlenmesi gerektiği, daha sonra netleşecektir. F dağılımındaki veya kuyruk kuantil fonksiyonundaki koşulların olası k seçimini ve bunun gibi bir a’yı nasıl etkilediğine dair birkaç örnek aşağıda da. verilmiştir.
En büyük sıra istatistiğinin uç değer endeksi için asimptotik olarak tutarlı bir tahminciye yol açtığı sonucunu gösteriyoruz. Şekil 3.1’de, Xn − k + 1, n / a (n / k) ‘yi n, n = 1’in bir fonksiyonu olarak gösteriyoruz. 5, 000, ile k = ⌊n0.25⌋ (düz çizgi), k = ⌊n0.5⌋ (kesik çizgi) ve k = ⌊n2 / 3⌋ (kesik-noktalı çizgi) Burr (1, 1, 1) dağılımı da verilir.
Soldaki rastgele miktarın normal yakınsamasını elde etmeyi umuyorsak, ikinci miktarın da bir sınırı olması gerekir. Diğer bir deyişle, soldaki tahmin edicinin normal yakınsamasını istiyorsak, U (x) / a (x) ‘in x → ∞ olarak 1 /’ye ne kadar hızlı eğilimli olduğuna dair ikinci dereceden bilgiye ihtiyacımız vardır. Bu yakınsama hızı bize hangi hızda k’nin n ile ∞ eğilimi göstermesine izin verildiğini söyleyecektir. Bazıları için U (x) = Cxγ (1 + Dx − β (1 + o (1))) olduğu Hall sınıfından basit bir örnek verelim. β> 0 ve gerçek sabitler C> 0 olur. Sonra kolayca a (x) = γ Cxγ ve koşul √k D n − β miktarının yakınsamasını ister veya k ∼ const × γk√ n2β / (1 + 2β) olur.
Bir dağılımda en çok tekrarlanan değeri ifade eden kavram Çarpımlar toplamı istatistik İstatistik sembolleri İstatistikte sınıf aralığı hesaplama Mod nedir Sınıf orta değeri nedir Test istatistiği