Extremes (Uç-Aşırı Değerler) İstatistikleri – Aşırılık İstatistikleri – (41) – Aşırılık İstatistiği Nedir? – İstatistik Fiyatları – Ücretli İstatistik Yaptırma

ÇOK DEĞİŞKENLİ AŞIRI DEĞER TEORİSİ
Zaten çok değişkenli aşırılıklar için istatistiksel bir metodolojinin nasıl görünebileceğini ilk hayal etme girişiminde, temel bir güçlükle karşılaşıyoruz: çok değişkenli bir gözlemi tam olarak ‘aşırı’ yapan nedir? Sadece tek bir koordinatın istisnai bir değere ulaşması yeterli mi, yoksa aynı anda tüm boyutlarda aşırı mı olmalıdır?
Daha teknik olarak, hepsi tek değişkenli uç değer istatistiklerinde çok yararlı olan sıra istatistikleri, maksimum örnekleme, kuyruk miktarları, eşik aşımları gibi kavramlara çok değişkenli bir kurulumda ne anlama geliyor? Bu soruların cevapları mevcut duruma bağlı olabilir.
Birden fazla değişken olduğunda ortaya çıkan temelde yeni bir sorun bağımlılık meselesidir. Bir değişkendeki aşırılıklar başka bir değişkendekilerle nasıl ilişkilidir? Olası bağımlılık yapıları nelerdir? Ve onları nasıl tahmin edersiniz?
Tek değişkenli durumda olduğu gibi, alıştırmanın amaçlarından biri veri aralığının dışında bir sonuç çıkarmaktır. Birden fazla değişken söz konusu olduğunda, bunu ancak birkaç koordinatta aşırı uçların birlikte meydana gelme olasılığını doğru bir şekilde hesaba katarsak güvenilir bir şekilde yapmayı umabiliriz.
O halde, çok değişkenli aşırılıkların incelenmesi iki bileşene ayrılır: marjinal dağılımlar ve bağımlılık yapısı. Bu ayrım hem teori hem de pratikte yansıtılmaktadır. Tipik olarak, önce marjlar ele alınır ve ikincisi, marjları ortak bir ölçekte standartlaştıran bir dönüşümden sonra gerçekleşir.
İlk adım yalnızca önceki bölümlerde geliştirilen tek değişkenli teknikleri içerir. Ancak ikinci adım yenidir. Olası sınırlayıcı bağımlılık yapıları sınıfının sonlu boyutlu bir parametrik ailede yakalanamayacağını keşfedeceğiz.
Bu, GEV veya GP dağıtımlarına dayalı parametrik tekniklere güvenebileceğimiz tek değişkenli duruma kıyasla büyük bir aksaklıktır. Bu sefer ya parametrik olmayan tekniklere geçmemiz ya da mantıklı parametrik modeller oluşturmamız gerekecektir.
Aşırı değer bağımlılığı yapılarının çok çeşitli eşdeğer tanımları vardır ve her birinin kendine özgü avantajları olmasına rağmen, bu çok sayıda bazen görünüşte bağlantısız yaklaşım kafa karışıklığına neden olabilir ve teoriden uygulamaya akışı engelleyebilir. Parçaları birbirine uydurmak ve okuyucuya son teknolojinin panoramik bir görüntüsünü vermek bu metnin amaçlarından biridir. Bazı yeni kavrayışlar ve sonuçlar, bu birleştirme çalışmasının hoş bir yan ürününü oluşturur.
Çok değişkenli aşırılıklarla ilgili metin iki bölüme ayrılmıştır. Bu bölümde, bağımsız, özdeş olarak dağıtılmış rasgele vektörlerden oluşan bir numunenin uç noktalarında olasılık teorisini araştırıyoruz. Bu, bir sonraki bölümde yer alan istatistiksel metodoloji için gerekli hazırlığı oluşturur.
Sonuç olarak, materyal çok geniştir ve literatürün tam bir kapsamı bir kitabı kendi başına doldurabilirdi. İlgili okuyucu, örneğin Galambos (1978, 1987), Resnick (1987), Kotz ve Nadarajah (2000), Coles (2001), Drees (2001), Reiss ve Thomas (2001), Fouge`de daha fazla okuma bulabilir.
Bu bölümün ana hatları aşağıdaki gibidir. Bu girişin geri kalanında, tek değişkenli durumda olduğu gibi uygun bir başlangıç noktası olan çekim alanı probleminin çok değişkenli versiyonunu formüle ediyoruz.
Bölüm 8.2’de, çok değişkenli uç değer dağılımları üzerinde çalışıyoruz, esas olarak bağımlılık yapılarına odaklanıyoruz, 8.3. Bölüm ise çekim alanlarını tanımlıyor. Bazı ek konulara kısaca bölüm 8.4’te değinilmiştir. Bölüm 8.5, Bölüm 9’daki istatistiksel konulara saldırmadan önce bilinmesi gereken temel şeyleri özetlemektedir.
Son olarak, ek (bölüm 8.6), diğerlerinin yanı sıra, çok değişkenli uç değer dağılımlarının çeşitli eşdeğer tanımlarını bağlayan bir formül dizini içerir.
Aykırı değer nedir
Bir dağılımda en çok tekrarlanan değeri ifade eden kavram
İSTATİSTİK 1
Aykırı değer formülü
Range istatistik
Mod nedir
İstatistikte sınıf aralığı hesaplama
İstatistik terimleri ve anlamları
Çok Değişkenli Çekim Alanı Sorunu
Tek değişkenli olandan çok değişkenli aşırı değer teorisine giden yol, hemen bir engelle karşı karşıyadır: çok değişkenli gözlemleri sıralamanın açık bir yolu yoktur. Barnett (1976), her biri potansiyel kullanıma sahip çok değişkenli veriler için en az dört farklı sıralama ilişkisi kategorisini dikkate alır.
Çok değişkenli aşırı değer teorisindeki en kullanışlı sıra ilişkisi, marjinal sıralama adı verilen özel bir durumdur: d boyutlu vektörler için x = (x1, …, xd) ve y = (y1, …, yd), x ≤ y ilişkisi tüm j = 1, …, d için xj ≤ yj olarak tanımlanır. Bir boyuttan farklı olarak, her iki vektör bu şekilde sıralanamaz – biri diğerinin sol üst tarafında olmak üzere iki değişkenli iki vektör hayal edin. Bileşen bazında maksimum x ve y, şu şekilde tanımlanır:
- x ∨y: = (x1 ∨y1, …, xd ∨yd),
genel olarak hem x hem de y’den farklıdır. İ = 1, …, n için Xi = (Xi, 1, …, Xi, d) d-boyutlu gözlemlerin bir örneğini düşünün. Örnek maksimum, Mn, artık bileşen-bazlı maksima vektörü olarak tanımlanmaktadır, yani, Mn = ni = 1 Xi’nin bileşenleri ile verilmektedir.
Numune maksimumunun bir numune noktası olması gerekmediğini gözlemleyin; bu anlamda, tanım yapay görünebilir. Yine de, çalışmasından, çok değişkenli verilerin aşırı uçlarını analiz etmek için geniş bir istatistiksel araçlar kümesine götüren zengin bir teori ortaya çıkıyor.
Elbette, maksimumdan ziyade bileşen bazında minimumu da inceleyebiliriz. Ancak açıkça, tek değişkenli durumda olduğu gibi, ikisinden birinin sonuçları, ilişki yoluyla diğerine anında aktarılabilir.
Bu nedenle, genelliği kaybetmeden, yalnızca maksimuma odaklanabiliriz. Aşağıdaki kuralı benimsersek, gösterimler büyük ölçüde basitleştirilecektir: Aksi belirtilmedikçe, vektörler arasındaki tüm işlemler ve düzen ilişkileri bileşen açısından anlaşılır. Bu kuralı, vektörler için yukarıdaki “≤” ve “∨” tanımlarında kullandığımızı gözlemleyin.
Bağımsız bir X1 numunesinin bileşen-bazında maksimumunun, Mn, dağılım fonksiyonu. . . F dağıtım fonksiyonundan Xn, ile verilir;
- P [Mn ≤x] = P [X1 ≤x, …, Xn ≤x] = Fn (x), x ∈Rd.
Tek değişkenli durumda olduğu gibi, örneklem boyutu sonsuza eğilimli olduğundan önemsiz olmayan bir limit dağılımı elde etmek için Mn’yi bir şekilde normalleştirmemiz gerekecek. Çekim alanı problemi daha sonra şu şekilde okunur: (a) ve (b) vektörlerinin dizilerini bulun, burada a> 0 = (0, …, 0), öyle ki a − 1 (M −b) dağıtımda dejenere olmayan bir limite yakınsar, yani, dejenere olmayan marjlara sahip bir d-değişken dağıtım fonksiyonu G var olacak şekilde olmalıdır.
- Fn (anx + bn) → D G (x), n → ∞.
Aykırı değer formülü Aykırı değer nedir Bir dağılımda en çok tekrarlanan değeri ifade eden kavram İSTATİSTİK 1 İstatistik terimleri ve anlamları İstatistikte sınıf aralığı hesaplama Mod nedir Range istatistik