Çeyrekler, Yüzdelikler ve Kutu Grafikleri – İstatistikler Nedir? – İstatistik Alanları- İstatistik Fiyatları – Ücretli İstatistik – İstatistik Yaptırma
Göreceli Durum Ölçüleri: Çeyrekler, Yüzdelikler ve Kutu Grafikleri
Çeyrekler verileri tıpkı medyanın verileri iki kısma ayırması gibi 4 kısma ayırır.
• 1. Çeyrek (İlk Çeyrek): En alttaki% 25’i en üstteki% 75’ten ayırır.
• Q2 (İkinci Çeyrek): En alttaki% 50’yi en üstteki% 50’den ayırır (medyanla aynı).
• 3. Çeyrek (Üçüncü Çeyrek): En alttaki% 75’i en üstteki% 25’ten ayırır.
Yüzdelik dilimler verileri 100 farklı parçaya ayırır.
• Pk (0 <k <100) k'inci yüzdelik dilimdir.
• P50 50. yüzdelik dilim = Q2 = medyandır.
• P90 90. yüzdelik dilimdir. Bu sayı, verilerin en alttaki% 90'ını en üstteki% 10'dan ayırır.
Sorunlar: Q1 ve Q3'ün nasıl hesaplanacağı konusunda tam bir anlaşma yoktur. İdeal olarak, P25 = Q1 ve P75 = Q3 istersiniz. Bu her zaman geçerli değildir ve farklı yazılım paketleri bu terimler için farklı değerlere neden olabilir. Yüzdelikleri hesaplamak için basit bir yöntem üzerinde bazı anlaşmalar var, bu yüzden onu burada sunacağım.
Pk hesaplama prosedürü:
1. n değerlerini en küçükten en büyüğe sıralayın.
2. Theindex (i) isfoundbyi = k · n. Sonra 100
• eğer i bir tam sayı ise, i'inci değerin ortalamasını alırsınız ve sonraki Pk değerini alırsınız.
• i tam sayı değilse, Pk indeksini almak için yuvarlarsınız.
Yüzdelik Dilimler, Çeyrekler ve Kutu Grafikleri Üzerine Notlar
• Kutu grafikleri genellikle dikey olarak sunulur.
• Çeyrekler arası aralık (IQR), IQR = Q3 – Q1 ile verilir.
• Aykırı Değerler: Bazı metinler, 1,5 IQR'den daha yüksek herhangi bir veri değerinin Q1'in altında veya Q3'ün üstünde olduğunu iddia edecek kadar kalın yazılmıştır. Bunun iyi bir tanım olup olmadığı konusunda fikir birliği yok.
• Değiştirilmiş bir kutu ve bıyık grafiği aykırı değerleri de gösterir. Bu durumda, bıyıklar, aykırı değerler olarak kabul edilmeyen en uç değerlerde sona erer.
• Q1 ve Q3 ile ilgili tutarsızlık şu şekildedir: İlk olarak, verilerinizi iki bölüme ayırmak için medyanı elde edersiniz. Bazı yöntemler medyanı kalan iki yarıda tutar, bazıları tutmaz. Büyük bir dizi farklı değeriniz varsa, büyük bir fark olmamalıdır. Her iki durumda da, çeyrekler ve bunlarla ilişkili yüzdelikler için farklı değerler elde edebilirsiniz. Olası tüm çatışmaları çözen tek bir yöntem bilmediğim için en hızlı çıkış yolunu sundum.
Sorun: Bazen belirli bir puanın yüzdeliğini hesaplarsanız, veri kümesinin aynı yüzdeliğiyle eşleşmeyecektir. Yine, bunun kolay bir yolu yok.
• İlginç Örnek: Yan yana kutu grafikleri, verilerdeki ilginç farklılıkları ortaya çıkarabilir.
ABD Hükümeti Vietnam savaşına adam çıkarmaya başladığında, taslak sipariş, bir çöp kutusundan rastgele seçilen doğum tarihlerine göre belirlendi. Seçimlerin adil olmadığı konusunda bazı tartışmalar vardı. Taslakta daha erken doğum ayı olan erkeklerin seçildiği iddia edildi. Dağılım grafiği böyle bir model ortaya çıkarmaz. Yan yana kutu grafikleri bu iddianın geçerli olduğunu gösteriyor.
Kutu grafiği aykırı değer
Kutu grafiği örnekleri ve çözümleri
Boxplot kutu grafiği
Kutu grafiği nerelerde kullanılır
Box plot Grafiği nasıl çizilir
Saçılım Grafiği
Kutu grafiği Sapan gözlem
Ortalama Standart Sapma grafiği
Ağırlıklı Ortalamalar ve Simpson'ın Paradoksu
Ağırlıklı ortalama (veya ağırlıklı ortalama), normal (aritmetik) bir ortalamaya çok benzer. Bir de tüm değerler aynı öneme sahip değildir. Bazı değerler diğerlerinden daha ağırdır. Ağırlıklı ortalamanın sonuçları, Simpson’ın paradoksu örneğinde olduğu gibi mantıksızdır.
• Ön Örnek: Not ortalamanızı (GPA) hesaplama
Bir not ortalaması, önce her harf notuna sayısal bir değer atanarak hesaplanır (A = 4.0, B, D = 1.0 ve F = 0.0). Daha sonra her not, önceki kredi sayısına göre ağırlıklandırılır.
Herkes, not ortalamanızın dört kredilik bir dersten A ve tek kredili bir dersten F almanın diğer yoldan daha iyi olduğunu bilir. Ama bu farkın gerçekte ne kadar büyük olduğunu biliyor musunuz? Aşağıdaki iki örnek eşitsizliği göstermektedir.
Genel Olarak Ağırlıklı Ortalamalar
Yukarıdaki örnek, ağırlıklı ortalama için standart formu göstermektedir.
Bu formül, her veri değerini (xi) uygun ağırlık (wi) ile ağırlıklandırmayı, tüm bunların ürünlerini toplamayı ve tüm ağırlıkların toplamına bölmeyi söyler. Bir sınıftaki notunuz, ev ödevi, sınavlar, testler, final ve diğerleri gibi çeşitli öğelerin ağırlıklı ortalamasıdır. Ancak, bu durumda ağırlıkların toplamı genellikle birdir ve bu nedenle, orada bir bölünme görmezsiniz.
• Ortalamaların Ortalamaları: Genel olarak, ortalamalar riskli bir iştir. Bununla birlikte, ağırlıklı bir ortalama almak, bunu doğru bir şekilde yapmanıza izin verir. Örneğin, bir kliniğin aşağıdaki tabloda verilen ortalama maaşlarla iki Kayıtlı Hemşire (RN) ve dört Lisanslı Pratik Hemşire (LPN) çalıştırdığını varsayalım. Bu klinikteki hemşirelerin ortalama maaşı nedir?
• Sıranız: Profesör Brown'da biri sabah biri de öğleden sonra olmak üzere iki İstatistik bölümü vardır. Sabah bölümünde 10 öğrenci var ve Test # 1'deki ortalamaları 85'ti. Öğleden sonra bölümünde 28 öğrenci var ve bunların ortalaması 73'tü. Profesör Brown'ın İstatistik Öğrencileri için Test # 1'deki ortalama puanı hesaplayın.
• Simpson’ın Paradoksu: Bazen, kategoriler arasındaki ortalamalar, kategorilerdeki ortalamalarla doğrudan çelişir. Bu gerçekleştiğinde buna Simpson'ın Paradoksu denir.
Örnek: Profesör Brown ve Profesör Taraflar aynı üniversitede İstatistik dersi veriyor. Her biri, biri sabah biri akşam olmak üzere iki bölümden oluşmaktadır. Aşağıdaki tablo, Parantez içinde öğrenci sayısı ile Test # 1'deki sınıf ortalamasını vermektedir. Kimin öğrencileri daha iyi yaptı?
Bölüm 2: Tartışmalar
1. Tüm öğrencilerin% 70'inin ortalamanın altında olması mümkün müdür?
2. "Cinsiyet Benzerlikleri Matematik Performansını Karakterize Eder" başlıklı bir Bilim makalesinde, Hyde ve ark. (2008) eyalet NCLB matematik değerlendirmelerinde 7 milyondan fazla öğrencinin puanlarının analizini bildirdi. Raporlarında, erkekler ve kadınlar için ortalama puanların neredeyse eşit olduğunu belirtiyorlar. Bununla birlikte, erkek verileri, kadınlara göre 1,11 ila 1,2 kat daha büyük bir varyansla tanımlandığı gibi daha fazla varyasyon içeriyordu. Bu raporu birçok manşet takip etti. Burda biraz var:
(a) "Matematik Puanları Kızlar için Boşluk Göstermiyor, Çalışma Bulguları" [Lewin (2008)]
(b) "Matematikte kızlar ve erkekler eşittir" [Seattle Times Haber Servisi (2008)]
(c) "Matematik Kızlar İçin Daha Zor" [Mac Donald (2008)]
Bu kadar değişken başlıklar aynı veri setiyle nasıl gerekçelendirilebilir? Eksik başlık nedir?
3. Bir basketbol takımının koçusunuz. Play-off takımınızı kuruyorsunuz ve Jo-Anne ve Beth arasında seçim yapmalısınız. Hangisini alırdın? Ya takımınız favori ise? Ya takımınız güçsüz durumdaysa?