NEAT Tasarım – İstatistik Alanları- İstatistik Fiyatları – Ücretli İstatistik – İstatistik Yaptırma

Eˆ Y 1 (x) ve LinY 1 (x) Arasında Karar Verme
Bant genişlikleri, hX ve hY’nin her ikisi de büyük olduğunda, KE eşitleme işlevi standart doğrusal eşitleme işlevine çok yakındır çünkü Teorem 1.1’deki şekil farkı işlevi bu durumda neredeyse sıfırdır. Bu örnekte, Satır 1 (x) h = h = 120 vew = w = 1 seçilerek hesaplanır. Y2 XYXY2 Şekil 9.13’te eˆY 1 (x) – Satır 1 (x) farkını çiziyoruz.
Bu grafik, KE tahmini eşitleme fonksiyonunun, eˆY 1 (x), KE doğrusal eşitleme fonksiyonu, YLinY 1 (x) ‘den nasıl farklı olduğunu gösterir.
Bu küçük farkın belirsizliğine kıyasla nasıl olduğunu değerlendirmek için, onu Bölüm 5’te tanımlanan farkı eşitlemenin standart hatası olan ± 2SEED (x) ile birlikte çiziyoruz.
JDF 1 C ürünü, bu bölümün başlarında (9.13) ve (9.14) ile wX = wY = 1 ile verilen matris bileşenlerine sahip matris olarak ortaya çıkmıştır. 2 JeY 1 ve JLinY 1, Bölüm 5’teki sonuçlardan türetilmiştir. (5.19) ‘da hX ve hY, birincisinde bir ceza fonksiyonu kullanılarak seçilmiştir ve hX = hY = 120 olur.
Şekil 9.13 sonuçları özetlemektedir. Bu örnekte eˆY 1 (x) ve LinY 1 (x) puan aralığının çoğunda bir puandan daha az farklılık gösterdiğini göstermektedir.
Bununla birlikte, ham puan aralığının üst ucundaki birkaç X değeri için, bunlar 4 ham puan puanı kadar farklılık gösterir.
Bu örnek için sonucumuz, KE işlevi eˆY 1 (x) ‘in, puan ölçeğinin üst ucundaki aralarındaki fark nedeniyle doğrusal eşitleme işlevine tercih edildiğidir. Düşük puanlı sınava girenleri taramak için kullanılan bir testte olduğu gibi bu aralığın önemli olmadığı durumlarda, doğrusal eşitleme işlevi muhtemelen tatmin edici olacaktır.
Dem Bürotime
Bürotime SEHPA
Bliss sehpa
Bürotime bug sehpa
Bürotime Era
Bürotime Stripe
Bürotime Note
Strıpe operasyonel
Ek: Bu Bölümde Kullanılan Veriler
İlk örnekten her bir sınava giren kişi için gözlemlenen (X1, Y 2) değerleri ve ikinci örnekten her sınava giren için (X2, Y 1) gözlemlenen değerleri sırasıyla Tablo 9.7 ve 9.8’de verilmiştir.
NEAT Tasarım: Zincir Eşitleme
Bu bölüm ve sonraki bölüm tamamen aynı veri seti ve eşitleme tasarımını ele almaktadır. Aralarındaki fark, kullanılan eşitleme yöntemindedir. Bu bölümde, Çapa Testi (NEAT) Tasarımı ile Eşdeğer Olmayan gruplar için Zincir Denklemini (CE) ele alıyoruz. Sonraki bölümde NEAT Design için rakibini, Post-Stratification Equating (PSE) yöntemini ele alacağız.
Eşitleme işleminin ilk adımı olan ön düzeltme (bkz. Bölüm 3.1), hem CE hem de PSE’ye KE yaklaşımı için tamamen aynıdır. Bu nedenle, bu bölümde örnek veri setimiz için ön düzeltme adımının ayrıntılarını vereceğiz ve PSE’yi tartıştığımız Bölüm 11’de bunu atlayacağız. Başka bir tekrardan kaçınmak için, bu örnek için CE ve PSE sonuçlarını karşılaştırmamızı Bölüm 11’e kadar erteleyeceğiz.
NEAT Tasarımı, teste girenlerin P ve Q olmak üzere iki popülasyonunu içerir ve bir çapa testi A kullanır. P popülasyonundan sınava girenlerin bir örneğine bir X testi, her iki örneğe Q popülasyonu ve başka bir öğe kümesi olan A uygulanır (bkz. Varsayım 2.7 ve Tablo 2.4). İki popülasyondan alınan örneklerin bağımsız olduğu varsayılır (Varsayım 2.8).
Bu bölüm NEAT Tasarımına Zincir Eşitleme yaklaşımı için Kernel Equating (KE) ‘nin beş adımının nasıl gerçekleştirileceğini gösterir. Bölüm 2.4’te belirtildiği gibi, NEAT Tasarımları, ortak öğeler kümesinin X ve Y olmak üzere iki teste harici veya dahili olmasına bağlı olarak iki türdendir.
Bu ve sonraki bölüm için verdiğimiz örnekte bir dış çapa var. Bölüm 2.4.3’te bahsettiğimiz gibi, dahili çapa testi ile NEAT Design, bu durumda ön yumuşatma adımı sırasında ortaya çıkan yapısal sıfırları modellemekten başka Kernel Equating için yeni bir konu getirmez. Diğer her açıdan, dahili çapa testine sahip KE, harici bir ankraj testine sahip KE ile tamamen aynıdır.
Bunun örneği ve sonraki bölüm, yüksek hacimli bir test programının iki ulusal uygulamasından gelen verileri içerir. İki test idaresi 2001 Sonbaharında (P) ve 2000 Kışında (Q) yapıldı. Bölüm 3, 4 ve 5’te açıklanan adımların ayrıntılarını inceleyeceğiz. Bu örnekte, sınava girenlerin örnekleri P ve Q’dan alınmıştır. X ve Y testlerinin her ikisi de 78 maddeye sahiptir ve çapa testi, A, 35 öğe yer alır.
İki numunenin her birinde sınava giren her kişinin iki test puanı vardır. Böylece örnek veriler iki değişkenli frekans tablosundan oluşur. Bu tablolardaki girişler
njl = incelenenlerin sayısıX = xj veA = al, inP ve
mkl = incelenenlerin sayısıY = yk veA = al, inQ,j = 1 ile. . . , 79, k = 1,. . . , 79 ve l = 1,. . . , 36.
Bu örnekte xj, yk ve al değerleri x1 = 0, …, x79 = 78, sırasıyla y1 = 0, …, y79 = 78 ve a1 = 0, …, a36 = 35. Ham puanlar, her zamanki “doğru eksi çeyrek yanlış” formül puanlarının tam sayılara yuvarlandığı “yuvarlanmış formül puanlarıdır”. Ek olarak, tüm negatif yuvarlanmış formül puanlarını 0,0 olarak yeniden kodladık. Bu kaydı pratik bir nedenle yaptık.
Olası tüm negatif formül puanlarının xj, yk ve al değerlerine dahil edilmesine izin verdiğimizde, uydurmak istediğimiz bazı log-lineer modellerin bunlara ilişkin verilerin seyrekliği nedeniyle tekil B-matrislerine sahip olduğunu bulduk. çok düşük puanlar. Negatif yuvarlanmış formül puanını 0.0 olarak yeniden kodlamak bu sorunu ortadan kaldırdı, ancak her dağıtıma, seçtiğimiz log-lineer modellerde ele aldığımız 0’da bir “yığın” verdi.
Frekansları {njl} ve {mkl} olan tablolar burada verilemeyecek kadar büyüktür, yani 79’a 36. Bunun yerine, bu iki değişkenli frekans tablosunun özet istatistiklerini açıklamak için Tablo 10.1 ve 10.2’yi veriyoruz.
Tablo 10.1 ve 10.2’den, çapa testinin ortalaması A’nın P popülasyonunda 17.05 (± 0.08) ve Q’da 14.39 (± 0.08) olduğunu görüyoruz. Dolayısıyla, Q, P’den daha az yetkin bir popülasyondur.
Etki büyüklükleri açısından, bu iki ortalama arasındaki fark, 8.27’lik ortalama standart sapmanın yaklaşık% 32’si kadardır. Bu özel test programı için, çapa testindeki bu büyüklükteki ortalama bir fark, iki test uygulaması arasında oldukça büyük bir fark olduğunu gösterir.
Bliss sehpa Bürotime bug sehpa Bürotime Era Bürotime Note Bürotime SEHPA Bürotime Stripe Dem Bürotime Strıpe operasyonel