Bölüm 7 Çok Kategorili Madde Tepki Kuramı Modelleri

Dr. Sevda Çetin

Çok kategorili madde tepki kuramı (MTK) modelleri test maddelerinin çeşitli yanıt kategorilerine sahip olduğu durumlarda, testi alanlar ile test maddeleri arasındaki etkileşimi anlamamıza yardımcı olmak için kullanılan matematiksel modellerdir. Bu test maddeleri testi alanların elde ettikleri puanları (örneğin 0-5 arasında puanlanan bir maddeden 3 puan almış olmak) ya da seçtikleri puan kategorilerini (örneğin 4’lü likert tipi bir maddede “kısmen katılıyorum” seçeneğini işaretlemek) yansıtacak şekilde puanlanmaktadır.

Çok kategorili MTK modelleri çeşitli alanlarda geniş bir uygulama alanına sahiptir. Eğitim araştırmalarında test geliştirmek, bireylerin yeteneklerini kestirmek, test adaletini değerlendirmek vb. için kullanılırken; psikolojik araştırmalarda kişilik özellikleri ve tutumlar gibi karmaşık psikolojik yapıların ölçülmesine ve anlamlandırılmasına yardımcı olmaktadır. Sağlık araştırmalarında hastaların sağlıkla ilgili yaşam kalitesini, ağrı düzeylerini ve belirti şiddetini değerlendirmek için kullanılırken; pazarlama araştırmalarında ise tüketici tercihlerinin ve tutumlarının analiz edilmesinde yararlanılmaktadır.

En sık kullanılan çok kategorili MTK modelleri aşağıda verilmiştir:

Aşamalı Tepki Modeli-ATM (Graded Response Model-GRM)
Kısmi Puan Modeli-KPM (Partial Credit Model-PCM)
Genelleştirilmiş Kısmi Puan Modeli-GKPM (Generalized Partial Credit Model-GPCM)
Sınıflamalı Tepki Modeli-STM (Nominal Response Model-NRM)
Dereceleme Ölçeği Modeli-DÖM (Rating Scale Model-RSM)

Bu modellerden ilki “dolaylı” model olarak kabul edilir çünkü bireylerin belirli bir kategoride yanıt vermesinin koşullu olasılığını belirlemek için iki aşamalı bir süreç gereklidir. Diğer modeller ise “doğrudan” modeller olarak kabul edilir çünkü bireylerin özellik (yetenek, tutum vb.) düzeyiyle belirli bir kategoride yanıt verme olasılığı arasındaki ilişkiyi tanımlamak için tek bir eşitlik yeterlidir.

İki kategorili MTK modellerinin aksine, çok kategorili MTK modellerinde madde karakteristik eğrilerinin (MKE) bir uzantısı olarak düşünülebilecek kategori karakteristik eğrileri (KKE) yer alır. Maddeler ikiden fazla yanıt kategorisine sahip olduğundan, madde başına çizilen birden fazla KKE vardır. Her bir eğri, gizil özelliğin (\(\theta\)) bir fonksiyonu olarak belirli bir kategorinin seçilme olasılığını temsil eder.

7.1 Aşamalı Tepki Modeli-ATM (Graded Response Model-GRM)

Samejima (1969) tarafından geliştirilen aşamalı tepki modeli (ATM), 2PL modelin çok kategorili puanlanan maddelerde kullanılabilecek şekilde genişletilmiş hali olup en yaygın kullanılan çok kategorili MTK modellerinden biridir. ATM, özellikle sıralı yanıt kategorilerine sahip maddeleri analiz etmek için uygundur. ATM’nin altında yatan temel varsayım, bir bireyin bir maddenin belirli bir kategorisinde puan alma olasılığının bireyin yetenek düzeyine ve madde parametrelerine bağlı olduğudur. ATM’de bireylerin her bir kategori ve üzerinde puan alma olasılığı modellenir ve bireylerin belirli bir kategoride puan alma olasılıkları iki aşamada hesaplanır. Dolayısıyla ATM dolaylı bir modeldir. ATM’de kategoriler arasında kümülatif karşılaştırmalar yapıldığından ATM “kümülatif lojit model” (cumulative logit model) olarak da adlandırılır.

Bir i maddesinin K sıralı yanıt kategorisine sahip olduğu düşünüldüğünde, bireyler bu maddeden x puan (\(x=0,1,\dots,m_i\)) alırlar. ATM’de bitişik yanıt kategorileri/puanlar arasında eşik (treshold) vardır. Eşik sayısı yanıt kategori sayısının bir eksiğidir.

Örneğin “İş yerimde önemsendiğimi hissediyorum” olarak ifade edilen bir maddeye ilişkin yanıt kategorileri, bu kategorilere karşılık gelen puanlar ve bitişik yanıt kategorileri/puanlar arasındaki kümülatif eşikler Şekil 7.1’de verilmiştir.

Şekil 7.1: Beş yanıt kategorili ve dört kümülatif eşikli madde

Şekil 7.1’de görüldüğü üzere madde “kesinlikle katılmıyorum”, “katılmıyorum”, “biraz katılıyorum”, “katılıyorum”, “çok katılıyorum” olarak ifade edilen K=5 yanıt kategorisine sahiptir. Bu yanıt kategorilerine karşılık gelen x puanları sırasıyla 0, 1, 2, 3, 4’dür. Bu madde için yanıt kategorilerini/puanları kümülatif bir şekilde ayıran j=K-1=4 eşik (\(\delta_1\): 0 – 1, 2, 3, 4; \(\delta_2\): 0, 1 – 2, 3, 4; \(\delta_3\): 0, 1, 2 – 3, 4; \(\delta_4\): 0, 1, 2, 3 – 4) bulunmaktadır.

ATM’de her bir madde için yanıt kategorilerinin/puanların kümülatif bir şekilde bölünmesiyle K-1 ikili (örneğin 0 – 1, 2, 3, 4; 0, 1 – 2, 3, 4; 0, 1, 2 – 3, 4; 0, 1, 2, 3 – 4) oluşturulur. Bu ikililerin her biri için, karakteristik eğrilerinin eğimleri eşit olacak şekilde sınırlandırılarak, 2PL model kestirilir. \(\theta\) yetenek düzeyindeki s bireyinin i maddesinde j eşiği üzerinde puan alma olasılığı, \(P_{ix}^*(\theta_s)\), Eşitlik (7.1)’deki eşitlikle hesaplanır.

\[ P_{ix}^*(\theta_s)=\frac{\exp\left(a_i(\theta_s-\beta_{ij})\right)}{1+ \exp\left(\alpha_i(\theta_s-\beta_{ij})\right)} \tag{7.1} \]

Eşitlikte; \(\theta_s\): s bireyinin yetenek düzeyi, \(\alpha_i\): i maddesi için eğim parametresi, \(\beta_{ij}\) : i maddesi için j eşiğinin üzerinde puan alma olasılığının %50 olduğu yetenek düzeyi,

ATM’de her bir madde bir eğim parametresi (slope parameter, \(\alpha_i\)) ve kategoriler arası eşik parametresi (threshold parameter, \(\beta_{ij}\)) tarafından tanımlanır.

Her bir madde için Eşitlik (7.1)’teki olasılıklar kestirildikten sonra her bir madde için her bir kategoride puan alma olasılığı, \(P_{ix}(\theta_s)\), Eşitlik (7.2)’deki eşitlikle hesaplanır.

\[ P_{ix}(\theta_s)=P_{ix}^*(\theta_s)-P_{i{(x+1)}}^*(\theta_s) \tag{7.2} \]

Örnekteki “İş yerimde önemsendiğimi hissediyorum” maddesi için bir bireyin en düşük kategoride veya üzerinde yanıt verme olasılığı, \[P_{i0}^*(\theta)=1.0\] ve en yüksek kategorinin üzerinde yanıt verme olasılığı, \[P_{i4}^*(\theta)=0.0\] olmak üzere beş kategorinin her birinde yanıt verme olasılığı aşağıdaki gibidir:

\[P_{i0}(\theta_s)=1.0-P_{i1}^*(\theta_s)\] \[P_{i1}(\theta_s)=P_{i1}^*(θ)-P_{i2}^*(\theta_s)\] \[P_{i2}(\theta_s)=P_{i2}^*(θ)-P_{i3}^*(\theta_s)\] \[P_{i3}(\theta_s)=P_{i3}^*(θ)-P_{i4}^*(\theta_s)\] \[P_{i4}(\theta_s)=P_{i4}^*(\theta_s)-0\]

ATM’de bir madde için belirli bir kategoride yanıt verme olasılıklarına ilişkin eğriler kategori yanıt eğrileri olarak adlandırılır.

mirt paketiyle (Chalmers, 2012) veriGR.csv veri seti üzerinde ATM’ye göre kestirim süreci aşağıda ana hatlarıyla örneklendirilmiştir. veriGR.csv veri seti 800 bireyin 5 kategorili (0, 1, 2, 3, 4 şeklinde) puanlanan 10 maddeye verdiği yanıtlardan oluşmaktadır. Veri setinin R ortamına aktarılması için readr paketinin aktif hale getirilmesi gerekmektedir. readr paketindeki read.csv2() fonksiyonu kullanılarak veri seti data nesnesine aktarılmıştır. Veri setinin ilk sütunu öğrenci id numaralarını içermekte olup analizler gerçekleştirilmeden önce bu ilk sütun veri setinden çıkarılmıştır. Böylece bireylerin madde yanıtlarını içeren dat nesnesi oluşturulmuştur. Veri setinin ilk 6 satırı head() fonksiyonuyla yazdırılmıştır.

library(readr)
data <- read.csv2("import/veriGR.csv")
dat <- data[, -1]
head(dat)
#>   madde1 madde2 madde3 madde4 madde5 madde6 madde7 madde8 madde9 madde10
#> 1      0      2      4      4      4      0      0      4      1       4
#> 2      4      4      0      4      4      2      0      4      0       4
#> 3      0      4      2      4      0      0      2      2      0       4
#> 4      0      4      4      0      0      4      4      2      0       4
#> 5      4      4      4      4      4      4      4      4      4       4
#> 6      0      3      2      4      0      3      0      0      0       3

Veri setinin okutulup hazırlanmasının ardından tek boyutlu model aşağıdaki komut satırıyla tanımlanmıştır. Tek bir örtük özelliğin (F’nin) veri setindeki 1 ile 10 arasındaki sütunlardaki maddeler tarafından ölçüldüğünün gösterildiği model atm nesnesine atanmıştır.

atm <- "F=1-10"

ATM analizi mirt paketindeki mirt() fonksiyonu kullanılarak yapılmıştır. ATM analizinin yapılabilmesi için önce mirt paketinin aktif hale getirilmesi gerekmektedir. Paket aktif hale getirildikten sonra mirt() fonksiyonu aşağıdaki örnek kodla çalıştırılarak ATM analizi gerçekleştirilmiştir. mirt() fonksiyonunun data argümanı için analiz edilecek dat veri seti, model argümanı için tanımlanan atm modeli girilmiştir. mirt() fonksiyonunda data ve model argümanlarının yanı sıra itemtype ve SE argümanları da kullanılmıştır. Model türünün belirlendiği itemtype argümanı, kestirimlerin ATM’ye göre gerçekleştirilmesi için graded değeriyle kullanılmıştır. Kestirimlere ilişkin standart hataların elde edilmesi için SE argümanı TRUE değeriyle kullanılmıştır. Analiz çıktıları atm_uyum nesnesine atanmıştır.

library(mirt)
atm_uyum <- mirt(data = dat, model = atm, 
                 itemtype = "graded", SE = TRUE)

mirt() fonksiyonunun çalıştırılması sonucunda oluşturulan atm_uyum nesnesi, parametre kestirimleri başta olmak üzere kestirim sürecine ilişkin ek bilgileri içermektedir. coef() fonksiyonuyla atm_uyum nesnesinden parametre kestirimleri aşağıdaki kodla çıkarılmıştır. coef() fonksiyonunun çalıştırılması sonucunda oluşturulan atm_par nesnesinin items bileşeninden ATM’ye göre kestirilen madde parametre değerleri elde edilmiştir ve madde parametre değerleri round() fonksiyonuyla binde birler basamağına yuvarlanmıştır.

atm_par <- coef(atm_uyum, IRTpars = TRUE, simplify = TRUE)
round(atm_par$items, 3)
#>             a     b1     b2     b3     b4
#> madde1  1.640 -0.632 -0.153  0.064  0.388
#> madde2  1.388 -0.502 -0.215  0.125  0.819
#> madde3  1.379 -0.631 -0.118  0.344  0.940
#> madde4  1.643 -2.005 -1.451 -1.033 -0.541
#> madde5  1.200 -0.228  0.296  0.595  1.100
#> madde6  1.046 -0.170  0.283  0.819  1.769
#> madde7  1.026 -0.265  0.388  1.019  1.604
#> madde8  1.046 -1.269 -0.629  0.115  0.752
#> madde9  0.783 -0.280  0.714  1.475  2.208
#> madde10 0.816 -3.100 -2.216 -1.460 -0.791

Elde edilen çıktıda her maddeye ilişkin eğim parametresi kestirimleri (a sütununda) ve yanıt kategori sayısının 1 eksiği kadar eşik parametresi kestirimleri (b1, b2, b3 ve b4 sütunlarında) yer almaktadır. Görüldüğü gibi her maddenin a parametresi birbirinden farklıdır; madde4 en yüksek eğim parametresine, madde9 ise en düşük eğim parametresine sahiptir. Eşik parametreleri incelendiğinde ise madde10’un diğer maddelere göre belirli bir yanıt kategorisi için daha kolay bir madde olduğu görülmektedir.

Modele ilişkin kategori yanıt eğrilerini ve test bilgi fonksiyonunu çizdirmek için mirt paketindeki plot() fonksiyonundan yararlanılmıştır.

plot() fonksiyonunun type argümanı trace değeriyle kullanılarak ATM için kategori yanıt eğrileri elde edilmiştir.

plot(atm_uyum, type = "trace", which.items = 1:10, 
     layout = c(5, 2), theta_lim = c(-4, 4), 
     main = "Kategori Yanıt Eğrileri_ATM")

Her madde için çizdirilen kategori karakteristik eğrileri incelendiğinde madde1 ile madde4’e ait eğrilerin eğimlerinin benzer olduğu fakat madde4’ün daha kolay bir madde olduğu görülmektedir.

plot() fonksiyonunun type argümanı info değeriyle kullanılarak ATM için test bilgi fonksiyonu çizdirilmiştir.

plot(atm_uyum, type = "info", theta_lim = c(-4, 4), 
     main = "Test Bilgi Fonksiyonu_ATM")

Test bilgi fonksiyonu incelendiğinde testin en yüksek bilgiyi 0 yetenek düzeyinde sağladığı görülmektedir. Testin 0 yetenek düzeyi için nispeten daha uygun olduğu söylenebilir.

7.2 Kısmi Puan Modeli-KPM (Partial Credit Model-PCM)

Masters (1982) tarafından geliştirilen kısmi puan modeli (KPM), Rasch modelinin çok kategorili puanlanan maddelere uyarlanmış halidir. Doğrudan bir model olan KPM’de bireylerin bir maddenin belirli bir kategorisinde puan alma olasılıkları modellenir.

Bir i maddesinin K sıralı yanıt kategorisine sahip olduğu düşünüldüğünde, bireyler bu maddeden x puan (\(x=0,1,\dots,m_i\)) alırlar ve bu puanlar kategori puanları olarak adlandırılır. KPM’de bitişik yanıt kategorileri/puanlar arasında adım (step) vardır. Adım sayısı yanıt kategori sayısının bir eksiğidir.

Örneğin “Etkinlik için size verilen süreyi değerlendiriniz” olarak ifade edilen bir maddeye ilişkin yanıt kategorileri, bu kategorilere karşılık gelen puanlar ve bitişik yanıt kategorileri/puanlar arasındaki adımlar Şekil 7.2’de verilmiştir.

Şekil 7.2: Dört Yanıt Kategorili ve Üç Adımlı Madde

Şekil 7.2’de görüldüğü üzere madde “yeterli değil”, “biraz yeterli”, “yeterli”, “çok yeterli” olarak ifade edilen K=4 yanıt kategorisine sahiptir. Bu yanıt kategorilerine karşılık gelen x puanları sırasıyla 0, 1, 2, 3’tür. Bu madde için k=K-1=3 adım bulunmaktadır.

Bir bireyin bu maddede en yüksek kategoriyi yanıtlaması (maddeden 3 puan alması) için üç adımı tamamlaması gerekmektedir. Diğer bir ifadeyle bu bireyin birinci adımda yeterli değil ile biraz yeterli, ikinci adımda biraz yeterli ile yeterli, üçüncü adımda yeterli ile çok yeterli arasında karar vermesi gerekmektedir. KPM’de, Rasch modelindeki madde güçlük parametresinin yerini, madde adım güçlüğü parametresi (item step difficulty) alır. Adım güçlüğü, KPM’de bitişik kategorilere ilişkin kategori yanıt eğrilerinin kesişim noktası olduğundan, kategori kesişimi (category intersections) olarak da adlandırılır (Embretson ve Reise, 2000).

KPM’de \(\theta\) yetenek düzeyindeki s bireyinin i maddesinde x puan alma olasılığı, \(P_{ix}(\theta_{s})\), Eşitlik (7.3)’teki eşitlikle hesaplanır.

\[ P_{ix}(\theta_{s})=\frac{\exp\left[\sum_{k=0}^{x}(\theta_{s}- \delta_{ik})\right]}{\sum_{h=0}^{m_j}\left[\exp\sum_{k=0}^{h}(\theta_{s}- \delta_{ik})\right]} \tag{7.3} \]

Eşitlikte; \(\theta_s\): s bireyinin yetenek düzeyi, \(\delta_{ik}\), i maddesinden x puan elde etmenin göreceli zorluğunu temsil eden adım güçlüğü parametresidir.

KPM’de her adımda bitişik yanıt kategorileri dikkate aldığından, bitişik yanıt kategorileri iki kategorili madde olarak ele alınır. Kategori puanları sıralı çiftlerin bir dizisi (örneğin {0, 1}, {1, 2}, {2, 3} gibi) şeklinde ayrıştırılır. KPM’deki \(\delta_{ik}\) parametresi, ATM’deki \(\beta_{ij}\) parametresinde olduğu gibi ilgili eşik üzerinde puan alma olasılığının %50 olduğu yetenek düzeyini temsil etmez. Bunun yerine KPM’de \(\delta_{ik}\) parametresi her bir adımın göreceli güçlüğünü temsil eder. Dolayısıyla bitişik iki kategori arasından sonraki kategoriye geçmek (sonraki kategoriyi seçmek veya sonraki kategoride puan almak) için gerekli olan minimum yetenek düzeyini ifade eder. \(\delta_{ik}\) parametresi, yetenek üzerinde bir bireyin x puan alma olasılığının x-1 puan alma olasılığıyla aynı olduğu konuma karşılık gelir. Bir madde içinde bazı adımlar (kategori kesişimleri) diğerlerine göre nispeten daha kolay veya daha zor olabilir. Eğer bireyin yetenek düzeyi adım parametresine eşit ise bitişik iki kategoride puan alma/seçim yapma olasılığı da eşit olur. Bireyin yetenek düzeyi adım parametresinden büyükse bitişik iki kategoriden sonraki kategoride puan alma/seçim yapma olasılığı daha yüksektir. Yetenek düzeyi adım parametresinden düşükse bitişik iki kategoriden önceki kategoride puan alma/seçim yapma olasılığı daha yüksektir (Embretson ve Reise, 2000). \(\delta_{ix}\) değeri ne kadar büyükse bu değerle ilişkili adım diğer adımlara göre o kadar zordur (De Ayala, 2009). Bu özellik, Likert tipi ölçekler için madde parametreleri kestirilirken KPM’yi çok esnek hale getirmektedir. Bazı durumlarda bireyler daha yüksek kategorileri daha düşük kategorilerden daha sık seçebilir. Örneğin bir bireyin gün içinde akıllı telefonunu ne sıklıkla kullandığının sorulduğunu ve yanıt seçeneklerinin “1: hiçbir zaman”, “2: çok nadir”, “3: bazen” ve “4: çok sık” olduğunu varsayalım. Katılımcıların çoğu gün içinde telefonlarını çok sık kullanma eğilimindeyse, “3: bazen” ve “4: çok sık” yanıt seçeneklerinin seçilmesi “1: hiçbir zaman” veya “2: çok nadir” yanıt seçeneklerinin seçilmesinden daha olasıdır. Dolayısıyla, 3 ve 4 arasındaki eşik, 1 ve 2 arasındaki eşikten daha küçük olabilir. Likert tipi maddelerin aksine, başarıy veya yeteneği ölçen çok kategorili puanlanan maddelerin yanıt kategorileriyle aynı sırayı takip etmesi beklenir. Örneğin olası puanları 0, 1 ve 2 olan bir matematik probleminde 2 puan almak, 0 veya 1 puan almaktan daha zor olacaktır. Bu nedenle 1 ile 2 arasındaki eşiğin 0 ile 1 arasındaki eşikten daha büyük olması beklenir.

KPM’de bir madde için belirli bir kategoride yanıt verme olasılıklarına ilişkin eğriler kategori yanıt eğrileri olarak adlandırılır.

mirt paketiyle dat veri seti üzerinde KPM’ye göre kestirim süreci aşağıda ana hatlarıyla örneklendirilmiştir. İlk olarak tek boyutlu model tanımlanmışır. Tek bir örtük özelliğin (F’nin) veri setindeki 1 ile 10 arasındaki sütunlardaki maddeler tarafından ölçüldüğünün gösterildiği model kpm nesnesine atanmıştır.

kpm <- "F=1-10"

KPM analizi mirt paketindeki mirt() fonksiyonu kullanılarak yapılmıştır. mirt() fonksiyonunun data argümanı için analiz edilecek dat veri seti, model argümanı için tanımlanan kpm modeli girilmiştir. mirt() fonksiyonunda data ve model argümanlarının yanı sıra itemtype ve SE argümanları da kullanılmıştır. itemtype argümanı, kestirimlerin KPM’ye göre gerçekleştirilmesi için ve KPM Rasch temelli bir model olduğundan Rasch değeriyle kullanılmıştır. Kestirimlere ilişkin standart hataların elde edilmesi için SE argümanı TRUE değeriyle kullanılmıştır. Analiz çıktıları kpm_uyum nesnesine atanmıştır.

library(mirt)
kpm_uyum <- mirt(data = dat, model = kpm, 
                 itemtype = "Rasch", SE = TRUE)

mirt() fonksiyonunun çalıştırılması sonucunda oluşturulan kpm_uyum nesnesi, parametre kestirimleri başta olmak üzere kestirim sürecine ilişkin ek bilgileri içermektedir. coef() fonksiyonuyla kpm_uyum nesnesinden parametre kestirimleri aşağıdaki kodla çıkarılmıştır. coef() fonksiyonunun çalıştırılması sonucunda oluşturulan kpm_par nesnesinin items bileşeninden KPM’ye göre kestirilen madde parametre değerleri elde edilmiştir ve madde parametre değerleri round() fonksiyonuyla binde birler basamağına yuvarlanmıştır.

kpm_par <- coef(kpm_uyum, IRTpars = TRUE, simplify = TRUE)
round(kpm_par$items, 3)
#>         a     b1     b2     b3     b4
#> madde1  1  0.760  0.693 -0.326 -1.320
#> madde2  1  1.468 -0.243 -0.566 -0.400
#> madde3  1  0.831  0.047 -0.069 -0.500
#> madde4  1 -0.217 -0.294 -0.495 -1.660
#> madde5  1  1.168  0.592 -0.326 -0.705
#> madde6  1  1.441 -0.131 -0.221  0.138
#> madde7  1  1.046  0.131  0.415 -0.509
#> madde8  1  0.533 -0.372  0.220 -0.789
#> madde9  1  0.871  0.402  0.407 -0.409
#> madde10 1 -0.126 -0.429 -0.190 -1.776

Elde edilen çıktıda her maddeye ilişkin eğim parametresi kestirimleri (a sütununda) ve kategori sayısının 1 eksiği kadar adım güçlüğü parametresi kestirimleri (b1, b2, b3 ve b4 sütunlarında) yer almaktadır. Görüldüğü gibi KPM, Rasch temelli bir model olduğu için eğim parametresi tüm maddelerde 1’e eşittir.

Modele ilişkin kategori yanıt eğrilerini ve test bilgi fonksiyonunu çizdirmek için mirt paketindeki plot() fonksiyonundan yararlanılmıştır.

plot() fonksiyonunun type argümanı trace değeriyle kullanılarak KPM için kategori yanıt eğrileri elde edilmiştir.

plot(kpm_uyum, type = "trace", which.items = 1:10,
     layout = c(5, 2), theta_lim = c(-4, 4),
     main = "Kategori Yanıt Egrileri_KPM")

plot() fonksiyonunun type argümanı info değeriyle kullanılarak KPM için test bilgi fonksiyonu çizdirilmiştir.

plot(kpm_uyum, type = "info", theta_lim = c(-4, 4), 
     main = "Test Bilgi Fonksiyonu_KPM")

Test bilgi fonksiyonu incelendiğinde testin en yüksek bilgiyi 0 yetenek düzeyinde sağladığı görülmektedir. Testin 0 yetenek düzeyi için nispeten daha uygun olduğu söylenebilir.

7.3 Genelleştirilmiş Kısmi Puan Modeli-G-KPM (Generalized Partial Credit Model-G-PCM)

Muraki (1992) tarafından geliştirilen genelleştirilmiş kısmi puan modeli (G-KPM), KPM’nin genelleştirilmiş halidir (Embretson ve Reise, 2000). G-KPM’de eğim parametresinin maddelerde değişmesine olanak tanınır. G-KPM kategori yanıt eğrilerini kavramsallaştırma şekli bakımından KPM’ye benzerken, eğim parametrelerinin maddeler arasında değişebilmesi bakımından da 2PL modeline benzer. Eğim parametresini tüm maddeler için 1’e sabitlemek yerine, G-KPM’de her bir madde için farklı bir eğim parametresi kestirilir. Muraki’ye (1992) göre, eğim parametreleri, yetenekler değiştikçe kategorik yanıtların maddeler arasında ne derece değiştiğini gösterir.

G-KPM’de \(\theta\) yetenek düzeyindeki s bireyinin i maddesinde x puan alma olasılığı, \(P_{ix}(\theta_{s})\), Eşitlik (7.4)’teki eşitlikle hesaplanır

\[ P_{ix}(\theta_s)=\frac{\exp\left[\sum_{k=0}^{x}\alpha_i(\theta_s-\delta_{ik})\right]}{\sum_{h=0}^{M}\left[\exp\sum_{k=0}^{h}\alpha_i(\theta_s-\delta_{ik})\right]} \tag{7.4} \]

Eşitlik (7.4)’te de görüldüğü gibi model eğim parametresini dikkate almaktadır. Eşitlikteki diğer terimler KPM’de olduğu gibidir. Burada dikkat edilmesi gereken eğim parametresinin iki kategorili puanlanan maddelerde olduğu gibi doğrudan ayırt edicilik olarak kullanılmaması gerektiğidir. Çünkü çok kategorili puanlanan maddeler için geliştirilen modellerde madde ayırt ediciliği, eğim parametresine ve adım parametrelerinin (veya ATM’deki kategori eşik parametrelerinin) bileşimine bağlıdır. G-KPM’de eğim parametresi yetenek düzeyi değiştikçe kategori yanıtlarının maddeler arasında değişme derecesini göstermektedir. Eğim parametresi 1.0’den küçük değerler aldıkça kategori yanıt eğrileri KPM’ye göre düzleşirken 1.0’den büyük değerler aldıkça da kategori yanıt eğrileri KPM’ye göre sivrileşmektedir (Embretson ve Reise, 2000).

mirt paketiyle dat veri seti üzerinde G-KPM’ye göre kestirim süreci aşağıda ana hatlarıyla örneklendirilmiştir. mirt() fonksiyonuyla analizi gerçekleştirmeden önce testteki 10 madde F gizil özelliğiyle ilişkilendirilip tek boyutlu model tanımlanmıştır. Bu model gkpm nesnesine atanmıştır ve mirt() fonksiyonunun model argümanının değeri olarak ele alınmıştır. Analizin GKPM’ye göre gerçekleştirilmesi için fonksiyonun itemtype argümanı gpcm değeriyle kullanılmıştır. Analiz çıktıları gkpm_uyum nesnesine atanmıştır.

library(mirt)
gkpm <- "F=1-10"
gkpm_uyum <- mirt(data = dat, model = gkpm, 
                  itemtype = "gpcm", SE = TRUE)

gkpm_uyum nesnesi coef() fonksiyonunun argümanı olarak kullanılarak parametreler kestirilmiştir. Kestirilen parametreler gkpm_par nesnesine atanmıştır. Bu nesnenin madde parametre kestirimlerini içeren items bileşeni seçilerek, bileşendeki değerler round() fonksiyonuyla binde birler basamağına yuvarlanmıştır.

gkpm_par <- coef(gkpm_uyum, IRTpars = TRUE, simplify = TRUE)
round(gkpm_par$items, 3)
#>             a     b1     b2     b3     b4
#> madde1  0.581  1.097  1.108 -0.519 -2.088
#> madde2  0.473  3.024 -0.545 -1.175 -0.761
#> madde3  0.529  1.428  0.045 -0.074 -0.776
#> madde4  0.668 -0.870 -0.809 -0.920 -2.436
#> madde5  0.415  2.816  1.420 -0.793 -1.705
#> madde6  0.365  4.010 -0.368 -0.679  0.245
#> madde7  0.353  3.035  0.359  1.081 -1.610
#> madde8  0.380  1.482 -0.952  0.560 -2.140
#> madde9  0.284  3.248  1.377  1.183 -1.895
#> madde10 0.294  0.103 -1.124 -0.511 -6.107

Elde edilen çıktıda her maddeye ilişkin eğim parametresi kestirimleri (a sütununda) ve kategori sayısının 1 eksiği kadar adım güçlüğü parametresi kestirimleri (b1, b2, b3 ve b4 sütunlarında) yer almaktadır. Görüldüğü gibi G-KPM’de her madde için farklı bir eğim parametresi kestirilmiştir.

plot() fonksiyonunun type argümanı trace değeriyle kullanılarak G-KPM için kategori yanıt eğrileri elde edilmiştir.

plot(gkpm_uyum, type = "trace", which.items = 1:10,
     layout = c(5, 2), theta_lim= c(-4, 4),
     main = "Kategori Yanıt Egrileri_GKPM")

plot() fonksiyonunun type argümanı info değeriyle kullanılarak G-KPM için test bilgi fonksiyonu çizdirilmiştir.

plot(gkpm_uyum, type = "info", theta_lim = c(-4, 4), 
     main = "Test Bilgi Fonksiyonu_GKPM")

Test bilgi fonksiyonu incelendiğinde testin en yüksek bilgiyi 0 yetenek düzeyinde sağladığı görülmektedir. Testin 0 yetenek düzeyi için nispeten daha uygun olduğu söylenebilir.

7.4 Sınıflamalı Tepki Modeli-STM (Nominal Response Model-NRM)

Bock (1972) tarafından geliştirilen sınıflamalı tepki modeli (STM), çok kategorili puanlanan bir maddenin kategorileri arasında sıralamaya dayalı bir ilişki olmadığı durumlarda kullanılır. STM’nin bu özelliği sınıflama düzeyinde kategorilere sahip çok kategorili puanlanan maddelerin modellenmesine olanak tanır (Darrell Bock, 1972; Embretson ve Reise, 2000). STM ile belirli bir kategorinin diğer kategorilere kıyasla yanıtlanma olasılığının kestirilmesi amaçlanır. Bu nedenle her bir yanıt kategorisi ayrı eğim ve kesişim parametrelerine sahiptir.

STM’de \(\theta\) yetenek düzeyindeki bir s bireyin i maddesinde x puan (\(x=0,1,\dots,m_i\)) alma olasılığı, \(P_{ix}(\theta_s)\), Eşitlik (7.5)’teki eşitlikle hesaplanır.

\[ P_{ix}(\theta_s)=\frac{\exp(a_{ix}\theta_s+c_{ix})}{\sum_{x=0}^{m}\exp(a_{ix}\theta_s+c_{ix})} \tag{7.5} \]

Bu modelde, bir maddedeki K yanıt kategorilerinin her biri için bir \(a_{ix}\) ve \(c_{ix}\) kestirilmelidir. \(a_{ix}\), x kategorisi için takip çizgilerinin eğimi (yani ayırt edicilik) ile ilgilidir ve \(c_{ix}\), x kategorisi için kesişim parametresidir. STM’de, model tanımlaması için madde parametrelerine ilişkin iki model sınırlaması vardır: \(\sum a_{ix}=\sum c_{ix}=0\).

STM’de madde güçlük parametresi iki kategorili puanlanan maddeler için MTK modellerindeki güçlük parametresinden ve çok kategorili puanlanan maddeler için MTK modellerindeki adım/eşik parametrelerinden daha farklı ele alınmaktadır (Desjardins ve Bulut, 2018) . De Ayala (2009) STM’deki madde güçlük parametresi, bireylerin belirli bir yanıt kategorisini seçmeye yönelik eğilimi olarak tanımlanır.

STM’de \(a_i\) değeri ne kadar büyükse, ilgili yanıt kategorisi yetenek ile o kadar güçlü bir şekilde ilişkilidir. Örneğin birden fazla yanıt seçeneği (A, B, C ve D gibi) olan çoktan seçmeli bir madde bağlamında, doğru yanıt seçeneğinin yetenek ile doğrudan ilişkili olması nedeniyle pozitif ve yüksek bir eğim parametresine sahip olması beklenir.

STM’de bir madde için her kategoride yanıt verme olasılıklarına ilişkin eğriler kategori yanıt eğrileri olarak adlandırılı (Hambleton ve Swaminathan, 1985).

mirt paketiyle dat veri seti üzerinde STM’ye göre kestirim süreci aşağıda ana hatlarıyla örneklendirilmiştir. mirt() fonksiyonuyla analizi gerçekleştirmeden önce testteki 10 madde F gizil özelliğiyle ilişkilendirilip tek boyutlu model tanımlanmıştır. Bu model ‘stm’ nesnesine atanmıştır ve mirt() fonksiyonunun model argümanının değeri olarak ele alınmıştır. Analizin STM’ye göre gerçekleştirlmesi için fonksiyonun itemtype argümanı nominal değeriyle kullanılmıştır. Analiz çıktıları stm_uyum nesnesine atanmıştır.

library(mirt)
stm <- "F=1-10"
stm_uyum <- mirt(data = dat, model = stm, 
                 itemtype = "nominal", SE = TRUE)

stm_uyum nesnesi coef() fonksiyonunun argümanı olarak kullanılarak parametreler kesitirilmiştir. Kestirilen parametreler stm_par nesnesine atanmıştır. Bu nesnenin madde parametre kestirimlerini içeren items bileşeni seçilerek, bileşendeki değerler round() fonksiyonuyla binde birler basamağına yuvarlanmıştır. .

stm_par<- coef(stm_uyum, IRTpars = TRUE, simplify = TRUE)
round(stm_par$items, 3)
#>             a1     a2     a3    a4    a5     c1     c2     c3     c4     c5
#> madde1  -1.090 -0.471  0.104 0.161 1.296  0.543 -0.092 -0.763 -0.386  0.698
#> madde2  -0.941 -0.166 -0.304 0.262 1.150  0.706 -0.668 -0.500  0.139  0.323
#> madde3  -1.020 -0.397 -0.119 0.344 1.191  0.532 -0.208 -0.264 -0.163  0.103
#> madde4  -0.831 -0.703 -0.067 0.150 1.451 -0.874 -0.888 -0.335  0.175  1.922
#> madde5  -0.935 -0.199 -0.056 0.464 0.726  0.990 -0.128 -0.741 -0.456  0.334
#> madde6  -0.901  0.024  0.021 0.173 0.682  0.981 -0.464 -0.330 -0.020 -0.167
#> madde7  -0.760 -0.140 -0.100 0.267 0.733  0.956 -0.092 -0.219 -0.581 -0.064
#> madde8  -0.749 -0.312  0.098 0.088 0.875  0.153 -0.390 -0.043 -0.226  0.506
#> madde9  -0.658 -0.129  0.098 0.207 0.481  0.976  0.077 -0.342 -0.634 -0.076
#> madde10 -0.302 -0.300 -0.234 0.133 0.703 -0.428 -0.651 -0.404 -0.164  1.648

Elde edilen çıktıda her maddenin her bir seçeneğine ilişkin eğim parametresi kestirimleri (a1, a2, a3, a4 ve a5 sütunlarında) ve kesşim (daha doğru bir ifadeyle bireylerin bir seçeneği işaretlemeye yönelik eğilimi) parametresi kestirimleri (c1, c2, c3, c4 ve c5 sütunlarında) yer almaktadır.

plot() fonksiyonunun type argümanı trace değeriyle kullanılarak STM için kategori yanıt eğrileri elde edilmiştir.

plot(stm_uyum, type = "trace", which.items = 1:10,
     layout = c(5, 2), theta_lim = c(-4, 4),
     main = "Kategori Yanıt Egrileri_STM")

plot() fonksiyonunun type argümanı info değeriyle kullanılarak STM için test bilgi fonksiyonu çizdirilmiştir.

plot(stm_uyum, type = "info", theta_lim = c(-4, 4), 
     main="Test Bilgi Fonksiyonu_STM")

Test bilgi fonksiyonu incelendiğinde testin en yüksek bilgiyi 0 yetenek düzeyinde sağladığı görülmektedir. Testin 0 yetenek düzeyi için nispeten daha uygun olduğu söylenebilir.

7.5 Dereceleme Ölçeği Modeli-DÖM (Rating Scale Model-RSM)

Dereceleme Ölçeği Modeli (DÖM), 1978 yılında Andrich tarafından KPM’den türetilerek geliştirilmiştir. KPM’de madde yanıtlarına ilişkin kategori sayıları farklı olabilirken DÖM’de tüm madde yanıtlarına ilişkin kategori sayıları aynı olmalıdır (De Ayala, 2009).

DÖM’de her madde, maddenin göreceli olarak kolaylığını veya zorluğunu gösteren bir konum parametresi (location parameter) (\(\lambda_i\)) ile tanımlanır. Ayrıca tüm maddeler için ortak olarak tanımlanan kategori kesişim parametreleri (category intersection parameters) (\(\delta_i\)) vardır. Bu açıdan KPM modeliyle karşılaştırılacak olursa, KPM’deki adım parametresi bu modelde konum parametresi ve kategori kesişim parametresi olarak iki bileşene \(\delta_{ij}=(\lambda_i+\delta_j)\) ayrılmıştır (Embretson ve Reise, 2000).

Şekil 7.3’Te, iki dereceleme ölçeği maddesine ilişkin parametreler görülmektedir.

Şekil 7.3: İki DÖM maddesi parametreleri

Şekil 7.3’de görüldüğü üzere iki madde (madde 1 ve madde 2) genel konumları (\(\lambda\) parametreleri) açısından farklılık gösterse de, kategori eşiklerinin (\(\delta\) parametrelerinin) yayılımı iki madde arasında eşdeğerdir.

DÖM’de \(\theta\) yetenek düzeyindeki bir s bireyin herhangi bir maddede x puan (\(x=0,1,\dots,m_i\)) alma olasılığı, \(P_{x}(\theta_s)\), Eşitlik (7.6)’daki eşitlikle hesaplanır.

\[ P_{x}(\theta_s)=\frac{\exp\left[\sum_{j=0}^{x}\left(\theta_s-(\lambda_i+\delta_j)\right)\right]}{\sum_{x=0}^{M}\exp\left[\sum_{j=0}^{x}\left(\theta_s-(\lambda_i+\delta_j)\right)\right]} \tag{7.6} \]

Eşitlikte; \(\lambda_i\): i maddesi için konum parametresi, \(\delta_j\): j kategorisi için kategori kesişim parametresini temsil etmektedir.

mirt paketiyle dat veri seti üzerinde DÖM’ye göre kestirim süreci aşağıda ana hatlarıyla örneklendirilmiştir. mirt() fonksiyonuyla analizi gerçekleştirmeden önce testteki 10 madde F gizil özelliğiyle ilişkilendirilip tek boyutlu model tanımlanmıştır. Bu model dom nesnesine atanmıştır ve mirt() fonksiyonunun model argümanının değeri olarak ele alınmıştır. Analizin DÖM’ye göre gerçekleştirilmesi için fonksiyonun itemtype argümanı rsm değeriyle kullanılmıştır. Analiz çıktıları dom_uyum nesnesine atanmıştır.

dom <- "F=1-10"
dom_uyum <- mirt(data = dat, model = dom, 
                 itemtype = "rsm")

dom_uyum nesnesi coef() fonksiyonunun argümanı olarak kullanılarak parametreler kesitirilmiştir. Kestirilen parametreler dom_par nesnesine atanmıştır. Bu nesnenin madde parametrelerinin kestirimlerini içeren items bileşeni seçilerek, bileşendeki değerler round() fonksiyonuyla binde birler basamağına yuvarlanmıştır.

dom_par <- coef(dom_uyum, simplify = TRUE)
round(dom_par$items, 3)
#>         a1    b1     b2     b3     b4      c
#> madde1   1 0.793 -0.012 -0.102 -0.809  0.000
#> madde2   1 0.793 -0.012 -0.102 -0.809 -0.064
#> madde3   1 0.793 -0.012 -0.102 -0.809 -0.102
#> madde4   1 0.793 -0.012 -0.102 -0.809  0.606
#> madde5   1 0.793 -0.012 -0.102 -0.809 -0.223
#> madde6   1 0.793 -0.012 -0.102 -0.809 -0.284
#> madde7   1 0.793 -0.012 -0.102 -0.809 -0.299
#> madde8   1 0.793 -0.012 -0.102 -0.809  0.058
#> madde9   1 0.793 -0.012 -0.102 -0.809 -0.347
#> madde10  1 0.793 -0.012 -0.102 -0.809  0.569

Elde edilen çıktıda her maddeye ilişkin eğim parametresi kestirimleri (a1 sütununda) yer almaktadır. DÖM, Rasch temelli KPM’den türetilmiş bir model olduğu için eğim* parametresinin değeri tüm maddelerde 1’e eşittir. Ayrıca çıktıda kategori kesişim parametresi kestirimleri (b1, b2, b3 ve b4 sütunlarında) yer almaktadır. Çıktının son sütununda (c sütununda) her madde için farklı kestirilen konum parametresi yer almaktadır.

plot() fonksiyonunun type argümanı trace değeriyle kullanılarak DÖM için madde karakteristik eğrileri ve madde bilgi fonksiyonu grafikleri elde edilmiştir.

plot(dom_uyum, type = "trace", which.items = 1:10,
     layout=c(5, 2),theta_lim = c(-4, 4),
     main="Madde Karakteristik Egrileri_DOM")

plot() fonksiyonunun type argümanı info değeriyle kullanılarak DÖM için test bilgi fonksiyonu çizdirilmiştir.

plot(dom_uyum, type = "info", theta_lim = c(-4, 4),main = "Test Bilgi Fonksiyonu_DOM")

Test bilgi fonksiyonu incelendiğinde testin en yüksek bilgiyi 0 yetenek düzeyinde sağladığı görülmektedir. Testin 0 yetenek düzeyi için nispeten daha uygun olduğu söylenebilir.

Bölüm atıf bilgisi: Çetin, S. (2025). Çok kategorili madde tepki kuramı modelleri. N. Güler, B. Atar & K. Atalay-Kabasakal (Ed.), R ile psikometri içinde. Pegem Akademi.

Kaynaklar

Chalmers, R. P. (2012). mirt: A multidimensional item response theory package for the R environment, 48. doi:10.18637/jss.v048.i06

Darrell Bock, R. (1972). Estimating item parameters and latent ability when responses are scored in two or more nominal categories. Psychometrika, 37(1), 29-51.

De Ayala, R. J. (2009). The theory and practice of item response theory (Methodology in the social sciences). Guildford Press.

Desjardins, C. D. ve Bulut, O. (2018). Handbook of educational measurement and psychometrics using R. Chapman; Hall/CRC. doi:10.1201/b20498

Embretson, S. E. ve Reise, S. P. (2000). Item response theory. London, UK: Erlbaum Publishers.

Hambleton, R. K. ve Swaminathan, H. (1985). Item response theory: Principles and applications. Springer.