2024-2025 Güz PSK301 Psikolojide Ölçme ve Değerlendirme PDF

2024-2025 GÜZ PSK301 Psikolojide Ölçme ve Değerlendirme Kaynakça: Özgüven, İ. E. (2014). Psikolojik Testler. Ankara: Nobel Akademik Yayıncılık Size herhangi bir psikolojik test uygulandı mı?  Okulda  Üniversiteye girişte  Rehberlik merkezlerinde  Araştırma için →Geçmişte test alma yaşantısı çok daha azdı. →Psikolojik testlerin gelişimi bilim tarihi içinde oldukça kısa bir zaman dilimi içinde olmuştur. PSİKOLOJİK TESTLERİN NİTELİĞİ Psikolojik testlerin gelişimini en çok etkileyen nedenler: Eğitimde karşılaşılan problemler Psikolojide karşılaşılan problemler Çeşitli İhtiyaçlar ve Geliştirilen Testler  Zihinsel geriliklerin saptanması → zeka testleri  Sözlü/yazılı sınav değerlendirmelerinde subjektif sonuç sorunu → objektif testler  Eş zamanlı olarak ve kısa zamanda büyük kitlelerin değerlendirilmesi → başarı/yetenek alanlarında grup testleri  Normal davranışların normal olmayandan ayrılarak sınıflandırılması, uygun terapi yöntemine karar vermek için teşhis koymak vs → klinik alanda davranış testleri Eğitim alanında ve klinik alanda kullanılan psikolojik tesler, psikolojik danışmanlık, seçme ve yerleştirme, araştırma gibi hedeflerle de kullanılabilmektedir. Psikolojik Testlerin İnsan Davranışına Yönelik (bireyler ve durumlar hakkında) Bilgi Toplama Alanlarına Örnekler:  Bireyin psikolojik bir niteliğini ölçmek,  Gruplar arasındaki farklılıkların ortaya konması (çeşitli özellikler açısından),  Biyolojik yapının ve kültürün, davranışa yansımalarının incelenmesi,  Psikoterapi tekniklerinin birey üzerindeki etkisini görebilmek,  Eğitim tekniklerinin belirli davranışları kazandırmaya etkisinin tespit edilmesi Psikolojik Testlerin Kullanımındaki Çeşitli Amaçlar Kişinin değerlendirilmesi ve tanınması (özelliklerinin incelenmesi) Psikolojinin çeşitli dallarında → Grupların, sosyal ilişkilerin, kurumların, olayların ve çevrenin değerlendirilmesi vs… Neden Psikolojik Testleri İnceliyor ve Öğreniyoruz? Şu konularda gerekli bilgi, teknik ve yöntemlerin bilinmesi zorunlu olduğu için:  Psikolojik testleri kullanacak kişilere bu testlerin tanıtılması,  Testlerle ilgili olarak, ihtiyaca uygun testin seçimi,  Seçim için bir testte bulunması gereken nitelikler,  Testin uygulanması,  Test sonuçlarının uygun şekilde değerlendirilmesi ve yorumlanması,  Test hakkında sayısal veriler elde ederken ve bunları yorumlarken olası hataların düşünülmesi,  Hata payının azaltılması Psikolojik Testler Psikolojik testler, *belirli davranışların *objektif ve *standart şekilde ölçülmesini, gözlenmesini sağlayan ölçme araçlarıdır. Örn., çocuktaki kelime hazinesi genişliğinin değerlendirilmesi; işe alınacak muhasebecinin hesaplama yeteneği; pilotlardaki el-göz koordinasyonunun ölçülmesi… Psikolojik testlerin, madde sayısı ile maddelerinin içerikleri, →psikolojik testlerin ölçülen özelliği yeterince kapsayıp kapsamadığını, genel olarak temsil edip etmediğini belirlemektedir.  Örn., bir kelime hazinesi testi, bünyesinde sadece müzik terimlerini içeriyorsa, bu testin, çocuğun toplam kelime hazinesi genişliğine yönelik güvenilir bir ölçüm yapamayacağı açıktır.  Örn-2., beş sorulu ya da sadece çarpmadan oluşan aritmetik işlemler testinin, kişinin tüm hesaplama becerisini temsil etmesi ihtimali de çok zayıftır. Sadece bir testin kapsadığı davranış durumlarını ölçmek psikolojik testlerin asıl amacı olabilir mi?  Bir testteki 50 kelimeden veya 20 aritmetik işlemden ne kadarının bilindiğinin tek başına fazla önemi yoktur!  Ancak, öğrencinin kelime hazinesi testindeki başarısı ile tüm kelime hazinesinin derecesi arasında ya da  İşe girecek kimsenin aritmetik işlemler testi ile gireceği işteki performansı arasında önemli bağıntının bulunduğu bilinirse, →İşte o zaman test amaca hizmet ediyor demektir! Bir testin değeri deneysel olarak, →bireyin testteki performansı ile diğer davranış durumları arasındaki ilişkinin ortaya konması ve bu ilişkinin derecesi ile ilgilidir. Teşhis? Yordama? Teşhis = genellikle bireyin mevcut durumunu, şartlarını ortaya koyma Yordama = bireyin gelecekteki davranışları hakkında yargılara varma →Teşhis halinde bireyin şimdiki şartlarının bilinmesi, onun gelecekte ne yapacağı veya yapabileceği konusunda bazı belirtilere de işaret edecektir. Bu bakımdan psikolojik testler, bireylerin davranışlarını yordamaya yarayan belirli alanları temsil edecek şekilde örneklenmiş davranış ölçüleri olarak düşünülebilir. Psikolojik Testlerin Tanımı Psikolojik testler, kişinin davranışını standart koşullar altında gözlemeye yarayan ölçme araçlarıdır. Diğer bir deyişle; «Bireylerin herhangi bir niteliğini ölçme amacıyla, nitelikler evrenini temsil edecek şekilde seçilmiş standart uyarıcılar takımıdır». Tanıma bakıldığında; Psikolojik testlerin amacı, bireylerin çok çeşitli niteliklerini ölçmek, dolayısıyla bireyler arasındaki nitelik farklarını ortaya koymaktır. Ayrıca psikolojik testlerin ölçmeyi amaçladığı nitelikler evrenini temsil etmesi, test içindeki soru veya maddelerin bu evreni iyi örneklemesi gerektiği vurgulanmaktadır. Psikolojik testler,  Standart koşullarda davranışı inceler Test maddeleri, verilen süre, testin uygulanması, testin puanlanması vs tüm katılımcılar için aynıdır. Katılımcıların söz konusu testten aldıkları puanların karşılaştırılabilmesi için testle ilgili koşulların ve işlemlerin aynı olması bir zorunluluktur!  Sayı ve kategorilerle sonuçlanır. Örn., zeka testinden alınan toplam puan, yani sayı Z.B.=110 gibi bir sonuca ulaştırılır. Örn., kişilik envanteri uygulanmış bir kişi, normal, nevrotik veya psikotik kategorilerinden birine yerleştirilir. Test sonuçlarının anlaşılması ve yorumlanması için, Normlar ve puan dağılımlarından ortaya çıkan profiller meydana getirilerek kullanılmaktadır. Yanı sıra gözlem önemli veri sağlamaktadır. Örn., Wechsler zeka testinde sonuca giderken, bireyin zeka bölümü, alt ölçeklerin dağılımına göre oluşan profil ve bireyin uygulama esnasındaki davranışına ilişkin gözlem bilgi sağlamaktadır. Psikolojik testlerin temel işlevi, *kişiler arasındaki farklılıkların ölçülmesi, *ya da aynı kişinin farklı zamanlarda ve farklı durumlarda verdiği tepkilerin farklılıklarının ölçülmesidir. Cronbach (1970), testlerin kullanım amaçlarını ve işlevini dört grupta toplamıştır. 1) Kişilerin seçimi 2) Bireylerin sınıflanması 3) Uygulanan yöntemlerin değerlendirilmesi 4) Araştırmalarda bilimsel hipotezlerin kontrol edilmesi Psikolojik Testlerin İşlevleri: Seçme başvuru yapanlardan en uygun öğrenciyi ya da personeli seçmek vs – elemek… Hedef doğrultusunda uygun olmayanlar da seçilebilir. Seçme amacı ile kullanılan testler YORDAMAYI amaçlar. Yordayıcı testler okul, işyerleri ve orduda personel seçme ve geleceğe yönelik kararları için kullanılan testlerdir. Psikolojik Testlerin İşlevleri: Sınıflama belirli seçenekler arasından kişiye en uygun olanına karar vermek – örn. ruh hastalığı teşhisi, fabrikada ustabaşı-çırak ayrımı vs… Bu bir seçme işlemi olmayıp, farklı düzeylere göre ayrılan insanların sınıflandırılması işlemidir. Sınıflamada, bireyler seçme işleminde olduğu gibi elenmemektedir. Psikolojik Testlerin İşlevleri: Uygulanan Yöntemlerin Etkisini Değerlendirme Psikolojik testler, araştırmada bireyler ve durumlar hakkında bilgi toplama amacı ile kullanılır. psikoterapi, ilaçla tedavi, eğitim yöntemi, eğitim programı, konferans gibi çeşitli yöntemlerin etkililiğini, ne kadar değişiklik ve yarar sağladığını vs görmek… Psikolojik Testlerin İşlevleri: Hipotezlerin Kontrol Edilmesi Kişinin, kişilerin, kurumların ve yöntemlerin değerlendirilmesi yanında psikolojik testler bilimsel hipotezlerin kontrol edilmesinde de kullanılır. Bilimsel araştırmaların, kullandıkları değişkenler hakkında bilgi edinmeleri… Psikolojik Testlerin İşlevleri: Teşhis ve Yordama Teşhis ve yordama, bir çeşit sınıflamaya dayanır. Her test yordamalar yapılabilmesine olanak verir (klinikte, okulda, işyerinde vs). Örn. üniversiteye giriş sınavında yüksek puan alan öğrencilerin, düşük puan alan öğrencilerden daha başarılı olacakları önceden varsayılmaktadır. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME PSİKOLOJİK TESTLERİN TARİHÇESİ VE GELİŞİMİ Dünyada ve ülkemizde kullanılan testlerin (başarı, yetenek, kişilik, ilgi ve tutum) ortaya çıkması ve günümüzdeki halini alması, insanların çeşitli konulardaki temel ihtiyaçlarından kaynaklanmıştır. Bu testlerin gelişmesine pek çok kişi katkı sağlamıştır. ZİHİNCE GERİ OLANLARI AYIRDETME ÇABALARI 19. yy’da, zihinsel olarak geride olan bireylerin eğitilmesi ve ruhsal hastalıkların tedavisi yönünde ciddi bir hareketlenme yaşanmıştır. Bu konularda gelişim görülebilmesi için ilk olarak, Davranışlarda görülen bu bozuklukların zihin geriliğinden mi? Ruh hastalığından mı? Her ikisinden mi kaynaklandığının ortaya konması gerekliydi. Fransa’da alanında uzman olan Esquirol (1838) ile Sequin (1866) zihin geriliğinin, Kalıtımsal olarak mı, Yoksa ilk çocukluk yıllarındaki olumsuz sebeplerden mi kaynaklandığı üzerinde yoğunlaşıyordu. Bu uzmanların çalışmaları sonucu, Zihin geriliğinin farkedilmesinde, konuşma, kavrama, anlama gibi sözel faktörlerin en önemli işaretler olduğu ortaya konmuş, Tedavisinin mümkün olmadığı düşünülen zihinsel geriliklerin, belirli ölçülerde eğitimle tedavi edilebileceği fikri sunulmuştur. Bu uzmanlardan Sequin, zihinsel açıdan geride olan bireyleri ayırdedebilmek için, çeşitli şekillerden oluşan parçaların uygun boşluklara yerleştirilmesi ilkesine bağlı olan «Sequin Şekil Tahtası’nı» geliştirmiştir. Bu test günümüzde de kullanılmaktadır ve dile dayanmamaktadır. Ayrıca bu test, yapay performans testlerinin başlangıcı olarak kendine yer bulmuştur. DENEYSEL PSİKOLOJİ VE PSİKOFİZİKSEL ÖLÇME 19. yy’daki ilk deneysel psikologlar, insan davranışına yönelik genel kuralları keşfetmeye ve davranışı açıklamaya yoğunlaşmışlardır. Yani, bireysel davranış farklılıkları yerine, davranışın genel ve ortak kurallarının bulunması hedeflenmiştir. Davranışta görülen bireysel farklar, Ya dikkate alınmamakta ya da Teoriye aykırı düşen ve genel kuralların uygulanabilirliğini sınırlayan «hata» olarak kabul edilmekteydi. Psikolojik testlerin temelinde işlevsel bir kavram olarak «bireysel farklar» vardır. Psikolojik testler bireyler arasında yetenek ve tipik davranışları yönünden var olan bireysel farkları ölçmeyi hedeflemektedir. Psikolojik testlerin ortaya çıkarılmasında yararlanılan iki temel kaynak: Bireysel farkların ölçülmesine yönelik çalışmalar (Darwin, Galton, Cattell) Psikofizik konulara dair çalışmalar (Herbart, Weber, Fechner, Wund) Wund (1879) ilk deneysel psikoloji laboratuvarını kurmuştur. Kendisi, laboratuvar çalışmalarında duyular ile tepki zamanlarının ölçülmesi üzerine odaklanmıştır. Söz konusu çalışmalarda, deneklerin her birinin STANDART koşullarda gözlenmesi gerekliliği ortaya konmuştur. Standart koşullara yönelik bu gereklilik, psikolojik testlerin gelişmesinde çok önemli bir yere sahip olan ilkeye dikkatleri yöneltmiştir. FRANCIS GALTON’UN KATKISI Galton, Darwin’in canlılar için geliştirdiği teorisini insanlara uygulamış ve Günümüzde psikolojide önemli bir boyut olan «bireysel farkları» incelemiştir. Gerçekleştirdiği deneysel çalışmalar ile, Reaksiyon zamanı Görsel hassasiyet Fiziki güç gibi duygusal ve devimsel farkları meydana çıkarmıştır. Galton, zihinsel farkların çok «karmaşık» olduğuna inanmış, Bu karmaşık zihinsel fonksiyonların daha «basit» olan duygusal fonksiyonlardan yordanabileceğini düşünmüştür. Galton, kalıtım sürecini incelerken, bireylerin çeşitli niteliklerini, beden ölçülerini ve duygusal hassasiyetlerini değerlendirme gerekliliğinden ötürü bireysel farkların ölçülmesine odaklanmıştır. Zeka ile kalıtım arasındaki ilişki, çalışmalarında yoğunlaştığı konulardır. Galton, bireylerin çeşitli yönlerden duygu hassasiyetlerini ölçmüş → Bu amaçla çeşitli ölçme araçları geliştirmiştir. Galton, zekayı ölçmek için duyguları ölçerek işe girişme konusunda, →Zihince geri olanların soğuğu, sıcağı ve ağrıyı ayırdetmede güçlük çektiklerine ilişkin gözlemlerinden ve → Bunu destekleyen John Locke’un görüşlerinden etkilenmiştir. John Locke, Beş duyunun insanın dışa açılan pencereleri olduğunu, Dış dünyadan bireye gelen algı ve bilgilerin ancak beş duyu aracılığı ile ulaşabildiğini, Dış dünyadan alınan bilgilerin duyu organlarının kapasiteleri ile yakından ilgili olduğunu, Dış dünyadan bireyin alabildiği algısal genişliğin derecesine göre, → Bireylerin yargılarının ve zihinsel güçlerinin de yüksek olacağını iddia etmiştir. Galton (uzun çalışma ve denemelerini kapsayan) «İnsan Yeteneklerinin Gelişmesi» (1833) adlı eserinde, Bireylerin çeşitli yeteneklerini nasıl tespit ettiğini, Bunları ne şekilde, hangi yöntem ve araçlarla ölçtüğünü anlatmıştır. Bireysel farklara yönelik kapsamlı ölçüme ulaşma çabaları, psikolojik testlerin başlangıcı şeklinde kabul edilmektedir. Derecelendirme ölçekleri, serbest çağrışım teknikleri, anket, → Galton’un öncülük ettiği ve günümüzde de kullanılan soru sorma teknik ve yöntemleridir. Galton’un çalışmalarında, testleri sadece basit bir deneysel yöntem olarak kullanması, Yalnızca bireyin performansına ve testteki başarısına önem vermesi, Başarıyı etkileyen, ancak doğrudan ölçülemeyen ve gözlenmeyen değişkenler üzerinde durmaması Davranışçı görüşe inanan psikologlar arasında daha çok tutunmasına neden olmuştur. Galton’un bir diğer önemli katkısı, → test sonuçlarının analiz ve yorumlanmasında, geliştirdiği istatistiksel yöntemlerdir. Bu yöntemler, öğrencisi Karl Pearson tarafından daha da geliştirilmiş ve psikoloji ile bilimin metodolojisine kazandırılmıştır. CATTELL’İN ZEKA TESTLERİ Avrupa’da Wund’un yanında çalışmalar yapmış olan James McKeen Cattell, İngiltere’de bulunduğu esnada Galton’un görüşlerinden etkilenerek Amerika’ya dönmüştür. Böylece psikoloji laboratuvarında testler hazırlamaya başlamıştır. Zeka Testi (Mental Test, 1980) kavramı da ilk olarak Cattell’in yazdığı bir makalede yer almıştır. Cattell tarafından bireysel şekilde uygulanmak üzere geliştirilen zeka testi şu durumları kapsamaktaydı: Hareket hızı Kas gücü Ağrıya yönelik hassasiyet Görme ve işitmedeki hassasiyet Ağırlıkları ayırdedebilme Bellek gücü Reaksiyon zamanı Bu testler (Galton’un reaksiyon zamanı ve duygular keskinliği ölçümünü temel alan) aslında 19.yy’daki fikirlerin devamı sayılırdı. Aynı yıllarda Avrupa’da hazırlanan testler ise (Kraepelin, Qehrn, Ebbinghaus), Aritmetik işlemler, algı, bellek, çağrışım ve cümle tamamlama gibi Karmaşık zihin fonksiyonlarından oluşmaktaydı. → Cattell’in testleri üzerinde yapılan araştırmalarda (Wissler- Kolombiya Üni-1901), ***test sonuçları ile öğrencilerin üniversiteden aldıkları notları arasında sıfıra yakın bir korelasyon bulunmuş, ***duyuların ölçülmesine dayanan zeka testlerinin geçerli olmadığı sonucuna varılmıştır. Aynı yıllarda Ebbinghaus ise, *** Cümle tamamlama testleri sonuçları ile öğrencilerin akademik başarıları arasında oldukça yüksek bir korelasyon bulmuştur. → Fransa’da da Alfred Binet (1805), *** bu dönemde hazırlanan testleri, basit, çok özel ve duygusal nitelikleri ölçtüğü için eleştirmiş, *** zeka testlerinin karmaşık fonksiyonları ve çok özel değil genel nitelikleri ölçmesi gerektiğini savunmuştur. BINET VE BİREYSEL ZEKA TESTLERİNİN DOĞUŞU Zekanın değerlendirilmesinde 19.yy’da kullanılan bütün yöntemleri Binet ve Simon da denemiştir. Neticede, zeka seviyesini duyulara yönelik ölçümler aracılığıyla tahmin etmenin mümkün olmadığını düşünmüşlerdir. Onlar, doğrudan karmaşık zihin fonksiyonlarının ölçülmesi gerektiği yönünde bir eğilime sahip olmuşlardır. Fransa’da 1905’te Eğitim Bakanlığı kendilerinden okullardaki zihinsel olarak geride olan öğrencileri ayırdedebilecek bir test geliştirmeleri yönünde bir talepte bulunmuştur. Böylece Binet Zeka Testi okul öncesi düzeyde ve çocuklar için geliştirilen zeka testi geliştirme uğraşlarının başlangıcı olmuştur. 1911 yılında test yetişkinler düzeyine uzatılmıştır. Binet Zeka Testinin pek çok revizyonu yapılmıştır. En iyi revizyonu Stanford Üniversitesi’nde gerçekleştirildiği için Stanford-Binet Zeka Testi olarak da anılmaktadır. Bu testin 1937’deki revizyonunun ardından 1939’da David Wechsler tarafından ilk yetişkinler zeka testi geliştirilmiştir. Wechsler Yetişkinler için Zeka Testi, daha sonra okul ve okul öncesi dönemi de kapsayan test takımları şeklinde farklı dönemlere de yayılmıştır. Grup zeka testleri de bireysel testler gibi pratik bir ihtiyacın karşılanmasından doğmuştur. I. Dünya Savaşı’nda Amerika’da bir buçuk milyon kişi askere çağrılınca, →Bu kişilerin askeri hizmetlere yerleştirilmesi, sınıflandırılması kısa sürede çok sayıda kişiye test uygulanmasını gerektirmiştir. →O yıllarda zaten bir grup zeka testi üzerinde çalışan Arthur S. Otis, bu testi orduda kullanılmak üzere vermiştir. Bu test üzerindeki çalışmalardan ordu içinde, okuma- yazma bilenler için «Ordu Alfa» ve okuma-yazma bilmeyenler için «Ordu Beta» grup testleri hazırlanmıştır. Bu testler orduda kullanılmış ve savaş bittikten sonra da sivil hayatta çeşitli amaçlar için kullanılmaya devam edilmiştir. GENEL YETENEK TESTLERİ Başlarda zeka testleri, Çok çeşitli zihin fonksiyonlarını değerlendirecek şekilde Bireyin genel zihin gelişiminin göstergesi olacak şekilde heterojen yapıdaydı. Ancak daha sonraki zeka testleri ise zekanın tüm niteliklerini değil, belirli faktörlerini (örn., dil, sayı, muhakeme vs) homojen yapıda değerlendirmekteydi. Bunlar, genel faktörler değil, okul başarısının gerektirdiği zihinsel faktörlerdi. Dolayısıyla zeka testi kavramı 1920’li yılların ardından «akademik yetenek testi», «öğrenme gücü testi» gibi dar ifadelerle anılmıştır. Zaman içerisinde zeka hakkındaki görüşlerde farklılıklar olmuştur (faktör analizi yöntemleriyle birlikte vs). Geleneksel tek puan veren testlerin yanı sıra, bireyin çeşitli özelliklerine yönelik çok puan veren testler de ortaya konmuştur. Genel zeka testlerini tamamlayıcı nitelikte özel yetenek testleri de (mekaniksel yetenek, müzik yeteneği, resim yeteneği gibi) geliştirilmiştir (mesleğe yöneltme, seçme ve sınıflandırmada kullanılabilen). BAŞARI TESTLERİ 19. yy ortalarına dek okullarda başarı değerlendirmelerinde sözlü sınav kullanılırken, Ardından buna yazılı sınav ekleme çabası ortaya çıkmıştır. Yazılı sınavların getireceği faydalar: Öğrencilerin tümü için standart bir durum oluşturmak Şans hatasını azaltmak Daha çok sayıda soru sorabilmek Soru seçimindeki subjektif yaklaşımları önlemek Başarı testlerinin gelişmesinde en büyük katkıyı ve günümüzde kullanılan başarı testlerinin öncülüğünü Edward L. Thorndike yapmıştır. Bu testlerin yaygın olarak kullanıldıkları durumlar şunlardır: Eğitim hedeflerini ölçmek Okul başarısını değerlendirmek Sanayi ve kamuda personel seçimi Giriş sınavları KİŞİLİĞİN ÖLÇÜLMESİ Bu konudaki ilk yaklaşım örneği olarak Serbest Çağrışım Testi öne sürülmektedir. Günümüzde de kullanılan bu testler, hastanın seçilmiş kelimelerin her birine teker teker aklına ilk gelenleri söylemesine dayanmaktadır. Daha önceden Galton, Pearson ve Cattell tarafından hazırlanan soru-cevap yöntemleri (derecelendirme ölçekleri, anketler, envanterler), kişiliğin ölçülmesinde de kullanılmaktadır. Kişiliğin ölçülmesinde ampirik yaklaşımı kullanan bir kişilik envanteri olarak 1943’te ortaya çıkan Minnesota Çok Yönlü Kişilik Envanteri (MMPI) gösterilebilir. Projektif teknikler de kişilik ölçümlerinde kullanılan bir diğer yaklaşım olarak karşımıza çıkmaktadır. Bu teknikler, bireyin açık olmayan uyarıcılara tepki vermesine dayanmaktadır (sosyal kabul hatasını önlemektedir). Serbest çağrışım testleri, projektif yaklaşımın ilk örnekleri arasında yer almaktadır. Uyarıcı kelimeler, tamamlanmamış cümleler, resimler, mürekkep lekeleri kişilik değerlendirmelerinde kullanılan yöntemlerdir. Kişiliğin ölçülmesine yönelik bir diğer yaklaşım olarak Durumsal Test ile Performans Testinden bahsedilebilir. Bu gibi testlerde, hedefle ilgili bir durum oluşturulmakta, böylece kişinin davranışları bu durum kapsamında gözlenmektedir. İLGİLERİN ÖLÇÜLMESİ İlgi testlerinin gelişimi, sanayinin gelişmesiyle paralellik göstermektedir (20 yy. başında ABD’de meslek seçme vs konulara ilgi artmıştır). Meslek seçme konusunda temel ilkelerden biri «bireyin kendisini iyice tanıması, yetenek ve ilgilerini bilmesi»dir. İlgilerin ölçülmesine yönelik ilk envanter E. K. Strong tarafından geliştirilen «Strong’un Mesleki İlgi Envanteri»dir (1927). Daha sonra G. F. Kuder de bu alanda yaygın şekilde ölçme araçları geliştirmiştir. Kuder 1934 yılında «Kuder Tercih Envanteri’ni meydana getirmiştir. Kuder, meslek ilgisi envanterine ek olarak, bireylerin genel ilgi düzeylerini ölçmeye yönelik envanterler de ortaya koymuştur. Kuder İlgi Envanteri, özellikle lise düzeyindekiler için meslek alanlarına dair ilgileri ölçmeyi hedeflemektedir. TUTUMLARIN ÖLÇÜLMESİ «Tutum, bireylerin eşya, kişi, fikir veya kurumları kabul ya da reddetmeye olan bir çeşit hazır oluş hali ya da eğilimi» olarak ifade edilebilir. Tutumların ölçülmesi 20. yy başlarında gerçekleşmiştir. Bu konuda Thurstone (1929) öncülük etmiştir. Thurstone ölçekleme yaklaşımı ile ifadelerin ölçek değerini ortaya koymuştur. R. Likert (1932) ise farklı bir yaklaşım tarzı ile beşli derecelendirme ölçeği (pozitiften-negatife) kullanmıştır. 1950’yi takip eden yıllarda ise evet-hayır şeklinde yanıtlandırılan ya da derecelendirilmiş sorular ile çok sayıda kişiye ulaşılan ve yanıt alınan, seçmen davranışlarını ortaya koyma, pazarlama gibi amaçlar için kamuoyu anketleri uygulanmıştır. ÖZETLE, Psikolojik testlere yönelik kavram ve yöntemler yönündeki gelişmeler 19. yy’da başlamıştır. 20. yy başlarında ise esas ürünler meydana çıkarılmıştır. Toplumda ortaya çıkan pratik ihtiyaçlar ile istatistik ve faktör analizlerindeki gelişmeler, psikolojik testlerin gelişimi yönünde önemli katkılar sağlamıştır. Günümüzde çeşit ve kapsam açısından psikolojik testlerde sayıca artış söz konusudur. Psikolojik testler, teknik ve yöntemlere sahip başlı başına bir bilime dönüşmüştür. TÜRKİYE’DE PSİKOLOJİK TESTLERİN TARİHÇESİ VE GELİŞİMİ PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME ÖLÇME, ÖLÇEKLER VE DEĞERLENDİRME Psikolojik testler, bireylerin niteliklerini ölçme araçları olarak karşımıza çıkmaktadır. Yani ÖLÇME kavramı, psikolojik testler bakımından özellikle önem taşımaktadır. Esasen ölçme kavramının, insanlığın var oluşundan beri mevcut olduğu belirtilebilir. Örn. – elbise yapmak, – mağara genişliklerine dikkat etmek vs Eski Mısır’da piramitleri inşa edenlerin, Romalılarda köprü, anıt, bina ve yol yapımlarında rol alanların kendilerine özgü ölçüleri bulunmaktaydı. İngiliz ölçü sisteminde yer alan uzunluk ölçüsü, ayak ve ağırlık ölçülerinin, Romalıların kullandıkları bu ölçülerden geldiği belirtilmektedir. Ölçme kavramının günümüzde de yaşamımızın her evresinde yer bulduğu ve hem günlük hayatımızda hem de bilimsel gelişmelerde ölçmenin oldukça önemli bir yere sahip olduğu görülmektedir. örn., sıcaklık ve hava basıncının ölçülmesi; saat satışı ile ülkenin kalkınma ve medeniyeti arasındaki ilişki vs) Ölçme yöntemleri geliştikçe, hatta ölçme araçları çok küçük farkları ölçebilecek şekilde hassas hale getirildikçe bilim alanlarında da hızla gelişme olacaktır. Bilim, ölçmesiz olamaz… Bununla birlikte fizik bilimlerinin ölçüleri daha hassasken, sosyal bilimlerdeki ölçülerin daha az gelişmiş olduğu söylenebilir. Esasen ölçmenin kendisi bir AMAÇ DEĞİL, işlerimizi kolaylaştıran bir ARAÇTIR. Örn., – bir kumaşın ölçülmesi? – bir öğrenciye zeka testinin uygulanması? ÖLÇMENİN TARİFİ Ölçme kelimesi, bir süreç olarak kullanılmakta, ölçme işleminin yapılmasını belirtmekte, diğer bir deyişle fiil olarak kullanılmaktadır. Bu kelime isim olarak kullanıldığında ise ölçü olarak kullanılmaktadır: – ölçme birimini, ölçme aracını ya da ölçme sonucu edinilen miktarı ifade edecek şekilde. Herkes (bakkal, fizikçi, psikolog, meteor, öğretmen, danışman vs…) ölçme yapmaktadır. Ancak ölçme işlemi farklı şekillerde tarif edilebilmektedir. «Ölçme, herhangi bir çoklukta belirli bir birimden kaç tane olduğunu saptama sürecidir.» Yani ölçme, çeşitli özelliklere ilişkin – (eşyanın uzunluğu, – boyu, – kapasitesi, – niceliği… gibi) gözlem sonuçlarının sayı ile ifadesidir. Ölçme sürecinin pek açık olmadığı daha geniş anlamda ölçme işlemini kapsayan başka ölçme durumlarından da bahsedilebilir: – Öğrencilerin cinsiyete göre sayılması – Güzellik yarışmasındaki derecelendirmeler – Hastanedeki hastaların, hastalık doğasına göre sınıflandırılması – Kişilerin sigara içme durumuna göre sınıflandırılması vs Bahsedilen bu örnekler, nitelik açısından ölçmenin daha düşük dereceleridir. Bu gibi durumlarda ölçme işlemini yapan bir ölçekten bahsetmek mümkün değildir. «ÖLÇME, herhangi bir objenin belirli bir niteliğini, belirli kurallara göre, sayarak, sınıflandırarak, derecelendirerek ya da birimlerle sayısal olarak ifade etme süreci» dir. Tanımda bahsedilen obje ile objenin niteliği, ölçme konusu veya ölçülecek niteliklerle alakalıdır. Obje → insan, eşya vs. olabilir (canlı veya cansız herşey). Bir objede çeşitli özellikler bulunmaktadır. – Objenin niteliklerinin toplu şekilde değil de, ayrı ayrı konu edilip ölçülmesi uygun olacaktır. Davranış bilimleri açısından bakıldığında, Ölçmenin konusu/obje → insandır. İnsanda ölçülmesi istenilen nitelik – SOMUT ya da SOYUT bir nitelik olabilmektedir. Somut nitelikler → Dolaysız ölçme yöntemleriyle Soyut nitelikler → Dolaylı ölçme yöntemleriyle yapılmaktadır. Ölçmenin sonucu sayılarla ifade edilmektedir. Bunun SAYISAL olması, ölçmenin temel bir özelliği olarak karşımıza çıkmaktadır. ÖLÇME KAVRAMININ NİTELİKLERİ Ölçme tanımında yer alan obje kelimesi, ölçmenin konusuna işaret etmektedir. Ve bu kelimenin, tüm varlıkları (canlı, cansız) kapsayacak şekilde kullanıldığı görülmektedir. Thorndike → testler ile ölçme tekniklerinin gelişimine ciddi katkılarda bulunmuştur. Kendisine (1921) neleri ölçmenin mümkün olacağı sorulduğunda, cevabı şöyle olmuştur: – «eğer bir şey varsa bu, ondan bir parça var demektir», – «eğer bir şeyden bir parça varsa o da ölçülebilir». Kısacası, var olan herşeyin ölçülebileceğine işaret etmiş ve ölçme olanaklarını oldukça geniş tutmuştur. Bununla birlikte ölçme konusu hala bünyesinde pekçok problem barındırmaktadır. Objenin nitelikleri (ölçme konusu olan) soyut ve somut olarak iki genel kategoride ele alınabilmektedir. SOMUT objelere örnekler: – masa, şekilsiz bir taş parçası, ağaç, insan vs – gözle görülebilen ve elle tutulabilen şeyler… – Boy ve ağırlık gibi özellikler, bahsedilen bu objelerin somut nitelikleri olmaktadır. Objelerin soyut nitelikleri ise – (zeka, başarı, karakter, uyum… vs) Elle tutulup gözle görülmeyen, Ancak etkileri ile varlıklarından haberdar olabildiğimiz niteliklerdir. İnsanın bahsedilen bu soyut nitelikleri, dolaylı yöntemlerle ölçülebilmektedir. DOLAYLI VE DOLAYSIZ ÖLÇME Ölçme tanımında ifade edilen kural kavramı, ölçme yöntemiyle ilişkilidir. Ölçme kuralları da – objenin cinsine – objenin niteliklerinin soyut/somut oluşuna göre farklılık göstermektedir. Örneğin, – Bir masanın ölçülmesi – Şekilsiz bir taşın hacminin ve ağırlığının ölçülmesi İnsanın zeka ve başarısının ölçülmesi farklı kural ve yöntemlerle gerçekleştirilmektedir. Masayı ölçerken, – Metrenin sıfır noktasını masanın bir ucuna getirerek, birimleri sayılır ve metrenin diğer ucundaki sayıyı belirlenir. Şekilsiz bir taşın hacmini ölçerken, – Dolu ve dereceli bir kaba atarak yükselen su seviyesindeki fark incelenir. Şekilsiz bir taşın ağırlığını ölçerken, – Terazide dengeye gelen gramlara bakılır. İnsanın boy ve ağırlığı da buna benzer metotlarla ölçülmektedir. Yukarıdaki örneklerdeki ORTAK YÖN: – Niteliklerin somut olması – Doğrudan doğruya ölçmeye olanak vermesidir! Peki insan zekasının ölçülmesi nasıldır??? Zeka diye elle tutulan, gözle görülen, doğrudan temas edilebilecek bir şey bulunmamaktadır. Yani bunlar insanın soyut nitelikleridir. İnsanlar uzun yıllar boyunca zeka gibi soyut nitelikleri, bireyin somut niteliklerini ölçmek yoluyla yordamaya çabalamışlardır. Örneğin, – Kafatasının çevresini ölçerek – Alnın genişliğini ölçerek – Kişinin dışarıdan gelen uyarıcılara yönelik tepki zamanlarını ölçerek – Bu ölçülerdeki bireysel farklara yoğunlaşarak insanın zekasına yönelik tahminlerde bulunmuşlardır. Ancak daha sonra, bahsedilen bu ölçülerin zeka ölçüsü olarak kullanılamayacağı ortaya konmuştur. Bunların yerine – okuduğunu anlama, – dil ve sayı ile ilgili soyut sembolleri kavrama, – sebep-sonuç ilişkilerini bulma gibi ölçülerin zeka ile daha yakından ilişkili olduğu görüşleri sunulmuştur. Görüldüğü gibi somut nitelikleri ölçme kuralı ile soyut nitelikleri ölçme kuralı birbirinden tamamen farklıdır. Bir objenin somut niteliklerini ölçmek dolaysız, doğrudan doğruya gerçekleştirilebilirken, Aynı objenin soyut niteliklerini ölçmek dolaylı yöntemlerle yapılabilmektedir. Dolaylı ölçmede, Asıl ölçmek istenilen şey doğrudan ölçülememektedir. Onunla ilişkili olduğu varsayılan başka bir nitelik ölçülmektedir ve bu ölçü, asıl ölçülmek istenen niteliğin ölçüsüymüş gibi kullanılmaktadır. Örneğin zekanın ölçülmesinde, asıl ölçülmek istenen zekanın yerine tepki zamanı ya da sembolleri kavrama derecesi ölçülmektedir. Ve elde edilen bu ikinci niteliğe ait ölçme sonuçları, zeka ölçüsüymüş gibi kullanılmaktadır. Bu tarz ölçmelerde ölçülen şeyin, asıl ölçülmek istenen şeyle aynı olup olmadığı daima problemli bir soru olarak var olmuştur. Bu sorun, ölçmenin «GEÇERLİĞİ» konusuyla alakalıdır. Örneğin B’nin, asıl ölçmek isteyip de ölçemediğimiz A’ya benzer olması ya da aynı olması oranında ölçümüz GEÇERLİDİR. Ancak B, A’dan farklı bir şey olarak karşımıza çıkıyorsa, ölçümüz geçerli bir ölçü olmamaktadır. Geçerlik konusu, var-yok meselesinden ziyade bir derece meselesi olarak ortaya çıkmaktadır. Ölçme yönteminin geçerlik düzeyi düşükse, o derecede elde edilen ölçülere göre verilecek yargılar da hatalı olacaktır denebilir. Dolaysız (doğrudan doğruya) ölçmede, ölçülen şeyle, ölçülmek istenen nitelikler aynı şeydir. Örneğin, masanın uzunluğunu ölçeceği zaman kişi metreyi alarak doğrudan bu uzunluğu ölçebilmektedir. Yani dolaylı ölçüye ihtiyaç bulunmamaktadır. Ölçme aracı, ölçmek üzere hazırlandığı amaca hizmet ediyorsa, yani bu amacı ölçebiliyorsa, elde edilen sonuçların geçerliği de yüksek olacaktır. ÖLÇME BİRİMİ Ölçme işleminin sonucunu sayısal olarak ifade edebilmek için → standart bir birime ihtiyaç vardır. Çeşitli ölçme araçlarına ilişkin ölçme birimlerine örnekler: – Metre, kg, saat, kilovat, lira, derece, puan vs… İnsanların standart ölçme birimlerine kavuşmasının kolay olmadığından bahsedilmektedir. İngilizlerin eskiden kullandıkları «yarda», bizim kullanmış olduğumuz «arşın» gibi kavramlar, her insanın kol uzunluğuna göre değişen ölçülerdir. Ancak günümüzde dünyanın her yerinde aynı olan «inç», «santimetre», «gram» gibi kavramlar kullanılmaktadır. Bununla birlikte standart ölçüler tamamen değişmez değildir. Ölçüleri, şartlar değiştirebilmektedir: – Deniz kenarında bir kg gelen şey, dağın tepesinde daha hafif gelebilir. Değişmez ölçülere ulaşmak, hiç değişmeyen koşullara sahip olmakla mümkün olacaktır, ki bu olanaksız bir durumdur. Çünkü herşey değişmektedir. Uygulamada yer ve zaman koşullarının değişmesi durumunda, ölçme sonuçlarının anlamlı farklılıklar göstermemesi yeterli görülmektedir. Standartlık derecesi de içinde bulunulan koşullara bağlı olarak değişebilmektedir. Örneğin marangozun işine yarayan bir metre, evde kullanılan termometre ile çok çok hassas ölçümlerin yapılması gereken laboratuvarlardaki metre ve termometre, hassaslık koşulları dolayısıyla tabi ki değişiklik gösterecektir. Benzer şekilde sarraf ile bakkalın terazisinin de aynı olması beklenemez. İlk çağlardan beri ölçülerin standartlaştırılması ve değişkenlikten kurtarılması üzerinde önemle durulan bir konu olmuştur. Örn., ayak ölçüsü → kralın veya kabile reisininki Bilimsel gelişmeler ile ölçümler daha önemli bir yere konmuş, ölçülerde hassasiyete verilen önem artmış her ölçme aracına yönelik standart ölçü birimleri ortaya konmuştur. Ölçme işleminde BİRİM’in kullanılması: – bu işlemi OBJEKTİF hale getirmektedir – ölçme kuralının uygulanmasına kolaylık kazandırmaktadır – ölçme hatalarını bir noktaya kadar azaltmaktadır – güvenirliği arttırmaktadır Yanı sıra, birimlerin ölçümleri eşyanın cinsine, ölçmenin yapıldığı yere ve kişiye göre çok sınırlı ölçme hataları dışında DEĞİŞMEZLİK getirdiği için iletişimi de kolaylaştırmaktadır. Birimlerin DEĞİŞMEZ ve KULLANIŞLI olması beklenmektedir. Ölçme aracının kararlı sonuçlar vermesi, aracın «güvenirlik» düzeyine işaret etmektedir. Birimler, – sınıftaki öğrenci sayısını saptamada KİŞİnin birim olması şeklinde DOĞAL birimler olabildiği gibi, – daha çok KİLOGRAM şeklinde TANIMLANMIŞ birimler olarak belirtilmektedir. ÖLÇME HATALARI 1) Ölçme hatalarının kaynağı gözleyen ya da ölçen kişi olabilmektedir. – Örn., testin uygulanması, puanlanması sırasındaki işlemlerde meydana gelen farklar ve hatalar…. 2) Hatalar, ölçme aracından dolayı olabilmektedir!! – Paralel ya da eşdeğer şekilde hazırlanmış iki testin aynı olması mümkün olamaz. – Ölçüm araçlarının ölçümleri kararlı olmayabilir. – Ölçmeyi amaçladığı niteliği yeteri kadar ölçemeyebilir. ÖLÇME HATALARI 3) Hataların bir diğer kaynağı ölçülen kişinin ölçmenin yapıldığı zamandaki özel durumudur. – Kişinin zeka/başarı ölçümü pek çok faktörden etkilenebilmektedir. – Örn., kişinin o günkü sağlık durumu, motivasyonu, morali vs ölçmeyi etkileyen faktörler arasındadır. ÖLÇME HATALARI 4) Hata kaynağı olarak ölçümün yapıldığı yer ve işlem yolları da sayılabilmektedir. – Örn., testin verildiği yerin sıcaklığı, ışığı, gürültüsü gibi faktörler, oturma düzeni, oturulan yerle ilgili koşullar vs… 5) Kişilerin nitelikler evrenine giren bütün davranışları ölçmek mümkün değildir. – Psikolojik testler hazırlanırken, bireylerin davranışlarını/niteliklerini temsil ettiği kabul edilen bir örnek ele alınır ve bu tipik davranışlar yoluyla davranışların bütününe yönelik fikir edinmeye çalışılır. – Bu nedenle ölçekte örnekleme hatası da söz konusu olabilmektedir. ÖLÇME HATALARI 6) Hatalardan bir diğeri de ölçülen özellikten kaynaklanan hatalardır. – Ölçülen özelliğin kararlı olmayışı, sürekli değişiklik göstermesi vs hataya neden olabilmektedir. →Ölçme hatalarına ilişkin oranın ve genelde hata kavramının, - ölçen kişiler ya da ölçme sonuçlarına göre, * birey hakkında karar verecek kişiler tarafından bilinmesi ve dikkate alınması, verilecek kararların geçerliği açısından önem arz etmektedir. ÖLÇME ARACINDA BULUNMASI İSTENİLEN YAPISAL NİTELİKLER 1. Ölçme aracının başlangıç noktasını gösteren «gerçek bir sıfır noktası»nın bulunması. Gerçek bir sıfır noktası, ölçülecek niteliğin hiç bulunmaması durumudur. ÖLÇME ARACINDA BULUNMASI İSTENİLEN YAPISAL NİTELİKLER Çoğu durumda ölçmede «göreli» şekilde bir sıfır noktası kabul edilmektedir ve ölçümler buna göre belirtilmektedir. – Örn., kelime hazinesi testi… 2. Birimlerin eşit olması. Örn., metre üzerinde 9 ile 10 ve 71 ile 72 arasındaki mesafe uzunluk birimi olarak aynı olmaktadır. ÖLÇME ARACINDA BULUNMASI İSTENİLEN YAPISAL NİTELİKLER 3. Oranlanabilirlik özelliği. Yani ölçek üzerinde alınan herhangi bir parçanın matematik kurallarına uygun şekilde bütüne oranlanabilmesi özelliğidir. Örn., 20 santimetre metrenin beşte biri, 50 santimetre metrenin yarısıdır gibi yargılar, matematiksel kurallara uygun gözükmektedir. ÖLÇME ARACINDA BULUNMASI İSTENİLEN YAPISAL NİTELİKLER Ancak kelime hazinesi testinden 15 puan alan birisi için, 30 puan alana göre kıyaslama yaparak birincisi için yarısı kadar biliyor demek doğru değildir. Çünkü karşılaştırmada bahsi geçen kelime hazinesinin hiç bulunmadığı anlamına gelen gerçek bir sıfır noktası bulunmamaktadır. ÖLÇME ARAÇLARININ ÇEŞİTLERİ 1. Tanıma ve Sınıflama Ölçekleri (Nominal) 2. Derecelendirme Ölçekleri (Ordinal) 3. Eşit Aralıklı Ölçekler (Interval) 4. Oranlı Ölçekler DEĞERLENDİRME Değerlendirme: – «temel öğeleri ve bir süreç olarak objektif ya da sübjektif kaynaklardan elde edilen verileri belirli ölçütlere göre yorumlayarak yargılara varmak». ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Ölçme ve değerlendirme kavramlarının sıklıkla birbirlerinin yerine kullanıldığı dikkat çekmektedir. Bu kavramların birbirinden kesin olarak ayırdedilmesi kolay değildir. Ancak bununla birlikte bazı ayırıcı niteliklerin sunulması mümkündür. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Değerlendirme kavramı, kapsam açısından daha geniştir. Ölçme ise, değerlendirme için gereken sayısal değerlere yöneliktir ve Değerlendirmenin gözlem ve veri toplama kısımlarını kapsamaktadır. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Ölçme genel olarak, bir objenin niteliğinin belirli kurallara göre sayarak, sınıflandırarak, derecelendirerek ya da birimlerle sayısal olarak ifade edilmesini kapsamaktadır. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Ölçmenin temel özelliği, sonuçların SAYISAL olarak belirtilmesidir. Değerlendirme ise ölçme sonuçlarının belirli ölçütlere göre yorumlanarak yargılara varılmasıdır. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Örneğin, – bir derste öğretmenin yazılı sınav yaparak öğrencilerine puanlar vermesi → ÖLÇME işlemi; – Öğretmenin 60 puanı baraj kabul edip, bu puandan daha düşük alanları başarısız, daha yüksek alanları ise başarılı şekilde belirlemesi → DEĞERLENDİRME işlemidir. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Ölçme, – çoğunlukla iyice tanımlanmış bir niteliğin mümkün olduğunca objektif şekilde saptanmasıyla gerçekleştirilmektedir. – Ölçmede, sonuçların ifade edilmesinde kelimelere nazaran rakamlar yer almaktadır. – Ölçmede ölçünün hassasiyeti, ölçme işi tekrarlandığı zaman ölçme sonucunun değişmemesi, ölçme aracının ölçmek üzere hazırlandığı amacını ölçme derecesi oldukça önem arz etmektedir. ÖLÇME VE DEĞERLENDİRMENİN FARKLARI Değerlendirmede ise, – Sürecin ayrılmaz bir öğesi olan «ölçüt» kişisel ve değişken bir nitelik taşımaktadır. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME Erkuş, A. (2010). Psikometrik terimlerin Türkçe karşılıklarının anlamları ile yapılan işlemlerin uyuşmazlığı. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 1(2), 72-77. Test sözcüğü, sınama anlamı TEST içerdiğinden hem bir ölçme aracı, hem bir ≠ ölçme işlemi, hem de istatistiksel analiz karşılığı kullanılmaktadır. ÖLÇEK ≠ İstatistiksel analiz karşılığı olarak ENVANTER kullanıldığında, “t-testi” gibi bir ≠ niteleyicisi bulunduğundan kolaylıkla ANKET ayırt edilebilmekte ve herhangi bir sorun yaşanmamaktadır. TEST Ancak, bir ölçme işlemi aracı anlamında ≠ kullanıldığında sorunlar yaşanmaya başlamaktadır. ÖLÇEK ≠ Bu iki anlam, ancak ve ancak, bireyin bir ENVANTER problem veya bir görev karşısında sergileyeceği ≠ sınır yeterlik (maksimum performans) için ANKET geçerlidir. TEST Birey böyle bir durumda, yapabileceğinin ≠ en fazlasını ve en iyisini birim zamanda yapmak, kendisiyle ve/veya başkalarıyla ÖLÇEK yarış halinde olmak durumundadır. ≠ ENVANTER Sınama anlamında ölçme, matematik ≠ başarı testi, 100m koşma testi anlamında ANKET doğrudur. Ancak, sınır yeterlikler dışında, bireylerin herhangi bir zorlama olmaksızın yapmakta oldukları tipik davranışların ölçülmesi de söz TEST konusudur. ≠ ÖLÇEK Tipik davranışların “test edilmesi” değil, ≠ ancak saptanması söz konusudur; bu anlamda, tipik davranışların ölçülmesi işlemi ve onları ENVANTER ölçmek için geliştirilmiş ölçme araçları için “test” sözcüğünü kullanmak doğru görünmemektedir. ≠ ANKET Örneğin kişilik, tutum gibi tipik davranışların “test edilmesi” söz konusu olamaz; “kişilik testi”, “tutum testi” vb de anlamlı değildir.  Bazı psikolojik özellikler ise, birbiriyle toplanamayan (her alt özellik için tekboyutluluk dışta tutulduğunda) alt TEST özelliklerden oluşur. ≠ ÖLÇEK  Kişilik, ilgi, dinleme stratejileri gibi özellikler ≠ de toplanamaz, ancak envanteri çıkarılabilir. ENVANTER ≠ Bu bakımdan, bu tür değişkenleri ölçen ölçme araçlarına “test” veya “ölçek” demek yerine ANKET “envanter” (dökmeç) demek daha doğru olacaktır.  “Anket” (sormaca) ise, bir anda bir bireyin birden çok özelliği hakkında bilgi toplama TEST aracıdır; toplam puan hiç mi hiç anlamlı değildir. ≠ ÖLÇEK  Bazı ölçme araçlarına “anket” denmesi, eğer ölçek ya da alt ölçeklerde belirli bir psikolojik ≠ özelliğe ilişkin toplam puan elde ediliyorsa, ENVANTER doğru değildir. ≠ ANKET Bu bakımdan, “anketlerin güvenirliği - geçerliği” gibi bir terminoloji teknik anlamda asla uygun değildir. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME  Özgüven, İ. E. (2022). Psikolojik testler. Ankara: Nobel Akademik Yayıncılık. S: 83-120.  Dağ, İ. (2005). Psikolojik test ve ölçeklerde geçerlik ve güvenirlik. 3P: Psikoloji, Psikiyatri ve Psikofarmakoloji Dergisi, 13(Ek4), 17-23. PSİKOLOJİK TEST VE ÖLÇEKLERDE GEÇERLİK VE GÜVENİRLİK, MADDE ANALİZİ KAVRAM VE TANIMLAR Psikolojik Test kavramı, Psikolojik ölçümler yapmak amacıyla oluşturulmuş Herkes tarafından standart biçimde kullanılabilecek Her türlü testi, tekniği, envanteri, soru listesini, anketi kapsamaktadır. Psikolojik testlerin yaygın olarak kabul edilen en kısa tanımı: Davranış örneklerinin standart ve objektif ölçümü olduğuna yönelik tanımdır. Burada fiziksel bir özelliğin doğrudan ölçümü söz konusu olmadığından, Psikolojik testin uyarıcılarına ya da maddelerine verilen yanıtların Kişinin zihnindeki düşünceleri, inançları, tutumları ve duyguları yansıtan davranışlar olduğu kabul edilmektedir. Özetle psikolojik test, Davranışın bir örneklemidir, Bu, standart koşullar altında elde edilmiştir, Davranış örnekleminden sayısal bilgiler sağlamanın, yani puanlamanın belirli kuralları bulunmaktadır. Psikolojik bir testin temel işlevleri, Tanı ya da sınıflama Yordama Araştırmalarda nesnel veri toplama PSİKOLOJİK TEST VE ÖLÇEKLERİN TÜRLERİ Psikolojik testleri çeşitli özellikleri bakımından sınıflamak mümkündür. Yaygın olarak kabul edilen sınıflama, «yetenek testleri» - «kişilik testleri» sınıflamasıdır. Yetenek testleri kategorisinde Zeka testleri ve özel gruplar için yetenek testleri yer alırken; Kişilik kategorisinde Kişiliği ölçen test ve ölçekler Ek olarak ilgi, tutum ve değer ölçekleri de yer almaktadır. Beyin ile davranış ilişkisini esas alan Farklı beyin işlevlerinin düzeyini ölçmeye çalışan nöropsikolojik testleri bu sınıflamada →Zeka testlerine yakın görmek mümkündür. Çünkü birçok ayrıntılı zeka testinin sağladığı alt test puanları nöropsikolojik değerlendirmelerde öteden beri en temel verileri sağlamaktadır. Kişiliği ölçen test ve ölçekler kendi aralarında ikiye ayrılabilir: Nesnel Kendini bildirim/kendini değerlendirme ya da kağıt-kalem türü Projektif testler Mürekkep lekeleri, resimler, oyun malzemeleri, sözel malzemeler Herhangi bir psikolojik test ya da ölçek bir davranış örneklemini ölçmek üzere yapılandırıldığına göre, →bu ölçmeyi sağlıklı bir biçimde yapabildiğinin kanıtlanması gerekmektedir. PSİKOLOJİK TEST VE ÖLÇEKLERİN PSİKOMETRİK ÖZELLİKLERİ Fiziksel bir özelliğin doğrudan ölçümü durumunda bile ölçme aracımızın STANDART, GEÇERLİ GÜVENİLİR bir ölçüm yaptığından emin olmak isteriz. Örn., beden ısımızı ölçmek için kullanmak istediğimiz termometrede bahsedilen bu özellikleri ararız. Dolaylı ölçümlere dayanan psikolojik testlerde aracımızın standart, geçerli ve güvenilir olması daha büyük önem kazanmaktadır. Bu sebeple test ve ölçeklerimizin psikometrik özelliklerinin uygun ölçülerde olduğunun gösterilmesi gerekmektedir. Psikolojik test ve ölçeklerin psikometrik özellikleri Standardizasyon Normlar Güvenirlik Geçerlik Kavramları temelinde incelenmektedir. STANDARDİZASYON Bir testin uygulanmasının ve puanlanmasının, testi yanıtlayan herkes için ve uygulayan her uzman için önceden standart (sabit) işlem ve ölçütlere bağlanmasıdır. STANDART/STANDARDİZE TEST Bahsedilen koşulları sağlamış olan testtir. Eğer kişileri bir testin sonuçlarına göre birbirleriyle (ya da norm grubuyla) kıyaslayacaksak, elde edilen farkın koşul farklılıklarından değil ama bizzat kişilerden kaynaklandığından emin olabilmek için, hepsinin ölçümlerini de sabit bir işlemle ve aynı koşullar altında yapmak gerekir. Bunu sağlamak için de, test geliştirenler tarafından testin kullanıcısına yönelik ayrıntılı bir yönerge oluşturulur. Tüm kullanıcılar, bu yönergede belirtilen standart koşulları sağlamaya özen göstererek ve uygulama koşullarını aynen yerine getirerek (maddelerin/uyaranların sunumunun her seferinde tamamen aynı olmasını sağlayarak) testi standart bir biçimde kullanmış olurlar. NORMLAR Karşılaştırma temeline dayalı olan testlerde normların oluşturulması standardizasyon çalışmasının önemli bir parçasıdır. Test normları, psikolojik testle ölçmeyi amaçladığımız özelliğin temsili bir örneklemde nasıl bir dağılım gösterdiğiyle ilgili bilgileri içermektedir. Bu da, o özellik açısından ortalama ya da normal performansın ne olduğunu bilmemizi ve böylece şimdiki uygulamamızda elde ettiğimiz sonucu bununla kıyaslama olanağını sağlar. Norm çalışması, testin kullanılacağı kesimi her yönden (yaş, cinsiyet, sosyo-ekonomik düzey vb) çok iyi temsil eden bir örneklem üzerinde yapılır. Örneklem seçkisiz (random) yolla, ilgili popülasyonun özelliklerini tümüyle yansıtacak biçimde oluşturulur. Seçilen örnekleme norm grubu denir. Bu gruptan elde edilen ham puanların standardize edilmiş ortalama ve standart sapma değerleri, testin daha sonraki tüm uygulamaları için ölçüt oluşturur. Psikolojik testlerin normlarında Z ya da T puanları gibi standart puanlar kullanılır. Gerektiğinde testin kesim puanı da bu değerlere dayalı olarak belirlenir. Bir testin normları genellikle belli alt gruplara göre değerler içerir: Yaş gruplarına göre Cinsiyetlere göre Sosyo-ekonomik düzeye göre Sınıfa göre vb Testin uygulandığı birey hangi alt grubun özelliklerini taşıyorsa, test puanları ilgili norm tablolarına başvurularak değerlendirilir. Diğer yandan, psikolojik testlerin normları mutlak ve kalıcı değildir, eskimeye açıktır. Zaman içinde toplumdaki davranış ve özellik normlarının değişimine bağlı olarak çağdışı kalabilirler. Örneğin bir toplum giderek daha atılgan ya da girişken oluyorsa, bu özelliği ölçen bir aracın normlarının yenilenmesi gerekecektir. Bu nedenle norm çalışmalarının makul aralıklarla yenilenmesi gerekmektedir. Ayrıca zaman içerisinde testlerin uyarıcıları/maddeleri de eskiyip çağ dışı kalabilir. Bu nedenle söz konusu norm yenileme çalışmalarında testin fiziksel ve sözel malzemeleri üzerinde de revizyon yapılması gerekebilir. GÜVENİRLİK Farklı zamanlarda ya da değişen test koşulları altında tekrar test edilen kişilerin aldıkları puanların tutarlık derecesi bir psikolojik testin güvenirliğini göstermektedir. Bir diğer deyişle, Testin her defasında aynı ölçümü yaptığının, yani o özelliği tutarlı bir biçimde ölçtüğünün gösterilmesi onun güvenirliğini oluşturur. Bir test puanının durağanlığı, tutarlığı ve dayanılabilirliği ile ilgili bilgi veren birkaç temel istatistiksel güvenirlik türü vardır: Test-tekrar test güvenirliği Eşdeğer formlar güvenirliği İki-yarım güvenirliği İç tutarlık Puanlayıcılar arası güvenirlik TEST-TEKRAR TEST GÜVENİRLİĞİ Psikolojik testin puanlarının durağanlığını anlamak için aynı gruba makul bir zaman aralığıyla iki kez uygulanması ve elde edilen puanların korelasyon katsayısının hesaplanmasına dayanmaktadır. Katsayı arttıkça testin puanlarının durağanlığını, dolayısıyla güvenirliğini gösterir. Ölçümler arası zaman aralığının ne olacağı, ölçülen özelliğin ne kadar kalıcı olduğu konusundaki kavramsallaştırmamıza dayanmalıdır. EŞDEĞER FORMLAR GÜVENİRLİĞİ Bazı testler uyaranların öğrenilmesinin tekrar uygulanmasında karıştırıcı etki yaratacak olmasından dolayı benzer uyaranlar kullanılarak birden fazla formda oluşturulurlar. Aynı grubu oluşturan bireylere, bir testin bu şekilde birbiriyle kıyaslanabilir iki ayrı formunu ayrı ayrı uygulayıp, ikisinden aldıkları puanların gösterdiği korelasyon katsayısı hesaplanmak suretiyle bulunur. Katsayı arttıkça testin uyaranlarına verilen tepkilerin tutarlı olduğu, yani testin güvenilir olduğu anlaşılır. İKİ-YARIM GÜVENİRLİĞİ YA DA İÇ TUTARLIĞI Test maddeleri üzerinde belli bir sistematiğe göre (ilk yarı/son yarı ya da tek/çift nolu maddeler gibi) karşılaştırılabilir iki yarım oluşturmak suretiyle, bu iki yarımdan alınan toplam test puanları arasında Spearman-Brown formülüyle hesaplanan güvenirlik türüne iki-yarım güvenirliği denir, testin iç tutarlığını gösterir. Testin maddeleri arasındaki tutarlığın ve buna bağlı olarak örneklenen davranışların homojenliğinin daha dakik bir göstergesi de iç tutarlık katsayısıdır. Bu da iki ayrı formülle elde edilebilmektedir. Kuder-Richardson-20 (KR-20) formülü ve daha çok bilinen Cronbach Alfa iç tutarlık katsayısıdır. Bu katsayı, testin maddelerinin olası tüm bölüntülemeleri arasındaki bir tahmine dayanır. Maddelerin testin geneliyle tutarlığını incelemek gerektiğinde de madde-test korelasyonları hesaplanmaktadır. Böylece her maddenin, kendisi testin genel puanı dışında tutulduğunda elde edilen genel puanıyla gösterdiği korelasyon elde edilerek iç tutarlıkları belirlenmiş olur. Bu işlem bir tür madde analizidir. PUANLAYICILAR ARASI GÜVENİRLİK Özellikle davranış gözlemlerine ilişkin veya belli uyaranlara verilen cevapların uzman derecelendirmelerine dayanan ölçme araçlarında uzmanlar arasındaki uzlaşma düzeyi de bir diğer güvenirlik ölçüsüdür. Eğer aynı standart ölçütleri kullanan birden fazla uzman belli bir davranış ya da cevap hakkında benzer derecelendirmeler yapabiliyorlarsa, o aracın maddelerinin tutarlı ölçüm yapabildiği, yani elde edilen puanlara güvenle dayanılabileceği anlaşılmaktadır. Bu gösterge de genellikle bir tür Ki Kare tekniği olan Kappa katsayısı ile elde edilir. Bazen de bir uzmanın bir kişinin aynı davranışlarını farklı zamanlarda derecelendirmesine dayanan bir değerlendirme aracının güvenirliği söz konusu olduğunda yine bu teknik kullanılmaktadır. GEÇERLİK Bir psikolojik testin ölçmek üzere yapılandırıldığı, bir diğer deyişle ölçmeyi amaçladığı boyutu gerçekten ölçme derecesi o testin geçerliğine işaret etmektedir. Bir takım maddelerin ya da uyaranların bir araya getirilmesiyle oluşturulan ve psikolojik test adı verilen bir aracın her durumda birşeyler ölçtüğü, bir takım puanlar ortaya çıkardığı kesindir. Ancak, bu araçtan elde edilen puanların, gerçekten ölçmeyi amaçladığımız ya da testin ölçtüğünü iddia ettiği boyutu ya da değişkeni gösterdiği kuşkuludur. Bunu hem kendimize hem de testi kullanacak diğerlerine kanıtlamanın yolu testin geçerliğini uygun tekniklerle göstermektir. Testin geçerli olması güvenilir olması kadar önemli bir diğer psikometrik özelliğidir. Psikolojik testlerin farklı amaçlara dönük olarak farklı bir takım geçerliklerinden söz edilebilir: Görünümü Kapsamı Kavramsal yapısı Dışsal ölçütlerle ilişkisi GÖRÜNÜM GEÇERLİĞİ Bu geçerlik türü, bir psikolojik test ya da ölçeğin, uygulanan kişi tarafından bakıldığında neyi ölçer göründüğüyle ilgilidir. Bir diğer deyişle testin o kişiye uygun görünüp görünmediğiyle ilgilidir. Bir insana psikolojik bir test ya da ölçek uygulamadan önce, işbirliği göstermesini sağlayabilmek ve iznini alabilmek için bununla neyi anlamaya çalıştığımıza dair bir açıklama (sözel olarak ve/veya testin yönergesiyle) getirmemiz gerekir. Kişinin, testte karşılaştığı uyaran, görev ya da maddelerin bir şekilde kendisine söylenen şeyi ölçtüğüne ikna olması gerekir. Aksi takdirde iyi bir işbirliği gösterip içtenlikle yanıtlar vermesi beklenemez. İşte bir testin görünüm geçerliğinin bulunması, uygulanan kişiden o sırada bu tür bir geçer not almasına bağlıdır. Bu yüzden yeni geliştirilen bir psikolojik ölçme aracının temsili bir pilot örneklemde bireylere uygulanıp, ardından tek tek izlenimlerinin alınması yoluyla testin görünüm geçerliğinin olup olmadığı kontrol edilir. Gerektiğinde görünüm geçerliği sağlanıncaya kadar da üzerinde çalışılarak uygulamaya hazır hale getirilir. Bununla birlikte pek çok psikolojik test ve ölçeğin yönergesinde, uygulanan kişinin sosyal beğeniye uygun (yani, testi uygulayanın istediği sanılan türden) yanıtlar vermesinin önüne geçmek için, testin neyi ölçmeyi amaçladığı çok net ifade edilmez ve genel doğru ifadelerle geçiştirilir. Örneğin herhangi bir kişilik ölçeğinin yönergesinde «bu ölçek insanların nasıl düşünüp hissettiklerini ve nasıl davrandıklarını ölçmeyi amaçlamaktadır» türünden genel bir ifade görünüm geçerliği açısından yeterli bir işlev görebilir. KAPSAM GEÇERLİĞİ Ölçülmesi hedeflenen davranış alanının temsil edici bir örneklemesinin testin maddelerince sağlanıp sağlanmadığının bir göstergesidir. Bir diğer deyişle, o davranış alanının evreninde olan özellik ve davranışlar, ağırlıklarına uygun olarak testin maddelerine yansımalıdır. Örneğin bir zeka testinde, zekanın bilinen tüm boyutlarının ölçülmesine yarayacak görev ve maddelerden ağırlıklarınca bulunması beklenir. Bunu sağlamak için rasyonel yöntem kullanılır. Yani testi geliştiren dahil, konunun uzmanlarının görüşü alınarak o testin kapsamının yeterliği sorgulanır. Gerektiğinde birkaç aşamada olası eksiklik ve yanlışlıklar giderilerek testin kapsam geçerliği garantiye alınır ve uygulanmaya hazır hale getirilir. Örneğin, uygulanan bir eğitimin sonunda yapılacak başarı testinin içeriği, eğitimde belli ağırlıklarla kapsanan konuların teste de aynı ağırlıklarla yansıtılması yoluyla belirlenir. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME Ö Z G Ü V E N , İ. E. ( 2 0 2 2 ). P S İ KO LO J İ K T E S T L E R. A N K A R A : N O B E L A K A D E M İ K YAY I N C I L I K. S : 8 3 - 1 2 0. D A Ğ , İ. ( 2 0 0 5 ). P S İ KO LOJ İ K T E S T V E Ö L Ç E K L E R D E G E Ç E R L İ K V E G Ü V E N İ R L İ K. 3 P : P S İ KO LO J İ , P S İ K İ YAT R İ V E P S İ KO FA R M A KO LOJ İ D E R G İ S İ , 1 3 ( E K 4 ) , 1 7 - 2 3. PSİKOLOJİK TEST VE ÖLÇEKLERDE GEÇERLİK VE GÜVENİRLİK, MADDE ANALİZİ - DEVAM YAPI GEÇERLİĞİ Psikolojik test ya da ölçeğin kuramsal bir yapıyı, boyutu, özelliği ne derecede temsil ettiğiyle, Bir diğer deyişle, yeterince ölçtüğünün gösterilmesiyle ilgilidir. Ölçeğin bir yapıyı yeterince temsil edebilmesi ise maddelerinin birbirleriyle tutarlı, yani aynı yönde ölçüm yapabilmesi, Yani homojen olması demektir. Bu tanım alt boyut/alt test/alt ölçekler için de geçerlidir. Her birinin kendi içinde homojen ve tutarlı olması gerekir. Geçerliğin yaygın olarak bilinen «testin ölçmeyi amaçladığı şeyi gerçekten ölçüp ölçmediği» şeklindeki tanımında ifade edilen, bu yapı geçerliğidir. Örn., zeka testi olarak oluşturduğumuz araç gerçekten zekayı ölçmekte midir? Yapı geçerliğini göstermenin dört farklı ana yolu bulunmaktadır: 1) Faktör analizi 2) İç tutarlık incelemesi 3) Diğer kavramlarla ilişkilerin incelenmesi 4) Deneysel yöntem 1) FAKTÖR ANALİZİ Bu teknik, test ya da ölçek maddelerinin puanlarının birbirleriyle gösterdikleri korelasyonlara dayanmaktadır. 1) FAKTÖR ANALİZİ Böylece maddelerin, test oluşturulurken rasyonel ve kuramsal olarak beklenen yapıyı/boyutu ve alt yapıları/alt boyutları ortaya çıkarıp çıkarmadığı incelenmektedir. 1) FAKTÖR ANALİZİ Eğer veriler, öngörülen yapıyı sağlıyorsa, testin yapı/kavramsal geçerliğinin bulunduğu söylenebilir. 2) İÇ TUTARLIK İNCELEMESİ Güvenirlik kavramında bahsedilen iç tutarlık, test maddelerinin kendi aralarındaki tutarlığı ve homojenliği göstermekte, bu nedenle güvenirlik göstergesi olmaktadır. 2) İÇ TUTARLIK İNCELEMESİ Bu gösterge, tanımı gereği bir test ya da ölçeğin aynı zamanda yapı geçerliğinin de bir göstergesidir. Çünkü, testin ya da alt testin yapısında bir tutarlık ve homojenlik olması aranır. 2) İÇ TUTARLIK İNCELEMESİ İşte bu nedenle iç tutarlık incelemesiyle testin güvenirliğine ek olarak yapı geçerliğine de ilişkin bilgi sağlamaktadır. 2) İÇ TUTARLIK İNCELEMESİ İç tutarlık incelemesine yönelik güvenirlik kısmında anlatılanların yanında izlenebilecek bir diğer yol ZIT GRUPLAR TEKNİĞİDİR. 2) İÇ TUTARLIK İNCELEMESİ Bu teknikle her maddenin, tüm test puanları yönünden en yüksek ve en düşük puanları almış iki uç gruba giren bireyleri istatistiksel olarak birbirinden ayırdetme gücü incelenir. 2) İÇ TUTARLIK İNCELEMESİ Bu ayırdetmeyi başaramayan maddelerin yeniden düzenlenerek test edilmesi ya da tümüyle testten çıkarılması yoluyla testin iç tutarlığı artırılabilmektedir. 3) DİĞER KAVRAMLARLA İLİŞKİLERİN İNCELENMESİ Herhangi bir psikolojik test ya da ölçek belli bir kavramsal boyutu ölçmek amacıyla oluşturulmuştur. Ancak bu kavram, büyük olasılıkla başka bazı kavramlarla belli yakınlıklar, diğerleriyle ise belli uzaklıklar göstermektedir. 3) DİĞER KAVRAMLARLA İLİŞKİLERİN İNCELENMESİ Yani anlamsal yönden «komşu» ve «komşu olmayan» kavramlar bulunmaktadır. 3) DİĞER KAVRAMLARLA İLİŞKİLERİN İNCELENMESİ Eğer şimdiki testin ölçmeyi amaçladığı boyuta yakın olan bazı kavramlar varsa ve bunları ölçmek amacıyla daha önceden geliştirilmiş (ve psikometrik tüm özellikleri kanıtlanmış) testler varsa, Aynı gruba hem yeni geliştirilen testin hem de bu komşu testin uygulanması suretiyle, görgül verilerde beklenen korelasyonların gösterilmesi, yani testin yapı geçerliği için bir diğer gösterge olabilir. Buna birleşen geçerlik de denilmektedir. 3) DİĞER KAVRAMLARLA İLİŞKİLERİN İNCELENMESİ Ancak elde edilen bu korelasyonların tesadüfi olmadığının kanıtlanabilmesi için, komşu olmayan kavramları ölçen bir başka test de aynı gruba uygulanmalı ve yeni testle bunun puanları arasında sıfıra yakın korelasyon değerlerinin saptandığı da gösterilebilmelidir. Buna ise ayırdedici geçerlik denilmektedir. 3) DİĞER KAVRAMLARLA İLİŞKİLERİN İNCELENMESİ Böylece, yeni bir testin yapı geçerliğini diğer kavramlarla ilişkileri temelinde kanıtlayabilmek için, Birleşen ve ayırdedici geçerliklerinin gösterilebilmesi gerekmektedir. 4) DENEYSEL YÖNTEM Bir testin yapı geçerliğini gösterebilmek için, test puanları üzerinde kuramsal olarak etkili olması beklenen bazı değişkenler üzerinde deneysel olarak yapılacak bir değişimleme ile, test puanlarının bağımlı değişken olarak değişip değişmediğinin incelenmesi de bir diğer yol olabilmektedir. 4) DENEYSEL YÖNTEM Yapılacak değişimleme sonunda test puanlarında beklenen yönde anlamlı bir farklılaşma gözlendiğinde, testin yapı geçerliğinin bulunduğuna hükmedilebilir. 4) DENEYSEL YÖNTEM Örneğin, «strese dayanma gücünü» ölçmeyi amaçlayan bir test için, Deneysel ortamda farklı düzeylerde stres yaratılması yoluyla test puanlarının gösterebileceği olası anlamlı değişimler bu tür bir gösterge olabilir. ÖLÇÜT BAĞLANTILI GEÇERLİK Bu geçerlik türü, bir testin geçerliğine ilişkin yapılabilecek son temel incelemedir. ÖLÇÜT BAĞLANTILI GEÇERLİK Yeni oluşturulan ve oluşturulurken görünüm ve kapsam geçerliği sağlanmış, ardından da görgül verilere dayalı olarak yapı geçerliği gösterilmiş bir test, Tamamen kendi dışındaki ölçütlerle kontrol edildiğinde de acaba doğru ölçüm yapıyor mu? ÖLÇÜT BAĞLANTILI GEÇERLİK Genellikle ortaya konan yeni test ve ölçekler, eski bir takım örneklerine alternatif olmak, onların zayıf görülen yönlerini gidermek amacıyla yapılmaktadır. İşte bu durumda yeni testin eski testle (yani bir dış ölçütle) ne ölçüde örtüşen bir ölçüm yaptığının gösterilmesi de gerekir. ÖLÇÜT BAĞLANTILI GEÇERLİK Bu hem son bir kanıtlama olacak hem de önceki testin kullanıcılarının artık yeni testi tercih etmelerinin daha doğru olacağına ikna olmaları için bir gösterge olacaktır. ÖLÇÜT BAĞLANTILI GEÇERLİK Bazen eş zamanlı geçerlik, bazen de benzer ölçekler geçerliği olarak anılabilen ölçüt bağlantılı geçerliğin gösterilebilmesi için, Eski ve yeni testin aynı gruba uygulanması ve bireylerin her iki test puanlarının gösterdiği korelasyonun hesaplanması gerekmektedir. ÖLÇÜT BAĞLANTILI GEÇERLİK Burada makul yükseklikte bir korelasyonun gösterilebilmesi gerekmektedir. ÖLÇÜT BAĞLANTILI GEÇERLİK Örn., yeni bir depresyon ölçeğinin puanlarının, önceden beri kullanılan psikometrik özellikleri kanıtlanmış bir diğer depresyon ölçeği puanları ile bu tür yüksek korelasyonunun bulunduğunun gösterilmesi ile yeni ölçeğin ölçüt bağlantılı geçerliğe sahip olduğu savunulabilir. ÖLÇÜT BAĞLANTILI GEÇERLİK Ancak, yeni test eğer ölçtüğü kavramsal boyutu ölçmek üzere geliştirilmiş alanındaki ilk test ise böyle ilave bir geçerlik incelemesi yapabilmek için başka dış ölçütler olması gerekir. ÖLÇÜT BAĞLANTILI GEÇERLİK Bu geçerlik türünün iki farklı varyasyonu vardır. Bunlardan ilki, ölçüt olan önceki testle yapılmış bir grup ayrımının yeni testle de yapılabildiğinin gösterilmesine dayalıdır. ÖLÇÜT BAĞLANTILI GEÇERLİK Örn., önceki testle «depresyonlu» ve «depresyonsuz» gruplar ayrılmış ise, ilk grubun yeni testten elde edecekleri ortalama puanın anlamlı olarak daha yüksek olduğunun gösterilmesi gerekmektedir. ÖLÇÜT BAĞLANTILI GEÇERLİK Bu örnekte yer verildiği gibi daha önceki bir test yerine bazı durumlarda bu ölçüt bir test olmayabilir. Bunun yerine somut bazı esaslara dayalı olarak yapılmış bir ayrım olabilir; örn. önceden konulmuş depresyon tanısı gibi. ÖLÇÜT BAĞLANTILI GEÇERLİK İkinci varyasyonunda ise, yeni testten alınan puanların, bu testin ölçtüğü değişkenle doğrudan ilgili olduğu kavramsallaştırılan bir başka değişkeni yordayabilmesi esastır. ÖLÇÜT BAĞLANTILI GEÇERLİK Yordayıcı geçerlik olarak adlandırılan bu ölçüt bağlantılı geçerlik türünde yeni test puanları, bireyler üzerinde daha önceden yapılmış sınıflamaya tutarlı bir sonuç gösterir. ÖLÇÜT BAĞLANTILI GEÇERLİK Örn., öğrenci seçme sınavı puanlarının, birkaç yıl sonra bu öğrencilerin okul başarı ortalama puanlarını anlamlı korelasyon göstererek yordaması beklenir. ÖLÇÜT BAĞLANTILI GEÇERLİK Veya örn. yeni depresyon ölçeğinden alınacak en az şu kadar puan (kesme puanı) o kişinin depresyon tanısı almış grupta olmasını yordayacaktır. Geçerlikle ilgili bahsedilmesi gereken son iki önemli kavram daha bulunmaktadır: → Çapraz geçerleme → Artan geçerlik ÇAPRAZ GEÇERLİK Bir testin standardizasyon örneklemi üzerinde geçerliği sağlandıktan sonra, bu geçerliğin sonradan yeni örneklemler üzerinde yapılacak uygulamalarla da gösterilebilmesidir. ÇAPRAZ GEÇERLİK Bu sayede önceki çalışmada gösterilen geçerliğin, farkında olmadan yapılmış olabilecek sistematik bir hata sonucunda olmadığı, yani tekrarlanabildiği anlaşılmaktadır. ARTAN GEÇERLİK Bu ise, ölçüt bağlantılı geçerlik kısmında bahsedildiği gibi, yeni ölçeğin ölçtüğü boyutu daha önceden ölçen ölçeklerin geçerliğinin üstüne yeni ölçeğin ne kadar bir artış veya avantaj sağladığıdır. ARTAN GEÇERLİK Örn., önceki depresyon ölçeğinin.80’lik bir geçerlik rakamı yerine yeni ölçekten elde edilecek.90’lık bir değer, geçerlikte.10’luk bir artışı ifade edecektir. Bir diğer deyişle artan geçerlik.10 olacaktır. MADDE ANALİZİ Madde analizinin temel amacı, → Testi geliştirmek, testteki etkili olmayan soruları çıkarmak veya revizyondan geçirmektir. MADDE ANALİZİ Yani madde analizi, test geliştirme sürecinin önemli bir kısmını oluşturur ve profesyonel bir işlem yolu izlenerek yapılır. Test geliştirmede sorular, içerik ve soru yazma kurallarına uygun olup olmaması gibi ölçütler yönünden değerlendirilebilir. MADDE ANALİZİ Madde analizi, maddelerin istatistiksel nitelikleri yönünden kantitatif bir analizdir. Kantitatif analiz, test maddelerinin «güçlük dereceleri» ile «maddelerin ayırdetme güçlerinin» incelenmesini kapsar. Testin «geçerlik ve güvenirlik» dereceleri temelde onu oluşturan maddelerin kalitesine ve niteliğine bağlıdır. MADDE ANALİZİ Testin geçerlik ve güvenirliği madde analizi yapılıp iyi sorular seçilerek daha başlangıçta büyük ölçüde garanti altına alınabilir. Test, madde analizi sonuçlarına göre maddeler seçilerek, revizyondan geçilerek veya değiştirilerek geliştirilebilir. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME OKULLARDA ÖĞRENCİ GELİŞİMİNİN DEĞERLENDİRİLMESİ Eğitimde psikolojik testleri kullanmanın genel amacı, Öğrencileri «tanıma» Öğrencilerin «gelişimlerini» izleme Eğitim programlarını «değerlendirme» olarak nitelendirilebilir. Bireyleri Tanıma Okuldaki ölçme ve değerlendirmenin «öğrencileri tanıma» işlevi, Eğitim öğretim faaliyetlerinin başında ve Bu faaliyetler devam ederken mevcuttur. →Bireyin tanınması, →Etkili bir öğretim ile psikolojik danışma ve rehberlik hizmeti için gereklidir. Bireyin tanınması şu konularda önemli rol oynamaktadır: Öğrenci gelişiminin hızlandırılması Öğrenim faaliyetlerinin planlanmasının daha verimli hale getirilmesi Eğitim ve öğretimi engelleyen kişisel problemlerin ortadan kaldırılması Öğretmenin, öğrencileri bireysel yetenek, beceri ve ilgilerine göre yönlendirmesi Bireylerin Gelişimlerini Değerlendirme Öğrencilerin eğitim ve öğretim ile istenilen davranışlara ne derece ulaştıklarının ve Bu alandaki gelişim derecelerinin saptanması → Ancak belirli bir öğrenme süresi sonunda mümkün olur. Bireylerin Gelişimlerini Değerlendirme Gelişimin gözlenebilmesi için – Bir öğrencinin başlangıç ya da girişteki öğrenim durumu tespit edildikten sonra belirli bir öğrenim süresinin geçmesi ve – Tekrar öğrenci gelişiminin saptanması gereklidir. Bireylerin Gelişimlerini Değerlendirme «Gelişim» belirli bir süre içinde kişinin, sürenin başındaki durumuna göre süre sonunda gösterdiği artış farkıdır. Gelişim tespitinde bir öğrencinin belirli bir nitelik yönünden en az iki kez ölçülmesi ya da gözlenmesi gerekir. Bireylerin Gelişimlerini Değerlendirme Öğrenme süreci içinde herhangi bir noktada psikolojik testler, diğer araç ve yöntemlerle öğrencinin gelişim durumu da tespit edilebilir. Bu gelişimin yeterli olup olmadığı konusu bir değerlendirme sürecini zorunlu kılmaktadır. Yeterlik derecesinin saptanması, bir ölçüte veya ölçütler takımına göre yapılmaktadır. Eğitimde Öğrencilerin Bireysel Başarılarını Değerlendirmede Kullanılan Ölçütler 1) Öğrencinin bulunduğu eğitim-öğretim düzeyi için saptanan genel hedefler ve istenen davranışlar. 2) Öğrencinin içinde bulunduğu sınıf veya grubun genel başarı derecesi. 3) Öğrenilmesi gereken konuların tümü. 4) Ülke düzeyinde veya yerel düzeyde geliştirilen başarı normları. 5) Öğretmenlerin ve ilgili uzmanların kanıları. 6) Öğrencinin kendi yetenek düzeyi. 7) Öğrencinin eğitim programına girişteki başarı düzeyi. 8) Öğrencinin sosyo-ekonomik düzeyi, içinde bulunduğu koşullar ve olanaklar. Bu Ölçütler, Ölçme ve değerlendirmenin özel amacına, Öğretmenin bu ölçütler hakkındaki kişisel görüşüne, Öğrencinin izleyeceği öğretim programının niteliğine, Kurumlarca saptanan standartlara göre →Biri, birkaçı bir arada ya da hepsi bir arada →Öğrenci gelişiminin yeterlilik derecesi hakkında yapılacak değerlendirmelerde ve bir yargıya ve sonuca varmada kullanılabilir. Eğitim Programlarını Değerlendirme Okuldaki eğitim ve öğretim faaliyetleri, – 1) hedeflerin ve davranışların saptanması, – 2) öğretim konularının, araç ve yöntemlerinin planlanması, – 3) öğretimin yapılması, – 4) öğrencilerin saptanan hedef davranışlara ulaşıp ulaşmadıklarının araştırılması gibi dört temel başlık içinde dönen bir halka gibi düşünülebilir. → Bu süreç içinde «değerlendirme» son basamakta yer alır. Eğitim Programlarını Değerlendirme Değerlendirmenin bu döngüdeki işlevi, öğrencilerin belirlenen amaçlara ne derecede ulaştıklarını saptamaktır. Değerlendirme sonuçlarına göre bir öğretmen kendi öğretiminin ne derece etkili olduğunu görebilir. Bir okulun, bütün öğretim ve eğitim faaliyetleri için ölçüt olarak kabul edilen hedeflere göre öğrenciler üzerindeki «etkisi» ve «yeterlik derecesi» de ortaya konabilir. Belirli koşullarda, hedeflerin «ulaşılabilirlik» düzeyi hakkında da bilgi verir. Eğitim Programlarını Değerlendirme Öğretmen ve eğitim öğretimle ilgilenen kişiler değerlendirme sonuçlarına göre öğretim faaliyetlerini yeniden gözden geçirerek daha etkili olacak şekilde düzenlerler. Bu arada ölçüt olarak kullanılan hedeflerin gerçekçi olup olmadığı anlaşılır ve hedefler revizyondan geçirilebilir. Değerlendirmenin Nitelikleri 1) Değerlendirmede öğrenci davranışları hakkında bilgi toplamaya yarayan her çeşit araç ve tekniklerden yararlanılır. 2) Değerlendirme birinci derecede bireylerin davranışlarında meydana gelen değişme ve gelişim ile ilgilenir (ölçüt-kendi yetenek seviyesi). 3) Değerlendirme, öğrenme ve öğretme faaliyetlerinin ayrılmaz bir aşaması olarak sürekli bir iştir. 4) Değerlendirmede objektif ölçme araçlar kadar sübjektif ve betimsel yöntemlerden de yararlanılır. 5) Değerlendirme bütüncül bir yaklaşımdır, bireyin tüm özelliklerini kapsar. 6) Değerlendirme öğrencilerin, ailelerin, öğretmenlerin ve danışmanların işbirliğini gerektiren bir iştir. Öğrencilerin Kendilerini Değerlendirmeleri Öğrencilerin kendilerini değerlendirmeleri, öğretmenlerle çeşitli konularda işbirliği yapmaları ile sağlanabilmektedir: 1) Programın hedeflerinin saptanması 2) İstenilen hedeflere ulaşmada gerekli faaliyetlerin planlanması 3) Öğrencilerin bu hedeflere göre kendi gelişmişlik durumlarının saptanması 4) Öğrencilerin gelişimlerini saptarken güvenilir bilgilerin toplanması Öğrencilerin Kendilerini Değerlendirmeleri Ölçmenin ve psikolojik testlerin en büyük faydası: – Öğretime yön verme – Öğrencilerin tek tek karşılaştıkları güçlükleri teşhis etme Ayrıca soru fişleri, kontrol listeleri, çeşitli sosyometrik teknikler gibi ölçme araçları da öğretmenler için fayda sağlamaktadır. Eğitim Programlarının Değerlendirilmesi Programın değerlendirilmesi bir yöntem olarak, öğrencilerin okuldaki gelişimini ortaya koyabilecek bilgiler toplamayı ve bu bilgileri yorumlamayı gerektirir. Değerlendirme öğrencilere test uygulamaktan daha ileri bir kavramdır. Bireylerde beklenen davranış değişiklikleri okul içi ve okul dışı öğrencilerin hayattaki aşamalarından etkilenir. Bir Değerlendirme Programında Cevaplandırılması Gereken Temel Sorular: Eğitim planlanan hedeflerine ulaşabilir mi? Kullanılan araç-gereçler ve öğretim metotları yeterli ve verimli midir? Verilen eğitim hedeflerine ne dereceye kadar ulaşılabilmiştir? Öğrencilerin davranışlarında gözlenen değişiklikler yeterli midir? Eğitim Programlarının Değerlendirilmesi Her okulun değerlendirme programı o okulun doğasına uygun olmalıdır. – (okulun öğrencileri, öğretmenleri, okulun olanakları, okulun içinde bulunduğu çevre koşulları, aile nitelikleri → ayrı birer birim olarak düşünülmeli). Değerlendirme bir amaç değil, eğitimi ve öğretimi geliştirmek için bir araçtır. Program Değerlendirmesinin Yararları Sadece eğitim öğretimin saptanan hedeflerine ne derece ulaşılabildiğinin araştırılmasına hizmet etmez. – 1) değerlendirme süreci içinde öğretim faaliyetlerinin analiz edilmesi, – Varılacak hedeflerin açıklanması, – Onların gözlenebilir bir hale getirilmesi nedeni ile, → öğretmen, öğrenci ve idarecilere hedeflerin açık hale gelmesi ve bunlara ulaşmada yardımcı olur. Program Değerlendirmesinin Yararları 2) Öğrencilere, duygusal, eğitsel ve mesleki rehberlik ve psikolojik danışma yapmak için gerekli bilgiler sağlanmış olur. 3) Okuldaki eğitim ve öğretim faaliyetlerinin bir sonucu olarak öğrencilerde görülen gelişimin gözlenmesi, öğretmen ve öğrencilerde kendilerine güven duygusu yaratır. →Sonucun yetersiz olması halinde, yeni düzenlemeler, planlar yapma olanağı verir. 4) Değerlendirme faaliyetleri ve değerlendirme sonuçlarının duyurulması, okulun çevre ve velilerle olan ilişkilerini geliştirir ve okulu destekleme eğilimlerini artırır. Okul eğitim ve öğretim faaliyetlerinin değerlendirilmesinde TEMEL ÖLÇÜT → eğitimin bireylere kazandırmayı amaçladığı hedeflerdir. BU AMAÇLAR: – Türk Milli Eğitimi’nin Amaçları şeklinde genel amaçlar – İlköğretimin, Ortaöğretimin amaçları gibi belirli bir öğrenim kademesi için belirlenen amaçlar – Belirli bir öğrenim düzeyinde okutulan dersin amaçları – Belirli bir üniversitenin davranışsal hedefleri Gelişmeyi Değerlendirmede Ölçülmesi Gereken Nitelikler Eğitim programının uygulanması sonucu davranışlarda meydana gelen BİLİŞSEL ve ZİHİNSEL değişmelerin çoğu sözlü, yazılı ve objektif testler gibi tekniklerle ölçülebilir. Eğitim sisteminde geleneksel olarak bilişsel becerilere ağırlık verilmektedir. Zihinsel ve bilişsel beceriler önemlidir, ancak EĞİTİM HEDEFLERİ SADECE BUNLAR DEĞİLDİR. Gelişmeyi Değerlendirmede Ölçülmesi Gereken Nitelikler Eğitim hedefleri içinde önemli bir yer tutan beceriler, kişisel ve sosyal gelişmeye ilişkin tutum ve davranışları → yazılı sınavlar ve testlerle değerlendirmek çok zor, birçok halde de olanaksızdır. Testlerle Ölçülemeyen Hedefler 1) Beceriler – Konuşma, yazma, dinleme, sesli okuma, laboratuar deneyleri yapma, resim yapma, bir müzik aleti çalma, oynama, beden eğitimi hareketleri yapma, ders çalışma alışkanlıkları, iş yapma alışkanlıkları, sosyal ilişki kurma becerileri, psiko- motor davranış ve beceriler Testlerle Ölçülemeyen Hedefler 2) İş yapma alışkanlıkları – Planlama becerileri, zamanı kullanma, araçları kullanma, malzeme kullanma, işle ilgili kişisel nitelikler, girişimci olma, yaratıcı, sabırlı, güvenilir olma. Testlerle Ölçülemeyen Hedefler 3) Sosyal tavırları – Başkalarının mutluluğunu düşünme ve katkıda bulunma, kanunlara, kurallara saygı, başkasının ve devletin malına canına saygı, sosyal problemlerle ilgi derecesi, sosyal kurumlara katkısı, sosyal gelişmeyle ilgili işler yapma isteği. Testlerle Ölçülemeyen Hedefler 4) Bilimsel tavırları – Açık fikirli olması, yargıları değişmeye açık tutması, sebep sonuç ilişkilerine karşı dikkatli ve hassas olması, olayların nedenini araştırmaya istekli olması. Testlerle Ölçülemeyen Hedefler 5) İlgileri – Eğitsel, mekanik, estetik, bilimsel, sosyal, boş zaman faaliyetleri ve meslek alanlarına ait ifade ettiği duyguları ve tercihleri Testlerle Ölçülemeyen Hedefler 6) Değer yargıları – Doğa, müzik, sanat, edebiyat, fiziki beceriler ve sosyal yönden bu alanlarda varolan eserleri değerli tutma, koruma, hoşlanma ve doyum sağlama yönünden ifade edilen duygular. Testlerle Ölçülemeyen Hedefler 7) Uyumu – Arkadaşları ile ilişkileri, methetme ve eleştirme durumlarında gösterdiği tepkiler, otoriteye karşı olan tutumu, duygusal kararlılık, kişisel ve sosyal uyumu vb Testlerle Ölçülemeyen Hedefler Değerlendirme testler önemli araçlardır. Ancak testlerle ölçülemeyen alanlarda bilgi toplama amacı ile – Derecelendirme ölçekleri, öğrenci davranışlarını kayıt dosyaları, ilgi ve kişilik envanterleri, soru listeleri, otobiyografiler, sosyogramlar, gözlem tekniklerinden yararlanılmalıdır. → Değerlendirme programında testler ile objektif ve sübjektif her türlü araç ve tekniklerden faydalanılmalıdır. Değerlendirmede Bilgi Kaynakları ve Araçları Kişinin – Bilişsel nitelikleri – Kişisel ve sosyal davranışları hakkında bilgi toplamak için Çeşitli bilgi kaynaklarından, araç ve tekniklerden yararlanılabilir. Değerlendirmede Bilgi Kaynakları ve Araçları 1) Kişinin kendisi – Kişiye doğrudan doğruya kendisi hakkında sorular sorarak değerlendirme yapmak. Örn., kendini anlatma teknikleri, ilgi, kişilik ve tutum envanterleri vb 2) Kişiyi bilenler – Kişiyi yakın ilişkisi olan arkadaşlarından ve tanıyanlardan sorarak gözlemlerini değerlendirmek. Örn., sosyal ilişkilerin değerlendirilmesi gibi. Değerlendirmede Bilgi Kaynakları ve Araçları 3) Psikolojik testler – Standart uyarıcılara karşı bireyin tepkilerini saptamak – Örn., yetenek, başarı testleri ile kişilik, ilgi ve tutum envanterleri ve teknikleri 4) Durumsal testler – Bir durum oluşturarak, bireyin bu durum içinde ne şekilde davrandığının gözlenmesi. – Örn., karakter ve ahlaki niteliklerinin yoklanması gibi. Değerlendirmede Bilgi Kaynakları ve Araçları 5) İşlemyolu – Kişi davranışta bulunurken, performansını gözlemek ve davranışını ve davranışa ait işlem yollarını betimlemek veya davranışları hakkında yargılara varmak. – Örn., bireyin konuşma esnasında ya da bir müzik parçasının çalınması ya da bir deneyin yapılması sırasında değerlendirilmesi gibi. 6) Ürün – Kişinin yaptığı bir işin sonunda meydana getirdiği ürünün kalitesini belirli standartlara ve ölçütlere göre değerlendirmek. – Örn., el yazısının, bir masa veya elbisenin değerlendirilmesi gibi. Değerlendirme Programının Hazırlanması Hedeflerin belirlenmesi Hedeflerin ölçülebilir davranışlar halinde ifadesi Hedeflerin kapsam boyutunun saptanması Test maddelerinin hazırlanması Genel amaç bütün öğrencilerin programın amaçlarına ulaşması ise de Öğrenciler arasında görülen bireysel farklar dikkate alınınca, Asıl ÖNEMLİ olanın her öğrencinin öğrenim süresi içinde başlangıçtaki durumuna göre süre sonunda ulaşabildiği gelişim olduğu anlaşılır. Sürekli bir süreç olan değerlendirme programları Öğrencilerin mevcut durumları üzerinde durmak yerine, Onların eğitim amaçları doğrultusundaki gelişimlerini önemli sayar. BAŞARI TESTLERİ BAŞARI TESTLERİ Maksimum performans testleri – Yetenek testleri – Başarı testleri →Başarı testleri, belirli bir ders veya programdan bireylerin ne derecede yararlandıklarını göstermesi bakımından yetenek testlerinden ayrılır. →Çünkü yetenek testlerinin, belirli bir öğrenimi gerektirmeyen çok çeşitli zihin becerilerine ilişkin sorulardan hazırlanması istenmektedir. BAŞARI TESTLERİ Günümüzde başarı testleri, bireylerin akademik öz geçmişlerinden ne derecede yararlandıklarını göstermesi bakımından başarıların değerlendirilmesi amacı ile kullanıldığı gibi Bireylerin gelecekteki başarılarını yordama amacı ile de kullanılmaktadır. BAŞARI TESTLERİ Başarı testleri, psikolojik testler arasında en yaygın olarak kullanılan testlerdir. – Çeşitli eğitim programlarında okutulan ders konularına ilişkin öğretmenler tarafından hazırlanan başarı testleri – Uzmanlar tarafından hazırlanan standart başarı testleri Başarı Testlerinde Kullanılan Soru Türleri Başarı testlerinde, eğitim hedeflerini ya da bireyin niteliklerini ölçmek amacı ile çok çeşitli soru türlerinden yararlanılmaktadır. – Yazılı (yazmalı soru) – Kısa cevaplı (yazmalı soru) – Tamamlamalı (yazmalı soru) – Eşleştirmeli (işaretlemeli soru) – Doğru-yanlış (işaretlemeli soru) – Çoktan seçmeli (işaretlemeli soru) Testin Düzenlenmesi Testin Açıklaması Testin Uzunluğu Soruların Düzenlenmesi Cevap Kağıdı →Testin Uygulanması →Testlerin Puanlanması Başarı Testlerinin Türleri Başarı testleri – Hazırlanış şekline, – Testin amacına, – Testin yapısına göre *Öğretmen Yapısı Testler – Standart Testler *Başarı Testleri *Genel Başarı Testleri *Teşhis Testleri gibi birkaç tür içinde incelenmektedir. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 1) *Standart başarı testleri içerik olarak ülke çapında okullarda yaygın olan ortak ders konularını ya da bilgilerini kapsar. *Öğretmen yapısı testler, bir öğretmenin kendi sınıfında okuttuğu dersin özelliklerini taşır, sınıfına özgü bilgi ve becerileri kapsar. →Öğretmenden öğretmene değişkenlik gösterir. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 2) *Standart testler daha genel bilgi ve becerilere ilişkin sorulardan oluşur. → Bu nedenle, belli bir konu ya da beceriye ilişkin ayrıntıya inen soru sayısı azdır. * Öğretmen yapısı testler ise belli ve sınırlı bir konuda soruları kapsayabilir. → O zaman belli bir konuya düşen soru sayısı daha fazla olabilir. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 3) *Standart başarı testleri uzman kişiler tarafından hazırlanır. → Test hazırlayan kişinin hem testin hazırlandığı konuları, hem de test hazırlama tekniğini iyi bilen kişiler olması gereklidir. * Öğretmen yapısı testlerde bunu gerçekleştirme olasılığı çok düşüktür. → Öğretmen testi kendi hazırlar. Her öğretmenin test hazırlamada uzman olduğu düşünülmez. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 4) *Standart testlerde, ihtiyaçtan daha çok soru hazırlanır, her soru daha önceden birkaç kere uygulanır, madde ve test analizleri yapılır. → Elde edilen verilere göre iyi sorular seçilerek son test hazırlanır. *Öğretmen yapısı testlerde ise test hazırlamanın böyle bir süreçten geçmesi çok nadiren yapılır. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 5) *Standart testlerin güvenirlik derecesi yüksektir. *Öğretmen yapısı testlerin ise düşüktür. Standart ve Öğretmen Yapısı Testleri Ayıran Farklar 6) *Standart başarı testleri ülke ya da geniş bölge için hazırlanıp, sonuçlar tüm ülke çapında geniş bir grubun performansını temsil eder. *Öğretmen yapısı testler ise yalnızca bir sınıfı, okulu ya da belli bir referans grubunu temsil eder. Standart Testlerden Yararlanılan Alanlar Bir birey ya da grubun başarı düzeyini karşılaştırmak söz konusu olduğunda Bir birey ya da grubun değişik beceri ya da konu alanlarındaki başarı seviyesinin karşılaştırmalı olarak bir profili elde edilmek istendiğinde Değişik okul ya da sınıflarda başarı karşılaştırılacağı zaman Belli bir zaman süresinde öğrencinin gelişimi izlendiğinde Araştırmalarda, başarı değişkenine ilişkin bilgi toplanması gerektiğinde Öğretmen Yapısı Testlerden Yararlanılan Alanlar Öğretmenin kendi sınıfındaki öğrencilerin başarılarını değerlendirmesinde Sınırlı bir konunun hangi noktalarının öğrenciler tarafından anlaşılıp anlaşılmadığının teşhis edilmesinde Teşhis Testleri Teşhis testleri, bir akademik program içinde bireylerin kazanıp-kazanmadığı bilgi, beceri ve davranışları belirleme amacına yöneliktir. Herhangi bir akademik programın sorumlusu olan kişi ya da öğretmenlerin, izlenecek yeni programa başlamadan önce kazanıldığı varsayılan davranışlar yönünden öğrencilere böyle teşhis testi uygulaması yararlı olmaktadır. Teşhis Testleri Ders sorumlusu, yeni ders için eksik kalmış temel kavramları teşhis testi ile saptadıktan sonra bunları gözden geçirip, hatırlatıp ya da kazandırabilir, Grubun heterojen olan yapısını homojen bir yapıya dönüştürebilir. Böylece gruptaki bireyler arasındaki farklar azalmış olur ve yeni akademik programı izlemeye hazır hale gelirler. Başarı ve Genel Başarı Testleri Genel başarı testleri, içindeki soruların kapsadığı alanın çok geniş olması ve herhangi bir alana düşen soru sayısının az oluşu gibi özellikleriyle başarı testlerinden ayrılır. – Örn., üniversite sınavlarındaki fen bilimleri testi, sosyal bilimler testi; ilkokul genel başarı testi Başarı testleri ise, konu yönünden oldukça dar bir alanda hazırlanır ve konuyu derinliğine yoklamayı amaçlar. – Örn., Biyoloji testi, matematik testi, psikoloji testi Okullarda Başarı Testlerinin Kullanılması Başarı testleri daha çok öğrencilerin geçmiş akademik yaşantılarını ölçmek için kullanılır. Fakat başarı ile genel yetenek arasındaki ilişkinin yüksek olması ve Herhangi bir alandaki başarı için o alana ait temel kavram ve bilgilerin bilinmesinin ilerideki başarı için önemli olmasından dolayı → Başarı testleri geleceğe yönelik yordama amaçları için de kullanılmaktadır. Okullarda Başarı Testlerinin Kullanılış Amaçları Öğrencinin zayıf ve kuvvetli başarı alanlarını tanımak Öğrencilerin seçmeli derslerden hangisini alacağı veya alanlardan hangisine yöneleceğinin kararlaştırılması Öğrencilerin başarısızlık sebeplerinin araştırılması Öğrencilerin öğrenim ve mesleklerinin planlanması Öğrencilerin başarı seviyeleri ile zeka seviyelerinin karşılaştırılması Seçme ve sınıflandırmayı gerektiren durumlarda Okullarda Başarı Testlerinin Kullanılış Amaçları Başarı testleri ayrıca, temel eğitim ve ortaöğretim okullarında, – Öğrenme güçlüklerinin teşhisi, – Mesleki ve eğitsel rehberlik, – Çocukları, öğretim ve çeşitli amaçlar için gruplama gibi durumlarda kullanılmaktadır. PSK301 PSİKOLOJİDE ÖLÇME VE DEĞERLENDİRME YETENEKLERİN ORGANİZASYONU VE ÖLÇÜLMESİ Yeteneklerin ölçülmesinde, Genel yetenek (general aptitute) Zeka (intelligence) kavramları kullanılmaktadır. Her iki terim kullanılsa da, Günümüzde «Genel Yetenek» terimi, aynı nitelik için, daha yaygın olarak kullanılmaktadır. Zekanın Anlamı ve Doğası Zekanın tanımı konusunda farklılıklar olsa da, Zeka testlerinin ölçtüğü kabul edilen belli başlı şeyler üzerinde uzlaşıldığı görülmektedir. Uzmanların uzlaştığı noktalar: Testlerin özellikle okul programlarının kapsamında olan konular, bireyin «öğrenme gücü». Ancak bu açıdan, genel zekanın anlamı çok daraltılmış olmaktadır. Zekanın doğrudan ölçülemediği, ancak «dolaylı yollarla» ölçülebildiği. Bireyin zekası, zeka testi denilen zeka ile ilişkili olduğu varsayılan nitelikler evreninden titizlikle seçilmiş uyarıcılar takımına karşı gösterdiği GÖZLENEBİLİR tepkilere göre yordanabilmektedir. Zeka, zeka testlerinin ölçtüğünü varsaydığımız zihinsel bir güç ve bir genel yetenektir. Zekanın Anlamı ve Doğası Olgular arasında ilişkiler kurmak, Verilen bir durumla ilgili doğru yargılara varmak, Kelimelerin anlamlarını bilmek, Sayısal problemleri çözmek, Verilen malzemelerle istenilen bir şey yapmak gibi →zihinsel davranışlarla ilgili test durumlarında bireyin gösterdiği becerilerin nicelik ve niteliği zeka düzeyi hakkında fikir vermektedir. Zekanın Anlamı ve Doğası Zeka testlerinin ya da daha genel olarak testlerin amacı bireysel farkları ölçmektir. İnsanlar arasındaki bu psikolojik farklar, belirli niteliklerin varlığı ya da yokluğu şeklinde bir fark olmaktan çok bir derece farkıdır. Zeka testleri bireyler arasındaki bu derece farklarını ölçmeye yarayan ölçme araçlarıdır. Zekanın Tarifi Bazı psikologlar zekayı «Bireyin yeni durumlara, yeni problemlere uyabilme yeteneği» olarak tarif ederler, bireyin yeni durumlar ortaya çıktığında davranışlarını uygun ve etkili şekilde yeniden düzenleyebilmesini önemli görürler. Bu tarife göre, zeki olan birey durumun gerektirdiği çok sayıda olası çözüm yolları bulabilen, bunları gözden geçirip, en uygun olan

2024-2025 Güz PSK301 Psikolojide Ölçme ve Değerlendirme PDF

Document Details

Tags

Related

Summary

Full Transcript