Bir ölçme aracı belirtke tablosundaki hedef davranışlar yerine yazım güzelliği, kişilik gibi ölçme amacının dışında olan davranışları ölçüyorsa ve buna dayalı değerlendirme yapılmışsa o testin geçerliği düşüktür.
Kapsam geçerliği iki biçimde ölçülebilir;
Mantıksal yol: Konu alanı uzmanlarının
görüşlerinin alınması yöntemidir. Hazırlanan
ölçme aracı uzmanlara gösterilerek ölçülecek
konu alanını yeterince temsil edrp etmediğinin
sorulmasıdır.
istatistiksel yol: Aynı alanda daha önce
geliştirilmiş, aynı davranışları ölçen ve geçerliği
yüksek bir test ile yeni hazırladığımız iki testin
aynı gruba uygulayıp öğrencilerin bu testlerden
elde ettikleri puanları arasındaki korelasyona
bakma yöntemidir.
2. Ölçüt (Yordama, Uygunluk) geçerliği:
Yordama: İstatistiksel teknikler kullanılarak ve bilinenlerden yaralanılarak bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminlerde bulunma işlemidir. Birtahmin işidir.
Testten elde edilen puanlarla testin yordamak için düzenlendiği değişkenin doğrudan ölçüsü olan ve daha sonra elde edilen ölçüt arasındaki korelasyon da yordama geçerliğidir. Korelasyon katsayısının büyüklüğü yüksek yordama geçerliğine işarettir.
Eğitimde bir öğrencinin ya da grubun gelecekteki başarı durumunun nasıl olacağını tahmin etmek için kullanılır. Örneğin; ÖYS sınavları, uygulanan testlerden elde edilen puanlar, adayların üniversitedeki ve gelecekteki başarılarının yordayıcısı olarak kullanılmaktadır. Bu amaçla kullanılan testlerin amaca hizmet etme derecesi yani yordama geçerliğinin olması gerekmektedir.
Ölçüt geçerliğinin hangi anlamda tanımlandığı kriter ya da ölçülen değişkene ait ölçümlerin elde edilme zamanları arasındaki farka bağlı olarak iki grupta incelenebilir;
1. Yordama geçerliği: Yordama geçerliği aranan test uygulanır, o testin yordayacağı özellik ya da puan elde ediünceye kadar beklenir. Bir okulun giriş sınavında kullanılan testin o okuldaki başanyı yordama derecesine bakmak istediğimizde testi uyguladıktan sonra o öğrencilerin o okulda ders notları ortalamalarını beklememiz gerekmektedir. Söz konusu puanlar
geldikten sonra iki puan grubu arasındaki korelasyona bakılır. Elde edilen korelasyon değeri giriş sınavında kullanılan testin girilen okuldaki başarıyı yordama derecesi olarak kabul edilir. öğrencilerin giriş testi puanları yordayıcı, öğrencilerin başarıları ise ölçüttür.
2. Uygunluk geçerliği (mevcut hal geçerliği): Bu durumda geçerliği aranılan testin ölçütü olan puanları beklemeye gerek yoktur. Puanlar elimizde hazır durumdadır. Örneğin bir dershanenin KPSS sınavından birkaç gün önce yaptıkları deneme sınavı testi puanları ile ölçüt olan KPSS sınavı puanları zaman bakımmdan hemen hemen aynı zamana denk gelmektedir.
3.Yapı geçerliği: ölçme işleminin teorik bir
yapıyı (özelliği) ölçüp ölçmediğinin belirlenmesidir.
Buna ilişkin bir geçerlik seviyesi aramaktır. Birbiri ile
ilgili olduğu düşünülen belli öğelerin yada öğeler
arasındaki ilişkilerin oluşturduğu bir örüntüye yapı
denir.
Bu bir ölçüde bilimsel kuram geliştirme süreciyle aynıdır. Psikolojide yapı sözcüğü atılganlık, güvensizlik, içe dönüklük, dışa dönüklük, zeka gibi tanımlanabilir belli kişilik özellikleri için kullanılır. Eğitimde ölçmeye çalışılan bazı özellik yada değişkenler birer kuramsal yapıdır. Bu özeliiklerin ölçülmesi için araç geliştirmede izlenen yol, önce söz konusu özellik yada özellikleri belirlemek yani yapıyı tanımlamak, sonra da tanımlanmış yapıdan sınanabilir denenceler çıkarmak ve çıkarılan denenceleri sınamak için deneysel ve istatistiksel çalışmalar yapmaktır.
Yapı geçerliği çalışmasında ölçmeye çalıştığımız özelliği nasıl tanımladıysak testin de bize bu tanıma uygun veri sağlamasını bekleriz. Çoğu zaman yapı geçerliği için faktör analizi tekniği ile kanıt aranır.
Eğitimde ölçülmek istenen özellikleri ölçmeye yarayan testlerin geliştirilmesinde önce zekanın yada kritik düşünmenin ne olduğunun tanımı yapılır. Daha sonra bu soyutlanmış yapılardan ölçülebilir davranışlar çıkarılır. Daha sonra bu davranışları ölçecek test maddeleri geliştirilir. Kişinin verdiği cevaplara bakarak o kişi hakkında yorumda bulunulur. Yorumun geçerliği buraya kadar oian aşamaların geçerliliğine bağlıdır.
4. Görünüş geçerliği: Birtestin gerçekten
ne ölçtüğüyle değil, onun ne ölçüyor göründüğü ile
ilgilidir. Bir testin görünüş geçerliği, o testin ölçmek
istediği şeyi ölçüyor görünmesidir. Görünüş geçerliği
olan birtest kapağında ne yazılıysa onu ölçüyor
görünür. Örneğin; kapağında "Fizik testi" yazılı olan
Ölçme ve Değerlendirme
149
bir testin içinde fizikle ilgili sorular varsa söz konusu testin geçerliği vardır denilir. Bunun için konu alanı uzmanlarının görüşü yeterlidir.
Geçerliği Artırıcı Önlemler
Ölçme yöntemi: Bir testte kullanılan yöntem
(yazlı, yoklama, sözlü yoklama, testler) öğrencinin
alacağı puanı (hata miktarını) etkileyebilir.
İstenmeyen özelliklerin ölçülmesî: Her soru, o
araçla ölçülmek istenen davranışlardan en az bir
tanesini yoklamalı, başka özellikleri ölçmemelidir.
Örneğin; matematik bilgisini ölçerken yazı güzelliği,
tertip düzen gibi özelliklerin ölçülmesi geçerliği
düşürür.
Ölçülecek özelliği tam olarak ölçen sorular:
Her soru, o soruyla ölçülmek istenen bilgi ve becerilere sahip öğrencilerin tereddütsüz doğru cevaplandırılabileceği ve bu bilgi, beceri ve yeteneklere sahip olmayanların doğru cevaplandırılamayacağı nitelikte olmalıdır.
Kapsamlı ve dengeli dağılım: Sınav belli bir
sürede okutulan konular ve o konulara dayanılarak
geliştirilmesi beklenen bilgi, beceri ve yetenekler
bakımından hem kapsayıcı hem de dengeli ohnalıdır.
Güvenirlik: Herhangi bir puanın geçerliği için ön
şart, onun güvenirliğidir. Güvenirlikten yoksun bir
puan sadece tesadüfı hataları gösterir. Hatada geçerli
ölçü olamaz. Her ölçme sonucu güvenirliği oranında
geçerîik kazanır. Fakat güvenirliğin sağlanmış olması
geçerliğinde mutlaka sağlanacağı anlamına gelmez.
Sınavın güçlük derecesi: Sınavın ve ölçme
araçlarının güçlüğü de geçerliğe etki eder. Güçlük
derecesi o sınavdan elde edilecek puanların
kullanılacağı amaca göre ayarlanmalıdır.
Aynı sınavların her yıl kullanılması, kopya, sınav
süresinin yetersizliğinden boş bırakma, soruları
sınavdan önce açıklama, derslerde sınav sorularının
çözülmesi, öğrencilerin çeşitli nedenlerle sınavı yanda
bırakması, gürültü, hastalık gibi nedenlerle sağlıklı bir
cevaplandırmanın yapılmayışı gibi etkenler güvenirliği
ve geçerliği düşürür.
Hedeflere uygun soru hazırlamak, etkili bir sınav
planı geçerliği artırır.
Kullanışlılık
Araç ve yöntemin uygulanabileceği eğitim seviyesi, uygulama süresi, ölçmeden istediği beceriler, maliyet ve ekonomi gibi etkenlerin o araç ve yöntemin kullanılmasına etkileri kullanışlılık olarak ifade edilmektedir. Kullanışlığı artıran önlemler güvenirliği ve geçerliği de dolaylı olarak artırır.
ölçme araç ve yöntemlerinin kullanışlılığı hakkında bir yargıya varırken göz önünde bulundurulması gereken noktalar şöyledir;
Ekonomi; Araç ve yöntem maliyet yönünden
ekonomik olmalı, öğretmene, öğrenciye, yöneticiye
ağır mali yük getirmemelidir.
Hazırlama süresi; Her araç ve yöntem bir
hazırlık gerektirir. Testlerde bu süre daha uzun, yazılı
yoklamada daha kısadır. Hazırlama süresi kısa olan
bir sınav tercih edilmelidir. Yalnız kalabalık gruplarda
yazılı yoklamaların cevaplarının puanlanması zorluğu
da göz önünde bulundurulmalıdır.
Uygulama süresi; Bir yöntemin kullanılışlığı,
verdiği puanın önemine oranla, uygulamada
gerektirdiği zaman azaldıkça artar.
Hazırlayıcı ve uygulayıcıların nitelikleri; Bir
aracın uygulanması ne kadar özel beceriler gerektirirse, kullanışlığı da o oranda sınırlanır.
Cevapların Nitelikleri; Öğrenciler cevaplama
yönergesini kolayca anlayabilir ve cevaplarını kolayca
kaydedebilirlerse, o araç kullanışlıdır.
Uygulama kolaylıkları; Testlerde sayfa düzeni,
baskı mükemmelliği, cevap kağıdmm düzeni, yazılı
yoklamada soruların yazılı verilmesi gibi konular
uygulama kolaylığı o araçlann kullanılışlığını artırır.
Puanlama kolaylıkları; Testlerde cevap
kağıdının ayrı olması, iyi düzenlenmesi, cevapların
optik okuyucu ile puanlanabilmesi, puanlama
anahtarının olması kullanılışlığı artırır.
Puanları yorumlama kolaylıkları; Bir araç
yorumlamaya yardımcı, yorumlamayı kolaylaştırıcı ve
yorumda hatayı azaltıcı araçlarla beslenirse daha
kullanışlı olur.
SINAVPLANI
Öğretmenlerin bir sınav öncesinde uyması gereken kuralları içeren sınav planı aşağıdaki konuları kapsamalıdır;
Sınavın amacının belirlenmesi; Sınavlar çeşitli
amaçlar için yapılmaktadır. Öğrenci başarısını
(öğrenme düzeylerini) belirleme, seçme yapma,
tanıma ve yerleştirmeye yönelik, öğrenme
eksikliklerini belirleme amaçlarına yönelik sınavlar
yapılmaktadır.
Ölçülecek davranışların belirlenmesi:
Öğrencilerin hangi davranışlarının ölçüleceği
150
ölçme ve Değerlendirme
belirlenmelidir. Fizik dersi için Fizik ile ilgili davranışlar ölçülmelidir.
Belirtke tablosunu hazırlama: Belirtke tablosu
seçilecek soruların evreni yeterince temsil edip
etmedikleri, öğrencilerde geliştirmeyi
amaçladığımız hedef davranışların sınav
kapsamına alınıp alınmadığı, bu hedef
davranışlara ilişkin kritik (olmazsa olmaz)
davranışların göz önüne alınıp alınmadığı
konularında öğretmene bilgi sağlar.
Soru sayısının belirlenmesi: Kaç soru
sorulacağının tespit edilmesi aşamasıdır. Soru
sayısını belirlemede dikkate alınması gereken
noktalar vardır; Sınav süresi, soru tipi, soruların
güçlük derecesi, smavın amacı.
Soru tipini belirleme: Soru tipinin
belirlenmesinde hedef davranışlar (bilişsel,
duyuşsal, psikomotor) ve konunun özelliği dikkate
alınmalıdır.
Sınavın güçlük derecesini belirleme: Öğrenme
düzeyi ve başarının ölçülmesinde sorular orta
güçlükte olmalıdır. Sınav ne çok zor ne çok kolay
olmalıdır. Bunun için sınava giren öğrencilerin
sayısı soruyu doğru cevap verenlerin sayısına
bölünerek bulunur. Sonuç (0.50) civarında
olmalıdır. Güçlük düzeyi (0.00) ile (1.00) arasında
değişir.
Sınavın süresini belirleme: Birçok değişken göz
önüne alınmalıdır. Smavın amacı, soru sayısı,
sınavın zorluk düzeyi, soru tipi ve sınava giren en
zayıf öğrencinin durumu göz önüne alınmalıdır.
Soruların yazımı: Öğretmen soruları yazarken
yazım hataları yapmamaya, eksik ve anlaşılmaz
cümleler yazmamaya dikkat etmelidir. Çoğaltma
aşamasında öğrencilerin eline geçmesini
sağlayan dikkatsizlikler yapmamalıdır.
Puanlamanın nasıl olacağını belirleme: Her
sorunun önem derecesine göre puan ağırlığının belirlenmesi, puanlama hatalarının nasıl önleneceği ile ilgili konuları içerir.
VII. VIII.
IX. TEST VE TEST GELİŞTİRME SÜRECİ
Birey ya da bireyler hakkında bilgi toplama yolları, test dışı teknikler ve testler olmak üzere başlıca iki türlüdür.
1. Test dışı teknikler;
1.Gözlem: Bireyi gerçek yaşamda gözlemek
(Vaka kayıtları, kontrol listeleri, dereceleme
ölçekleri)
i. Genel yetenek testleri ii. Özel yetenek testleri
b. Başarı testleri
i. Standart testler
ii. Öğretmen yapımı testler
Testierin sınıflandırılması
Öğretmen Yapımı Testler: Öğretmenlerin
kendileri tarafından hazırlanan ve uygulanan
başarı testlerine denir.
Standart Testler: Bir grup uzman tarafından
standart koşullarda ve normlara göre hazırlanmış
ve kitapçık haline getirilmiş testlere denir. Örnek;
ÖSS, Anadolu Lisesi Sınavlar, dershaneîerin
geliştirdiği sınavlar. Bu tür testler güvenirliği ve
geçerliği istatistiki yöntemlerle belirlenip uygulanır
ve objektif sonuçlar verir.
3. Kağıt Kalem Testleri: Sınava giren öğrencilerin basılı durumdaki sorulann cevaplarını yazılı olarak ifade ettiği testlerdir. Yazlı yokîama buna ömektir. Bu tür testlerin geçerliği, güvenirliği düşük testlerdir.
Ölçme ve Değerlendirme
151
Seçmeli Testler: Öğrencinin verilen bir grup
seçenekten doğru olanı seçtiği ve işaretlediği
testlerdir. Bu tür testler geçerliği ve güvenirliği ve
objektifliği yüksek olan testlerdir.
Hız Testi: Belirli bir süre içerisinde öğrencinin kaç
doğru cevabı verebileceğinin ölçüldüğü testlerdir.
Bu tür testlerde hiçbir öğrenci soruların tamamını
cevaplayamaz.
Güç Testi: Öğrenciye yeterli zaman verilerek belli
güçlük düzeyine sahip sorular sorularak
performansının ölçüldüğü testlerdir. Örneğin 50
maddelik çoktan seçmeli başarı testi bir güç
testidir.
Objektif Testler: Puanlamasının, puanlayıcıya
göre değişmediği, puanlayıcının görüş ve
duygulannm puanlamayı etkilemediği testlerdir.
Örnek; Çoktan seçmeli ve D-Y testleri
Subjektîf Testler: Puanlamasının, puanlamacıya
göre değiştiği, puanlayıcının görüş ve
duygularının puanlamaya etkilediği testlerdir.
örnek; Sözlü yoklama, yazılı yoklama
Psikometrikyaklaşım: Öğrencinin özelliklere
sahip olma dereceleri sayılarla ifade edilir,
yapılandırılmış (standart) testler kullanılır,
değerlendirme objektiftir. Bilme, kavrama,
uygulama, analiz, sentez gibi bilişsel becerilerin
ölçülmesinde kullanılır. Sonuçağırlıklıdır.
İzlenimci yaklaşım: Öğrencilerin özelliklere
sahip olma dereceleri belirlenerek ifade edilir. Kötü,
orta, iyi, çok iyi gibi. Yarı yapılandırılmış (gözlem
gibi) ölçme araçları kullanılır. Değerlendirme
subjektiftir. Üst düzey zihinsel becerilerin (sentez,
değerlendirme) ölçülmesinde kullanılır. Süreç
ağırlıklıdır.
Uzlaştırıcı (Eklektik) yaklaşım: Klasik ölçme
değerlendirme yaklaşımlarına alternatif olarak
geliştirilmiştir. Bu yaklaşım hem üst düzey zihinsel
becerilerin ölçülmesi hem de hem de bunların
objektif olarak puanlanmasını sağlayan çağdaş bir
ölçme yaklaşımı olarak görülmektedir. Öğrencilerin
yıl içerisinde gerçekleştirdiği etkinliklere göre
ölçüldüğü Portfolyo (öğrenci gelişim dosyası)
uygulamaları bu yaklaşımın en önemli tekniğidir.
XI. ÖLÇME VE DEĞERLENDİRME SÜRECİNDE YENİ YAKLAŞIMLAR
Son yıllarda eğitim bilimlerinde meydana gelen hızlı gelişmelerin sonucunda eğitimde ölçme ve değerlendirme sürecini yakından etkileyen aşağıdaki yenilikler ortaya çıkmıştır.
Öğrenme-öğretme sürecinde öğrenme'nin yeri
ve önemi giderek ön plana çıkmaktadır. Buna
göre öğrenci bilginin pasif alıcısı değil, bilginin
aktif düzenleyicisi ve davranışa
dönüştürücüsüdür. Bilginin doğasına ilişkin
tartışmalar, bilginin öğrenci tarafından zihinde
yapılandırılan bir değer olduğu sonucuna
ulaşmıştır.
Okullarımızda hala uygulanmakta olan, bireylere
hazır alıp bilgilerin aktarıldığı öğretim modelleri ve
buna bağlı ölçme uygulamaları ile 21. yüzyıl bilgi
toplumu bireyinin, bilgiyi üreten problem çözme
gücü yüksek, iletişim becerilerine sahip ekip
halinde çalışabilen, ikinci bir dili kullanabilme gibi
özelliklerini öğrencilere öğrencilere kazandırmak
mümkün görülmemektedir. Bu nedenle öğretim
stratejileri ve yöntemleri ile ölçme yaklaşımları da
değişmektedir.
Bütün bu gelişmelerin sonucunda öğrencilerdeki
bilgi düzeyini ölçmeyi amaçlayan standart
testlerin yerini, öğrencinin bilgiye ulaştığı ve
gerçekçi koşullarda uygulamaya çalıştığı
performans testleri almaya başlamıştır.
Öğrencinin yeterliliğini ölçmeye çalışan ve
alternatif ölçme uygulaması olarak kabul edilen
Portfolyo (öğrenci gelişim dosyası) uygulamaları
da günümüzde en önemli öğretim ve ölçme
uygulaması olarak kabul edilmektedir.
Portfolyo Değerlendirme: Öğrencinin öğrenme sürecindeki performansının ve başarısının kaydedildiği, öğrencinin yıl içerisinde yaptığı tüm ödev ve çalışmalarının ömeklerinin bulunduğu böylece gelişiminin izlendiği bir değerlendirme biçimidir.
Eğitim-öğretim sürecinde portfolyoların kullanılma amacı ve teme! ilkeleri
Öğrencilerin gelişim sürecini izlemek
Öğrencileri ilgili alanları ve yetenekleri
açısından tanımak, öğrencinin etkinlikte
bulunmalarını sağlamak
Öğrencinin öğretim programı dışındaki
faaliyetlerini de kapsayan çok yönlü gelişimi
hakkında bilgi vermek
152
ölçme ve Değerlendirme
öğrenciyi öğrenme sürecinde aktif kılmak ve
özgüvenini artırmak
Gelecek eğitim kurumlarındaki
öğretmenlerine öğrenciyi tanıtmak
Klasik ölçme araçlarının dışında ölçme
sürecine yenilik getirmek
Değerlendirme sürecine öğrenciyi ve
öğretmeni de katmak Öğrenci ölçütleri
öğretmenle birlikte belirler.
öğrencilerin bilişsel, psikomotor ve duyusal
davranışlarının birlikte gelişmesini sağlar.
Öğretimi öğrenci merkezli duruma getirir.
öğrencide sorumluluk geliştirir
Sınırlığı; öğrencilerin aralarındaki rekabeti
kaldırdığı için birbirlerinin çalışmalarını kopya
edebilirler. Objektif değerlendirme
yapılmasındaki zorluklar bir diğer sınırlıktır.
KLASİK (GELENEKSEL) VE ÇAĞDAŞ (ALTERNATİF) DEĞERLENDİRME YÖNTEMLERİ
XII. Klasik değerlendirme yöntemleri
Değerlendirme sürecinde yalnızca öğretmen
aktiftir.
öğretmen merkezli eğitim uygulamaları
değerlendirilir.
Ürün (sonuçodaklıdır).
Ezber ve bellemeye dayalıdır.
Kağıt-kalem ya da standart testler kullanılır.
Geribildirim ve sonuç not olarak verilir.
Ölçüt önceden konulmuştur ve rekabet söz
konusudur.
Puanlama sayısal sembollerle ifade edilir.
Öğrenci düzeyini gösteren esas sembol nottur.
XIII. Çağdaş değerlendirme yöntemieri
Değerlendirme sürecinde öğretmen ve öğrenci
birlikte aktiftir.
Ailesi de değerlendirme sürecine katılır.
Öğrenci merkezli eğitim uygulamaları
değerlendirilir.
Süreç odaklıdır.
Düşüme ve değerlendirmeye dayalıdır.
Çok boyutlu ve değişik tipte ödev, ürün ya da
performans örnekleri kullanılır.
Geribildirim süreç içerisinde öğrenciye ulaştırılır.
Ölçüt, öğrencüerle belirlenir ve grubun başarısı
bireyin başarısını da etkiler.
Puanlama, belirli betimsel değerlere göre
verilmektedir. (Rubrik puanlama). Puanlar
sayılarla değil, bir metin, bir cümle ya da bir paragrafla açıklanmaktadır.
XIV. EĞİTİMDE KULLANILAN ÖLÇME ARAÇLARI XV. YAZILI YOKLAMALAR
Hazsrlanmasının kolay olması, uzun zaman almaması, ve öğretmenlerce iyi biliniyor olmasından dolayı sık tercih edilen bir sınav türüdür. En önemli avantajı, uygulama, analiz, sentez gibi üst düzey zihinsel işlemler gerektiren hedefleri yoklayabilmesidir.
Yazılı yoklamada cevaplayıcı, cevabını kendi
düşünüp bulmak zorundadır. Buna karşın objektif
testlerin bazılarında verilen cevapların arasından
doğru olanı seçmek, bazılannda ise verilen
cevabın doğru yada yanlış olduğuna karar
vermek söz konusudur.
Yazılı yoklamada cevaplayıcı, cevabını yazılı
olarak ifade etmek zorundadır.
Yazılı yoklamada cevaplar çoğu durumda sınırlı
değildir. Her cevaplayıcı, cevaplarını dilediği gibi
ifade etme bağımsızlığına sahiptir. Şişirme söz
konusu olabilir.
Genellikle, bir yazılı yoklama sorusuna verilen
cevapları tamamen yanlış veya doğru olarak iki
sınıfa ayırmak mümkün değildir. Çoğu zaman
cevaplar tam doğru, kısmen doğru, tamamen
yanlış gruplarından birindedir.
Yazılı yoklamada cevapların doğruluk derecesini
tayin etmek puanlayıcıya düşer.
Cevaplama işlemi, cevaplayıcının çok zamanını
alır. Bu durum soru sayısını kısıtlar. Dolayısıyla
objektif testlere göre daha dar alan yoklanmış
olur.
Yazılı yoklamaların puanlanması güçtür.
Puanlanması subjektiftir. (puanlayıcı yanlılığını
katabilir)
Bir yazılı yoklamanın hazırlanması için gerekli
zaman, genellikle diğer ölçme araçlarına oranla