Eğitim Sisteminde Uluslararası Değerlendirmelerin Yeri

 Eğitim Sisteminde Uluslararası Değerlendirmelerin Yeri

Giriş

Eğitime ilişkin değerlendirmeler ve karşılaştırmalar öteden beri dikkat çekici bir husus olmuştur. Özellikle de son yıllarda uluslararası düzeyde yapılan geniş ölçekli değerlendirme çalışmalarının daha da popülerlik kazandığını görmekteyiz. Çok da şaşırtıcı olmayan bu durum bahsi geçen uygulamaların eğitime ilişkin kritik düzenlemelerin yapılmasında belirleyici bir unsur olarak görülmesi ihtimalinden kaynaklanmaktadır. Her geçen gün yaşanan yeni gelişmelerle eğitim sistemleri birtakım zorluklarla karşı karşıya kalmakta ve yeni düzenlemelere ihtiyaç duymaktadır. Bu zorlukların üstesinden gelmede geleceğe uygun bireyler yetiştirmek için eğitim sisteminde niteliği artırmanın doğru bir yol olacağı konusunda hem uzmanlar hem de araştırmacılar fikir birliğine ulaşmış görünmektedirler. Ancak ne var ki bu durum çocukluk döneminden başlayıp ileriki yaşları da içine alan pek çok geniş ölçekli değerlendirme (Baby PISA, PIAAC vb.) için de zemin hazırlamış görünmektedir.

Uluslararası Değerlendirmeler

Uluslararası değerlendirmeler ya da uzun ifadesi ile uluslararası geniş ölçekli değerlendirmeler (ILSA) “belirli bir alana özgü bilgi, beceri veya davranışları inceleyen geniş ölçekteki tarama çalışmaları” (Kirsch vd., 2013) olarak tanımlanmaktadır. Eğitim özelinde ise “öğrencilerin öğrenmelerini geliştirmek adına eğitim öğretime yönelik farklı ülkelerden bilgiler toplamak” (Mislevy, 1995) anlamını taşımaktadır. Bu uygulamalar çoğunlukla belirlenen ortak bir çerçeve doğrultusunda toplumlara ilişkin betimlemeler yapmakta ve sonuçlara ilişkin karşılaştırmayı mümkün kılan verileri muhataplara sunmaktadır. Yaklaşık 60 yılı aşkın bir süredir uygulanagelen bu uygulamaların amaçları; (1) Elde edilen başarıları ülkelere ve konulara göre karşılaştırmak, (2) başarılara etki eden önemli faktörlere ilişkin uygulanan politikaların bir ülkeden diğerine transferini sağlamak (3) başarıyı artırmak için ülke içi öncelikli harcamaların yeniden değerlendirmek olarak özetlenebilir (Theisen, Achola ve Boakari , 1983).

Belirli bir alan veya beceriye ilişkin yapılan geniş ölçekli değerlendirmelerin uygulanmasında işleyen bir sistematiğin varlığından bahsetmek mümkündür. Kirsch ve arkadaşları (2013) mevcut geniş ölçekli uygulamalarda takip edilen bu sistematiği adımlı bir döngü ile ifade eder. Aşağıdaki şekilde bu döngüye yer verilmiştir.

Şekil 1. Geniş ölçekli değerlendirme döngüsü

Belirtilen döngünün, ilk adımında yer alan “politika belirleyici sorular” farklı nitelikteki geniş ölçekli uygulamaların çıkış noktası olarak görülür. Bu aşama aynı zamanda ikinci adımda yer alan “değerlendirme çerçevesini” de şekillendirmektedir. Belirlenen bu çerçeve dâhilinde ilgili uygulama alanında alt alan/düzeyler belirlenerek ölçme araçları geliştirilir. Sonrasında ise geniş ölçekli değerlendirmeler için belirtilen çerçevede uygulamanın işe koşulması yoluna gidilir. Son olarak belirlenen uygulama çerçevesi doğrultusunda “verilerin analiz edilmesi” ve “yorumlama işlemleri” gerçekleştirilir. Farklı kuruluşlarca yürütülen geniş ölçekli değerlendirme verileri, eğitim araştırmacılarının politika geliştirebilmeleri için önemli birer kaynak olarak görülmektedir.

Uluslararası değerlendirmelerin amaçları ve uygulanması dikkate alındığında bu değerlendirme türünün sınıf içi değerlendirmelerin ötesinde amaçları olduğu anlaşılmaktadır. Ancak eğitim bütün bir sistem olarak düşünüldüğünde yapılan her değerlendirmenin sistemde birbirinden ayrı ancak birbiri ile etkileşimli ilişkileri olduğu da açıktır. Her ne kadar uluslararası değerlendirmelerin farklı çerçevelerle belirledikleri birtakım değerlendirme kriterleri bulunsa da bu kriterlere ulaşılması her bir ülkenin öğretmenleri, kültürel yapısı veya okul özellikleri gibi birçok değişkenden etkilenmekledir. İlgili kriterlerin geniş ölçekte gözden geçirilmesi yapılacak iç (ulusal, sınıf içi) değerlendirmelerle de mümkündür. Dolayısıyla gerek uluslararası geniş ölçekli değerlendirmelerden sınıf içi değerlendirmelere gerekse de sınıf içi değerlendirmelerden geniş ölçekli değerlendirmelere karşılıklı yansımalar görülebilir. Bu itibarla eğitim sistemi tüm bu değerlendirmelere ait uygulama ve politikaların yansımasını taşır. Eğitime ilişkin farklı düzeyde yapılan değerlendirmelerin birbirini etkilemesi bu sayede sistemin yön tayin etmesi söz konusudur.

 Şekil 2. Yapıldığı düzeye göre eğitimde değerlendirme çerçeveleri (Aydın, 2015)

Eğitim sistemine ilişkin yapılan değerlendirmeler incelendiğinde; en temelde sınıflarda yapılan sınıf içi değerlendirmeler, sonrasında okulların kendi öğrencilerine ilişkin öğrenme düzeylerini belirlemeye dönük sınavları gelmektedir. İlgili sınavların bir kısmının ulusal/uluslararası kuruluşlarca yapıldığı da görülmektedir (CITO vb.). Bu sınavlar ilgili okulun kalite düzeyini gösteren bir araç olarak da kullanılmaktadır. Ulusal değerlendirmeler ise eğitim sistemine ilişkin ikinci en önemli değerlendirme çıktılarını sağlamaktadır. Ulusal düzeyde yapılan değerlendirmeleri yapılan sistem odaklı değerlendirmeler (ÖBBS, NAEP, NAPLAN vb.) ve (LGS, YKS vb.) olarak ikiye ayırmak mümkündür. Sistem odaklı değerlendirmelerin daha çok eğitimi izleme amacıyla yapıldığını, öğrenci odaklı ulusal değerlendirmelerin ise sertifika kazanımı veya bir üst kademeye üst kademeye geçişte ön plana çıktığı görülmektedir. Eğitim sistemine ilişkin değerlendirmelerde öğrenci odaklı sınavlar, -geri bildirimi öğrenciler açısından okul içi veya ulusal değerlendirmeler kadar hızlı etkili olmayan ancak bir ülke eğitim sistemi açısından en üst düzeyde geri bildirim sağlayan- uluslararası geniş ölçekli değerlendirmeler önemli bir yer tutmaktadır. Bu uygulamalar (PISA, TIMSS vb.) da kendi çerçevelerinde belirtildiği üzere sistem odaklı değerlendirmeler olarak değerlendirme sistemi içerisinde yer almaktadır.

Uluslararası Değerlendirmelerin Yapısı

Günümüzdeki anlamı ile uluslararası değerlendirmelerin tarihi Birleşmiş Milletler Eğitim, Bilim ve Kültür Örgütü’nün (UNESCO) 1958 yılında okullar ve ülkelerden sistematik veri toplamaya karar verdikleri toplantıya dayanmaktadır. Uzmanların “doğal ortamda bir uygulama” (Foshay, 1962) olarak gördükleri bu uygulama şimdilerde adını TIMSS (Uluslararası Matematik ve Fen Eğilimleri Araştırması) ve PIRLS (Uluslararası Okuma Becerilerinde Gelişim Projesi) sınavları ile çokça duyduğumuz “Uluslararası Eğitim Başarısını Değerlendirme Kuruluşu” (IEA) tarafından 1959-1962 yılları arasında gerçekleştirilir (Simon, Erçıkan ve Rousseau,  2012). Bu ilk uygulama 12 ülkeden 13 yaş öğrencileri ile beş farklı alanı kapsayan bir sınav çerçevesi dahilinde gerçekleştirilir. Matematik, Fen, Edebiyat, Yabancı dil ve Vatandaşlık alanında başlayan değerlendirmeler 1990’larda 20 kadar ülke ile şimdilerde 70’e yakın ülkenin katıldığı bir büyüklüğe ulaşmış görünmektedir. Bu ülkelerin yoğun katılım sağladığı, Matematik, Fen ve Okuduğunu anlama alanlarının değerlendirildiği TIMSS ve PIRLS uygulamaları oldukça popülerdir. Bu uygulamalarla daha çok müfredat temelli olup; (a) Hedeflenen program (müfredat ve uygulanan politikalara ilişkin özellikler) (b) Uygulanan program (Okul, öğretmen ve sınıf özellikleri) (c) Gerçekleşen program (öğrencilerin başarı ve tutumları) arası ilişkileri betimlemeye çalışır.

Eğitime ilişkin ekonomik harcamaların ön plana çıktığı 2000’lerin başında Ekonomik İşbirliği ve Kalkınma Örgütü (OECD) de geniş ölçekli değerlendirme alanında bir çerçeve oluşturmuştur. Daha çok “okuryazarlık” kavramının temele alındığı PISA adı verilen (Uluslararası Öğrenci Değerlendirme Programı) uygulama ile her 3 yılda bir Matematik Okuryazarlığı, Fen Okuryazarlığı ve Okuduğunu Anlama alanlarında değerlendirmelerin yürütüldüğünü görmekteyiz. 2000 yılındaki ilk uygulamaya 29’u OECD üyesi toplamda 43 ülke katılmışken şimdilerde 80’a yakın ülkenin/eğitim sisteminin katıldığı dünya ekonomisinin %90’larını temsil eden bir büyüklüğe ulaşmıştır.

TIMSS ve PISA uygulamalarında yukarıda anlatıldığı gibi kendine has değerlendirme çerçeveleri ve işleyiş söz konusudur. TIMSS uygulaması öğrencilerin Matematik ve Fen Eğilimlerini 4 ve 8. sınıf düzeyinde ele alırken PISA uygulamasında 15 yaş grubuna giren bireylere ilişkin okuryazarlık değerlendirmesi ile ön plana çıkar. Türkiye olarak TIMSS uygulamasına 1999 yılından itibaren, PISA uygulamasına da 2003’ten bu yana katılmaktayız. Her iki uygulamada da ülke olarak kısmen başarısı artan bir profil ortaya koymakla birlikte alınan puanların halen ortalamanın altında seyrediyor olduğu görülmektedir. (Bu çalışmada sıralama puanları üzerinden bir tartışmaya yer verilmemiştir.)

Uluslararası değerlendirmelerde ülkelerin sıralamadaki yerlerine ilişkin karşılaştırmalar hep dikkat çekici bulunur. Ne var ki bu uygulamalarda asıl dikkatle incelenmesi gereken öğrencilerin neleri yaptığını gösteren “yeterlik düzeylerine ilişkin sonuçlar” olmalıdır. Çünkü bu uygulamaların asıl amacı sistemin iyileştirilebilmesi adına yapılacak düzenlemeler için yol gösterici olmasıdır. Örneğin hem PISA hem de TIMSS uygulamalarında düşük ve alt düzeylerde yer alan öğrencilerin çokluğu o ülkedeki öğrencilerin ciddi bir kısmının ancak temel yeterlikleri kazanabildiğini göstermektedir. Pek çok ülke açısından farklı bağlamları olan bu değerlendirmelerde yeterlik düzeylerine ilişkin sonuçların -uygulamalar ayrı da olsa- hatırı sayılır oranda örtüşmesi dikkat çekicidir. Bu bakımdan ilgili değerlendirmelere katılmanın bir sonucu olarak ülkelerin eğitime ilişkin düzenlemelerde bu sonuçları dikkate almış olması rasyonel bir seçenek olarak görünmektedir.

Uluslararası Değerlendirmelerin Gücü

Ritzen (2013) şeffaflığın toplumsal anlamda dönüşümü gerçekleştirmek için yasal zeminleri hazırlayan belirleyici bir unsur olduğunu ifade eder. Özellikle de eğitime ilişkin geniş ölçekli değerlendirmelerin sonuçlarına ilişkin şeffaflığınsa değişimin aracısı, yeni bir unsur olarak kabul edildiğini ifade eder. Uluslararası değerlendirmelerin gücü en temelde bu şeffaflığa katkı sağlamasından gelmektedir. Bir başka önemli etken ise sıralamaya olan ilgimizden kaynaklanmaktadır. İnsan olarak karmaşık durumlardansa bir şeyin göstergesi olarak kolayca anlaşılacak sıralamaları, ileride-geride/önde-arkada gibi betimlemeleri daha anlamlı buluruz. Karşılaştırmaların çokça yapılabilir olması yapılan değerlendirmelerin hem sonuçlarının tartışılmasına hem de ilgi ile takip edilmesine katkı sağlamaktadır.

Uluslararası değerlendirmelere ilişkin sonuçlarda, bir bakıma ülkelere ve sistemlere dönük bir “ifşa edilme” (naming and shaming) söz konusudur. Bu tip bir ifşa edilme okulları uyguladıkları yöntemlerle ilgili gözden geçirmeye itebileceği gibi okulların muhatapları olan öğrenci ve velilerin de dikkatini çekecektir. Benzer şekilde eğitimle ilgili bölgesel ya da ulusal yetkililerin de bu durumun takipçisi olmalarını sağlayacaktır. 

Uluslararası geniş ölçekli değerlendirmelere ilişkin sonuçların farklı ülkelerde gündeme yansımalarının farklı olduğu görülmüştür. Bunun bir örneği PISA 2000 uygulamalarının sonuçları ile birlikte Almanya’da yaşanır. Her ne kadar Almanya için  (Lehmann, 2011) 1996-97’deki Matematik ve Fen alanlarındaki TIMSS sonuçları “TIMSS şoku”  şeklinde tanımlanan bir dönüm noktası olarak sayılsa da asıl dönüm noktasının PISA 2000 sonuçları olduğunu söylemek mümkündür. Uzun süre gündemde kalan sonuçlar için bir süre mecliste de kapalı oturumlar yapılır. Alınan kötü sonuçlar “PISA şoku” şeklinde isimlendirilerek Alman eğitim literatüründe önemli bir yer edinmiştir. Öyle ki PISA sonrası anlamına gelen (PS) bir kullanımın olduğu da görülür. (Aydın, 2016).

Yaygın bir değerlendirme olan PISA sonuçlarının, uygulamaya katılan ülkelerin eğitim politikalarına etkisini araştıran Ritzen (2013) 2000-2006 uygulamasına katılan ülkelerin sınav sonuçları doğrultusunda politika geliştirme düzeylerinin birbirinden farklı olduğunu ifade eder. Katılımcı ülkeleri PISA sonuçları doğrultusunda düşük, orta ve yüksek seviyede politika geliştiren ülkeler şeklinde sıralar. Bu sonuçlar arasında Türkiye’nin de yer aldığı düşük düzeyde politika üreten ülkeler grubunda, PISA başarısı düşük ülkelerin yanında Hollanda ve İngiltere gibi nispeten yüksek puana sahip ülkelerin de yer aldığı görülmüştür. Orta düzeyde politika geliştiren ülkeler ele alındığında ise bu ülkelerin çoğunluğunun ortalamanın üzerinde puan ortalamasına sahip ülkeler olduğu, hatta ilk sıralardaki ülkelerin bir kısmının da yer aldığı görülür. PISA sonuçlarına göre politika belirleme düzeyi yüksek olan ülkeler incelendiğinde ülke puanları oldukça yüksek olan Japonya ve Makao-Çin gibi ülkelerin yanında Kırgızistan ve Tayland gibi düşük puana sahip ülkelerin de bu listede yer aldığı görülür. Araştırmada bu durum ülkelerin uluslararası karşılaştırmalara olan yüksek ilgileri ile açıklanmıştır. Ayrıca bazı ülkelerin ortalama puanlara erişmekten, bazı ülkelerin ortalamaya yakın başarı göstermiş ülkeler arasında olmaktan memnun olması, bir kısmının ise en iyi ülkeler arasında olmak gibi bir arzusunun olması politika üretme konusunda istek düzeylerini de farklılaştırmış görünmektedir. 

İngiltere’nin PISA 2012 değerlendirmesi sonuçları ise ülkede bir durağanlık ve düşüş olarak görülmüş sonuçlar ise bir uyandırma çağrısı olarak görülmüştür. Aynı yılki uygulamaya ilişkin değerlendirme İsveç için de bir düşüş olarak adlandırılmıştır (Lüpke-Narberhaus, 2013). Almanya’nın ise PISA 2012 sonuçlarındaki yükselişi “şok atlatılmış görünüyor” şeklinde ana akım medyada yer almıştır (Bittlingmayer vd., 2016). PISA değerlendirmelerine ilişkin ülkelerarası sıralamaya dayalı kıyaslamalar kadar ülkeler içi sonuçlar da bir dizi politik düzenlemeleri/tepkileri beraberinde getirmiştir. PISA bulgularına dayalı olarak Güney Kore öğrencilerin puanlarında görülen cinsiyet etkisini, Danimarka ve Almanya göçmen öğrencilerin düşük başarı göstermelerini ve Polonya yaşça büyük öğrencilerin daha yüksek puana sahip olmasını (Breakspear, 2012,2014) ve Güney Kore eğitimde 21. yüzyılda ihtiyaç duyulan yetenekleri daha az stresli ve daha fazla destekleyici şekilde sunabilmeyi (Zhao ve Wang, 2018) politika gündemine taşımıştır. Bu ve benzeri sorunları ele almak için pek çok ülke ulusal düzeyde reform hareketleri geliştirmek için tepkide bulunmuşlardır.

Fischman ve arkadaşları ise (2019) hükümetlerin bir kısmının bu değerlendirmelerden alınan sonuçları, sonrasında bazı politika adımlarını atmak için bir diğer kısmının ise daha önceden uygulamaya koydukları reformları haklı çıkarmak/hızlandırmak için kullandıklarını ifade eder. Bu nedenle de eğitim reformları ile bu değerlendirmelere katılım arasındaki nedensellik ilişkinin halen karanlık olduğunu vurgulamaktadır. Şu var ki her iki durumda da reform adımlarının belirli oranda meşru hale getirilmesi söz konusudur. Bu durum reformların dikkatli takipçileri açısından bir dayanak noktası görülebilmesinden ötürü her koşulda dikkate değer sayılabilir.

Madalyonun Diğer Yüzü

Geniş ölçekli uluslararası değerlendirmeler çoğunlukla bazı yanlış kabulleri de beraberinde getirmektedir. Öncelikle geniş ölçekli değerlendirmelerin asıl yapmak istedikleri ile çoğunlukla ün kazanmadıklarını görmekteyiz. Örneğin PISA değerlendirmelerin asıl amacı 15 yaş grubu öğrencilerinin matematik, fen ve okuma alanlarındaki becerilerini ortaya koymak şeklinde özetlenirken, sonuçlar çoğunlukla ülkeleri birbirine kıyaslama aracı olmaya indirgenerek/genellenerek ölçmek istenen kapsamın yanlış izah edilmesi söz konusudur.

Yapılan değerlendirmelerde bireylerin ölçülen özelliklerinin (uygulama çerçevesinin) dışında öğrenci özelliklerinin (IQ, Yaratıcılık, toplumsal yeterlikler vb.) ölçüldüğünü düşünmek ya da bu şekilde bir yoruma gitmek de bir başka hatalı genelleme olacaktır (Yuan ve Zhao, 2019). Bu değerlendirmelerde başarılı performans, aynı test koşulları altında, önceden belirlenmiş (veya eşdeğer) cevaplara sahip problemlerin tamamlanması ile değerlendirilir. Böylesi bir değerlendirmenin öğrencilerin yaratıcılık becerisini ya da bireyselleştirilmiş bir öğrenme tecrübelerini değerlendirmesi beklenemez. Öğrencilerin bu cevaplara nasıl ulaştığı tipik olarak bu uygulamalarda değerlendirilmez. Özellikle öğrencilerin bireysel öğrenme deneyimlerinin bilinmediği/ölçümlenmediği bu koşullarda öğrencileri tanımlayan “A ülkesi öğrencileri daha inovatif, üretken özelliklere sahiptir” şeklindeki bir yorum da gerçekçi olmayacaktır.

Günümüzde yaşanan değişmelerin baş döndürücü hızı eleştirel düşünme, iletişim, girişimcilik gibi becerilerin durağan bir tanımının olmadığını da kabul ettirmiş görünmekte. Aynı zamanda bu becerilerin ülkelere göre davranış göstergelerinde/tanımlarında farklılıklar olması da mümkündür. Buradan hareketle tek bir bağlamdan (PISA, TIMSS vb.) ancak iyi tanımlanmış, kararlı niteliklerin gözlenebilmesi mümkündür. Benzer şekilde bireylerin ilgi, yetenek vb. özellikleri farklı pek çok kişisel niteliklerin bir kombinasyonu olduğu bu nedenle de ilgili özelliklerin -örneğin matematik okuryazarlığına ilişkin bir değerlendirmede- sadece bazı yönlerini bu değerlendirmelerle kavrayabileceğimizi unutmamak gerektir.

Uluslararası değerlendirmelerden elde edilen sonuçlara ilişkin yargılarda -giriş bölümünde de dikkate sunulan- “değerlendirmenin kendi çerçevesinde” ele alınması yukarıda sayılan durumlar açısından oldukça önem arz etmektedir. Ancak geniş ölçekli değerlendirmelerin giderek artan gücü, sıralama ve karşılaştırmaların çekiciliği pek çok kez üstün gelmiş araştırmacılar hatta politika yapıcılar da bu kıskaca kısmen yakalanmış görünmektedirler. Özellikle bu uygulamaların kendi çizdikleri kapsamla/çerçeveyle sınırlı olduğu, ölçtükleri her özelliğin aşırı önemli sayılarak seri bir politika üretim aracı olarak görülmemesi gerektiği unutulmamalıdır.

Uluslararası Değerlendirmeler-Ulusal Geniş Ölçekli Değerlendirmeler

Her şeyden önce günümüzde veriye dayalı politika üretmenin önemli olduğunu bu nedenle de oldukça güvenilir veri kaynaklarından biri olan uluslararası değerlendirmelerin eğitime ilişkin çıktılarının yakından takip edilmesi yerinde olacaktır. Ancak eğitim sistemine ilişkin önemli verileri olan diğer düzeylerdeki çıktıların da en az uluslararası değerlendirmeler kadar önemli olduğu unutulmamalıdır. Bu noktada uluslararası değerlendirmeleri kısmen daha önemli yapan şeyin standart bir karşılaştırma aracı hüviyetine bürünmüş olmasıdır. Eğitim sistemine ilişkin sınıf-içi değerlendirmelerin, okullara ilişkin değerlendirmelerin de benzer ciddiyette ele alınması içe kritik bakış için gayet yerinde olacaktır. Çünkü bu düzeylerin her yıl eğitim sistemine sağladığı güncel ve ciddi çıktılar söz konusudur. Bu verilerin izlemi ise ancak standart bir yapıda olması kolay ve anlaşılabilir olabilir. Ayrıca uluslararası değerlendirmeler için geçmesi beklenen belirli bir süreye (PISA 3 yıl, TIMSS 4 yıl, ICILS 5 yıl vb. ) kıyasla iç-değerlendirmelere ilişkin çıktıların sürekliliği ve erişiminin kolaylığı da bir üstünlük olarak göz ardı edilmemelidir.

Geniş ölçekli değerlendirmeler tanımı ulusal düzeyde de eğitim sisteminde kullanılabilecek bir değerlendirmeyi ifade eder. Her yıl yapılan kademeler arası sınavlara ilişkin değerlendirmelerde belirli alanlarda çok az yanıtlanan sorular gündeme gelmekte ve sistemin başarısına ilişkin tartışmaları da beraberinde getirmektedir. Tam olarak ülkemizde bu kabul yerleşmese de günümüz değerlendirmelerinde, üniversite giriş sınavlarında yanıtlanan soruların kişilerin üniversiteye hazır olduğunun göstergesi olarak yorumlanması gibi bir durum söz konusudur (Conley ve McGaughy, 2012). Bu nedenle de bireyleri sıralamak amacıyla yaptığımız geniş ölçekli bu değerlendirmelerin sistem odaklı bir değerlendirmeden daha ziyade bireyleri sıralayan bir değerlendirme yapısına sahip olduğu açıktır. Öte yandan ortak bir madde seti kullanılmamasından dolayı sınavların geçen yıllara göre kolay/zor olduğu tartışmaları da çok gerçekçi olmamaktadır. Bu ve benzeri nedenlerle de ilgili değerlendirmelerde bireylerin gösterdiği performansın doğrudan sistemin başarısı/başarısızlığı şeklinde yorumlamak pek mümkün görünmemektedir.

Farklı pek çok bağlamda [IELS (Uluslararası Erken Öğrenme ve Refah Araştırması), ICILS (Uluslararası Bilgisayar ve Bilgi Teknolojileri Okuryazarlığı) vb.] ve pek çok farklı ortamlarda (tablet, bilgisayar vb.) eğitime ilişkin izlemelerin ülkelerarası bir düzeyde aratarak yürütüldüğü günümüzde ülkelerin eğitim sistemlerine ilişkin kendi çerçeveleri ile ulusal geniş ölçeklendirmeleri de gerçekleştirdiği (NAEP, NAPLAN vb.) bilinmektedir. Bu itibarla uluslararası değerlendirmelerin sisteme ilişkin verdiği çıktıları dikkatle takip ederken ulusal anlamda öğrencileri sıralama kaygısı güden değerlendirmeler dışında geçmişte yapılan ÖBBS (Öğrenci Başarıları Belirleme Sınavı) benzeri ulusal anlamda geniş ölçekli değerlendirmelere tabi tutmak yerinde olacaktır. Böylesi bir değerlendirmenin öğrencileri temsil eden bir örneklemde mevcut müfredatlara ilişkin öğrenme çıktılarını izlemesi de mümkündür. Ayrıca bu tip bir değerlendirme geliştirilecek yeni müfredat çalışmaları için de ulusal anlamda ihtiyaçların belirlenmesine katkısı büyük sağlayacaktır. Ulusal kapsamda elde edilen bu bulguların da uluslararası değerlendirme bulguları ile birlikte ele alınması eğitim sistemlerine ilişkin güçlü ve gerçekçi politika uygulamalarını beraberinde getirmesi beklenir.

Sonuç olarak eğitime ilişkin değerlendirmelerin birbirinden bağımsız olmadığı, ancak standart biçimde yürütülen farklı düzeydeki (sınıf-içi, ulusal, uluslararası) sonuçların karşılaştırılabilir özellikleri taşıdığı unutulmamalıdır. Bu nedenle hem ulusal hem de uluslararası geniş ölçekli değerlendirmeleri bağlamından çıkarmadan işlevsel reform adımları için sağlıklı bir biçimde gündemde tutmalıyız.

Kaynakça

Aydın, M. (2015) Öğrenci ve okul kaynaklı faktörlerin TIMSS matematik başarısına etkisi, Yayımlanmamış Doktora Tezi. Necmettin Erbakan Üniversitesi.

Aydın, M. (2016). Uluslararası öğrenci değerlendirmeleri bize ne söyler? İçinde, E. Yılmaz, M. Çalışkan, & S. A. Sulak (Ed.), Eğitim Bilimlerinden Yansımalar, (ss.213-226). Çizgi Kitabevi

Bittlingmayer, U. H., Boutiuc, A. F., Heinemann, L., ve Kotthoff, H. G. (2016). Jumping to Conclusions—The PISA Knee-Jerk: Some Remarks on the Current Economic-Educational Discourse. European Education48(4), 294-305.

Breakspear, S. 2012. The Policy Impact of PISA: An Exploration of the Normative Effects of International Benchmarking in School System Performance, OECD Education Working Papers, No. 71. OECD Publishing.

Breakspear, S. 2014. How Does PISA Shape Education Policy Making? Why How We Measure Learning Determines What Counts in Education. (Seminar Series Paper No. No. 240). East Melbourne: Centre for Strategic Education.

Conley, D. T., ve McGaughy, C. (2012). College and career readiness: Same or different. Educational Leadership, 69(7), 28-34.

Fischman, G. E., Topper, A. M., Silova, I., Goebel, J., ve Holloway, J. L. (2019). Examining the influence of international large-scale assessments on national education policies. Journal of education policy34(4), 470-499.

Foshay, A. W. (1962). Educational achievements of thirteen-year-olds in twelve countries. Hamburg. UNESCO Institute for Education.

Lehmann, R. (2011). The impact of IEA on educational policy making in Germany. In:  IEA 958 2008:50 Years of Experiences and Memories, eds. C. Papanastasiou, T. Plomp, and E. Papanstasiou, 411–430. Nicosia: Cultural Center of the Kykkos Monastery.

Lüpke-Narberhaus, F. (2013). Schlechtes Abschneiden beim Schulvergleich: Pisa-Absturz schockiert Schweden. Spiegel online-Schulspiegel vom 10.07.2020; Erişim:  http://www.spiegel.de/schulspiegel/ausland/pisaabsteiger-warum-schwedens-schueler-sich-verschlechterten-a-937022.html#.

Mislevy, R. J. (1995). What can we learn from international assessments? ETS Research Report Series, 1995(1), i-32.

Ritzen J. (2013) International large-scale assessments as change agents. In: von Davier M, Gonzalez E, Kirsch I, et al. (eds) The Role of International Large-Scale Assessments: Perspectives from Technology, Economy, and Educational Research,Dordrecht, Netherlands: Springer, pp. 13–24.

Simon, M., Ercikan, K., ve Rousseau, M. (2012). Introduction. In M. Simon, K. Ercikan, & M. Rousseau (Eds.), Improving large-scale assessment in education: Theory, issues, and practice (pp. 1-8). New York, NY: Taylor & Francis/Routledge.

Theisen, G. L., Achola, P. P., ve Boakari, F. M. (1983). The underachievement of cross-national studies of achievement. Comparative Education Review27(1), 46-68.

Yuan, Z., ve Zhao, Y. (2019). Respect the power of large-scale assessments: What they cannot measure. ECNU Review of Education, 3, 253–261.

Zhao, Y., ve Wang, Y. (2018). Guarding the past or inventing the future: Education reforms in East Asia. In Y. Zhao & B. Gearin (Eds.), Imagining the future of global education: Dreams and nightmares (pp. 143–159). New York, NY: Routledge.

Editör

Editör

İlginizi Çekebilir

Yorum Yaz

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir