Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, bir eğitmen tarafından sunulan kapsamlı bir eğitim dersi formatındadır. Eğitmen, öğrencilere yönelik ölçme ve değerlendirme konusunu detaylı şekilde anlatmaktadır.
- Video, ölçme ve değerlendirme konusunu sistematik bir şekilde ele almaktadır. İçerikte ölçme temel kavramları, ölçme kuralları, ölçekler, ölçme türleri, değerlendirme türleri, hata türleri, ölçme aracının özellikleri, testlerin geçerlilik ve güvenilirlik kavramları, çeşitli ölçme değerlendirme teknikleri ve merkezi ilim ölçülerinden aritmetik ortalama, medya, mod, standart sapma gibi konular detaylı olarak açıklanmaktadır.
- Videoda ayrıca doğru yanlış testler, boşluk doldurma testleri, eşleştirmeli testler gibi farklı test türleri ve iş performans sesleri, kontrol listeleri, portfolyo, rubrikler gibi çeşitli değerlendirme teknikleri tanıtılmaktadır. Eğitmen, özellikle yorum sorularında çıkabilecek bilgileri ve test geçerliliği, güvenilirliği ve ayırt ediciliği açısından standart sapmanın yorumlanması gibi konulara özellikle değinmektedir.
- 00:01Ölçme ve Değerlendirme Eğitimine Giriş
- Bu ders ölçme ve değerlendirmeyi konu alacak ve kitaptaki konu sırasına göre düzenlenmiş, geçen seneki notlara göre daha kapsamlı olacaktır.
- Video içerisinde ölçme ile ilgili basit işlemler gösterilecek, ancak istatistikle ilgili soruların çoğu ayrı bir video olarak ele alınacaktır.
- Bu derste genel olarak teorik bilgilerden bahsedilecektir.
- 00:37Ölçmede Temel Kavramlar
- Ölçme, nesnelerin gözlemlenip gözlem sonuçlarının sayı ve sembollerle ifade edilmesidir ve ölçme işleminde yorum, yargı ve karar işlemleri yoktur.
- Ölçme kuralı, ölçme işlemi yapılırken uyulması gereken kurallar ve ölçüler özelliği ne kadarlık miktarına ne kadar puan verileceğini belirlemesidir.
- Ölçüt, ölçme sonuçları hakkında karar vermek için kullanılan ve ölçme sonuçlarının karşılaştırıldığı değerdir; ölçüm ve ölçüt olmadan kesinlikle değerlendirme yapılamaz.
- 01:40Ölçüt Türleri
- Mutlak ölçüt, sınav ve ölçme işlemi yapılmadan önce kesin, net ve standart olarak belirlenir (örneğin sınavdan elli ve üzerinde puan alan herkes dersi geçmiş olarak kabul edilecektir).
- Bağlı ölçüt, sınava ölçme işlemi yapıldıktan sonra grubun başarısına göre belirlenir (örneğin aritmetik ortalamanın üzerine puan alanlar dersi geçer).
- 02:35Ölçekler
- Sınıflama ölçeğinde nesneler ya da kişiler birbirlerine benzeyip benzememelerine göre homojen gruplara ayrılır; temel özellik sınıflandırmak, kategorilere ayırma ve gruplandırma söz konusudur.
- Sıralama ölçeğinde temel özellik sıralamadır, en büyükten en küçüğe veya en kısa veya en yüksekten en alça doğru sıralama yapılır; dört işlemden hiçbiri yapılamaz.
- Eşit aralıklı ölçek başlangıç noktası tanımlanmış izafidir, gerçek sıfır yoktur; dört işlemden sadece toplama ve çıkarma işlemi yapılabilir.
- Eşit oranlı ölçek gerçektir, doğrudan ölçme yapılır, oranlama yapılır; dört işlemin tümü yapılır ve bütün istatistiksel işlemler hesaplanır.
- 05:01Ölçme Türleri
- Doğrudan ölçme, varlığın kendisinin ölçülmesidir; eşit oranda ölçek kullanılır ve hem doğal hem de tanımlanmış birim kullanılır (örneğin İstanbul'un nüfusu onbeş milyon, sokağın uzunluğu ikiyüz adımdır).
- Dolaylı ölçme, bir özelliğin başka bir değişen yardımıyla ölçmesidir; varlığın kendisi değil, araç üzerindeki etkisi ölçülür (örneğin Miray sınavdan doksanbeş puan aldı).
- Türetilmiş ölçme, en az iki değişken arasında kurulan bağıntıya dayanılarak yapılan ölçmedir; elde edilen değişkenler arasında çarpma ve bölme işlemi yapılır (örneğin evin büyüklüğü yüzyetmiş metrekaredir).
- 07:26Değerlendirme
- Değerlendirme, ölçme sonuçlarının bir ölçüde karşılaştırılarak ölçülen nitelik hakkında yargıda bulunma ve karar verme sürecidir.
- Tanıma yerleştirmede değerlendirme öğretim sürecinin başında ya da bir dersin giriş bölümünde yapılır, kesinlikle not verilmez ve amacı öğrencilerin hazır bulunup düzeyleri belirlemektir.
- Biçimlendirmeye dönük değerlendirme konu ve ünite sonunda yapılır, ünite ve konuyla ilgili belirlenen kriterlere ulaşma düzeyi belirlenir ve amacı öğrenme eksiklerini tespit etmektir.
- Değer biçmeye dönük değerlendirme birkaç ünitede bir yapılan ara sınavlar veya dönem sonunda finaller gibi olup, amacı öğrenci hakkında geçti, kaldı, başarılı oldu, başarısız olduğu gibi kararlar almak ve öğretim programının hedeflere ulaşma düzeyini belirlemektir.
- 10:12Ölçmede Hata Türleri
- Sabit hata, bir ölçümden diğerine değişmeyen, bütün ölçme sonuçlarına aynı miktarda karışan hatadır.
- Sabit hata doğrudan geçerli etkiler, yönü, kaynağı ve miktarı verir.
- Sabit hata düzeltilebileceği için güvenirliği doğrudan etkilemez, ancak geçerli doğrudan etkiler.
- 10:47Sabit Hata Örnekleri
- Sabit hata, her ölçülen değere aynı miktarda eklenen veya çıkarılan hata türüdür.
- Öğretmenin tüm öğrencilerin ortalamanın %5'ini eklemesi veya öğretmenin herkese sınıfın en düşük puanının %10'unu eklemesi sabit hata örnekleridir.
- Sabit hatada her ölçülen değere aynı miktarda hata eklenir, bu nedenle sınıf ortalaması sabit kalır.
- 11:50Sistematik Hata ve Sabit Hata Arasındaki Farklar
- Sistematik hata, belli kurala göre düzenli olarak karışan ve ölçülen büyüklüğe göre değişen hata türüdür.
- Sistematik hatada her ölçülen değere farklı miktarlarda hata eklenir, bu nedenle sınıf ortalaması sabit değildir.
- Sistematik hatanın yönü, kaynağı ve miktarı bellidir, bu nedenle güvenilirdir.
- 12:31Sistematik Hata Örnekleri
- Eğitimde yapılan hatalarda taraf tutma ve yalnızlık söz konusudur, örneğin yazı güzelliği, ifade biçimi veya sevilen öğrencilere puan verme.
- Öğretmenin yazı güzelliği ve kağıt üzerine puan vermesi veya sadece erkek veya kız öğrencilere 3'er puan fazla vermesi sistematik hata örnekleridir.
- Öğretmenin tüm öğrencilere aldıkları puanın %15'ini eklemesi veya sevdiği öğrencilere aldığı puanın %5'lik eklemesine sistematik hata örnek olacaktır.
- 13:46Tesadüfi Hata
- Tesadüfi hata, yönü, kaynağı ve miktarı belli olmayan hatalardır.
- Tesadüfi hata doğrudan güvenilirliği etkiler ve sınavın doğrudan güvenilirliğini dolaylı olarak etkiler.
- Öğretmenin sınav kağıtlarını yanlış puanlaması, optik forma kaydırma yapma veya kitapçık türünü yazmayı unutma tesadüfi hatalara örnek olacaktır.
- 14:36Standart Hata Hesaplama
- Standart hata, kişi başına düşen yaklaşık tesadüf miktarının test puanı cinsidir ve standart sapma çarpı kök içerisinde 1 eksi güvenilirlik katsayısı formülüyle hesaplanır.
- Örneğin, standart sapması 3 ve güvenilirlik katsayısı 0,9 olan bir sınavda 40 alan bir öğrencinin standart hatası 2,70'dir.
- Gerçek puanın %95 olasılıkla hangi aralıkta olduğunu bulmak için standart hatayı 2 ile çarpıp öğrencinin puanına ekleyip çıkarırız.
- 18:33Ölçme Aracının Özellikleri
- Ölçme aracına bulması gereken özellikler geçerlik, güvenirlik ve kullanışlılıktır.
- Geçerlilik, testin amacına hizmet etmesidir ve -1 ile +1 arasında değer alır.
- Güvenirlik, ölçme sonuçlarının hatalardan arındık olma derecesidir ve 0,00 ile 1 arasında değerler alır.
- 19:12Geçerlilik ve Güvenirlik Etkileyen Faktörler
- Geçerliliği etkileyen faktörler: testin uygulandığı grubun heterojen olması, ölçme aracının orta küçükte olması ve sınav için yeterli süre verilmesidir.
- Güvenirliği etkileyen faktörler: testin uzun olması, soruların açık ve anlaşılır olması, ayırt edicilik gücü artması ve testteki soru sayısı artmasıdır.
- Kullanışlılık, testi hazırlayan, uygulayan, cevaplayan ve puanlayan için kolay ve pratik olmasıdır.
- 21:13Ölçme Aracının Diğer Özellikleri
- Duyarlılık, ölçme aracındaki birimlerin küçüklüğü ve büyüklüğü ile ilgilidir; birim küçüldükçe duyarlılık ve güvenirlik artar.
- Kararlılık, ölçüm aracının uzun zaman aralığında birden fazla uygulaması sonucunda birbirine benzer sonuçlar vermesidir.
- Tutarlılık, bir testin kısa zaman aralığında birden fazla uygulanması ve benzer sonuçlar vermesidir; farklılık ise testte yer alan soruların birbiriyle ve testin tamamıyla uyumlu olmasıdır.
- 22:38Geçerlilik Türleri
- Kapsam geçerliliği, ölçüm aracının ölçülmek istenen hedef davranışların ne derece yeterli ve dengeli örnekledir.
- Yapı geçerliliği, teste yer alan maddelerin birbiriyle ve testin bütünüyle ilişkili olması ve aynı yapıyı oluşturması ile ilgilidir.
- Görünüş geçerliliği, testin her bir sorunun ölçmek istediği özelliği ölçebiliyor olarak görülmesidir.
- 24:08Yordama ve Uygunluk Geçerliliği
- Yordama geçerliliği, bilinmeyenler hakkında geleceği yönelik tahmin yapmaktır (örneğin KPSS puana bakılarak meslek hayatındaki başarısının tahmin edilmesi).
- Uygunluk geçerliliği, geçmişteki ya da şimdiki bir özellik ölçü kanıtlanmış test ile geçerli kanıtlanacak test aynı öğrenci grubuna uygulanır.
- Uygunluk geçerliliğinin korelasyon katsayısı en az 0,70 olması gerekir, düşük çıkması ölçülen özelliğin zaman içinde değişmesi veya tesadüf hatalarından kaynaklanabilir.
- 25:00Güvenilirlik Hesaplama Yöntemleri
- Test tekrar test yöntemi, aynı testin aynı gruba farklı zaman aralıklarında iki defa uygulaması sonucunda elde edilen puanlar arasındaki korelasyon katsayısı hesaplanarak güvenirlik hesaplanır.
- Eşdeğer formlar yöntemi, aynı davranışları ölçen fakat farklı soruların oluşan iki ayrı test hazırlanarak farklı zaman aralıklarında aynı gruba uygulanır.
- Eşdeğer yarılar yöntemi, test gruba bir defa uygulandıktan sonra test iki yarıya bölünerek öğrencinin her bir yerden aldıkları test puanları arasındaki korelasyon katsayısı hesaplanarak testin yarısının güvenilirliği hesaplanır.
- 27:09İç Tutarlılık Güvenirlik Yöntemleri
- K-20 yöntemi, test bir defa uygulandıktan sonra testi alan maddeler tek tek analiz ederek testi alan maddelerin birbir derece tutarlı ve uyumlu olduğunun belirlenmesi için kullanılır.
- K-21 yöntemi, testi oluşturan maddelerin güçlü dereceleri bilinmiyor ya da birbirine yakın ya da benzer olduğu durumlarda kullanılır.
- K-20, K-21'den daha kapsamlıdır ve daha güvenilir olacaktır.
- 28:45Test Hazırlama Süreci ve Test Yöntemleri
- Doğru yanlış testleri alt düzey davranışları ölçer, bilgi ve kavrama üzerindeki bilgileri ölçmekte kullanılır, şans başarısı en yüksek olan test türüdür.
- Boşluk doldurma testleri alt düzey davranışları ölçer, cevabı bir kelime, bir rakam ya da en fazla bir cümle verilir, şans başarısı yok denecek derecede azdır.
- Eşleştirmeli testler alt düzey davranışları ölçer, puanlaması objektiftir, sorular cevapları kendi içinde homojen bir şekilde dağıtılmalıdır.
- 30:24Yazılı ve Sözlü Yoklama
- Yazılı yoklama, soruların yazılı olarak verildiği cevaplarının yazılı olarak alındığı sınav türüdür, bilişsel alanın bütün basamaklarını ölçer.
- Sözlü yoklama, bilişsel alanın bütün basamaklarını ölçer, özellikle üst düzey zihinsel becerilerin ölçülmesinde etkilidir.
- Sözlü yoklama geçerli, güvenildiği ve objektifliği en düşük sınavdır, çok zaman alır ve puanlama güvenilirliği düşük olacaktır.
- 32:14Çoktan Seçmeli Testler
- Çoktan seçmeli testler, bilgi kavramı, uygulama ve analiz üzerindeki davranışları ölçüde etkilidir, geçerliliği ve güvenliği en yüksek sınavlardır.
- Sorunun sorulduğu bölüme madde kökü, soruya verilen muhtemel cevaplara seçenekler, doğru cevap dışında kalan seçenekleri de çeldirici denir.
- İlkokulda üç seçenekli, ortaokula dört seçenekli, lisede beş seçenekli maddeler kullanılır, beş seçenekli bir maddenin şans başarısı %20'dir.
- 33:17Ölçme Değerlendirme Teknikleri
- İş performans sesleri, laboratuvar dersleri, beden eğitimi, resim, müzik ve mesleki eğitim derslerine uygulanır ve öğrencilere kendi güçlü ve zayıf yönlerini inceleme imkanı sunar.
- Kontrol listesi süreci ölçer, belli kurallara uyup uymadığını ve davranış gösterip gösterilmediğini belirler, ancak davranışın kalitesini göstermez.
- Derece ölçekleri, davranışın derecesi ve düzeyini çok iyi, iyi, orta, kötü gibi kademelere ayırarak bilgi verir.
- 34:42Çeteleme Araçları ve Portfolyo
- Çeteleme araçları (gözden fişleri), gözlenecek davranışın sayısını (sıklığını) gösteren araçlardır ve davranışın yapılma sıklığı hakkında bilgi verir.
- Portfolyo, öğrencinin yıl boyunca yaptığı ödev ve çalışmaların örneklerinin bulunduğu, süreç içinde gelişimin değerlendirildiği bir araçtır.
- Portfolyo, öğrencinin nasıl düşündüğünü, ne öğrendiğini, analiz ettiğini ve sorduğu gibi sorulara cevap verir, güçlü ve zayıf yönlerini belirler ve öğrenme sorumluluğunu geliştirir.
- 36:17Tanılayıcı Dolanmış Ağaç ve Yapılandırılmış Gri Sorular
- Tanılayıcı dolanmış ağaçta, öğretmen tarafından hazırlanmış konuyla ilgili doğru-yanlış şeklinde sorular öğrencilere sorulur ve birbiriyle ilişkili sorular birbirinin devamı olur.
- Yapılandırılmış gri sorular, temelden ayrıntıya, genelden özele doğru gidecek şekilde yapılandırılır ve öğrencinin öğrenme eksikliklerini ve kavram yanılgılarını tespit etmede kullanılır.
- Bu tekniğin amacı öğrencinin bilgi seviyesini, öğrenme eksikliklerini ve kavramları tespit etmektir.
- 38:28Kelime İlişkilendirme Testi ve Diyagramı
- Kelime ilişkilendirme testinde, öğretmen konu ile ilgili en önemli anahtar kavramı seçer ve öğrenci belli bir süre içerisinde (çoğunlukla otuz saniye) cevap verir.
- Bu test kavram yanılgılarını tespit etmesinde kullanılır ve alt düzey zihinsel becerileri ölçer.
- Diyagramı, bilginin nasıl kazanılacağını ve bilgilerin yapılandırılma sürecini gösteren araçtır, öğrencileri deney ve etkinlik öncesinde araştırmaya sevk eder.
- 39:30Öz Değerlendirme ve Akran Değerlendirme
- Öz değerlendirme, öğrencinin belirlemiş ölçütler doğrultusunda kendi çalışmalarını, bilgi, beceri, tutum ve davranışlarını değerlendirmesidir.
- Akran değerlendirme, öğrencilerin arkadaşlarının hazırladığı ödev, proje, araştırma ve benzeri çalışmaları belli ölçütler doğrultusunda değerlendirmesidir.
- Performans değerlendirme, araç-gereç kullanma, deney ve benzeri becerilerin puanlama kriterleri kullanılarak değerlendirme sürecidir ve somut bir ürünle sonuçlanır.
- 40:10Performans Görevleri ve Proje Çalışmaları
- Performans görevleri, öğrencilere gerçek yaşamda karşılaşılabilecek problem durumları sunan ve üst düzey zihinsel becerilerin geliştirilmesi ve ölçülmesini hedefleyen etkinliklerdir.
- Proje çalışmaları, geniş içerikli ve uzun süre daha fazla yaratacak, üst düzey zihinsel beceri gerektiren uzun dönemli çalışmalardır.
- Proje çalışmaları bireysel ve grup yapılabilir, sınıf içi ve sınıf dışında uygulanabilir, disiplinler arası bağlantı kurularak derinlemesine öğrenme gerçekleşir.
- 40:48Rubrikler ve Otantik Değerlendirme
- Rubrikler, bir etkinliğin tamamının ve bölümlerinin nasıl puan alacağının ana hatlarıyla gösterildiği kriterler kümesidir ve öğretmen bu puanlama anahtarlarını sene başında vererek öğrencilere neler beklediğini netleştirir.
- Rubrikler analitik ve holistik olarak ikiye ayrılır; analitik rubrikler süreç değerlendirirken, holistik rubrikler ürün değerlendirir.
- Otantik değerlendirme, yapılan öğrenmelerin gerçek hayat durumları ile bağdaştırılması ve becerilerin değerlendirmesini kapsar.
- 42:40Kavram Haritaları
- Kavram haritaları, temel bir kavram etrafında ve bu temel kavramla ilgili diğer kavramları ve bunların birbiriyle ilişkisini gösteren iki boyutlu grafiksel araçlardır.
- Bu araçlar bilginin daha uzun süre hatırlanması ve daha verimli bir şekilde kullanılması için grafiklerle temsil edilir.
- Kavram haritaları konuların özetlenmesi, ölçme değerlendirme yapma, kavramların somutlaştırılmasında anlamlı öğrenmeyi sağlar ve kavram yanılgıların hem tespitinde hem de giderilmesinde kullanılan bir tekniktir.
- 43:28Merkezi İlim Ölçüleri
- Aritmetik ortalama, öğrencinin puanlarının toplamının öğrenci sayısına bölünmesiyle elde edilen değerdir ve uç değerlerden etkilenir.
- Medya (ortanca değer), küçükten büyüğe sıralanmış puanların tam ortada yer alan puana denir ve uç değerlerden etkilenmez.
- Mod, bir puan grubunda en çok tekrarlanan (frekansı en yüksek olan) ölçme sonucudur ve tüm grubu temsil etme özelliği zayıftır.
- 44:40Standart Sapma ve Varyans
- Standart sapma, öğrencilerin puanlarının aritmetik ortalamaya yakınlık ve uzaklığını gösteren bir değerdir ve yayılım ölçüleri içerisinde en güvenilir olanıdır.
- Standart sapma büyükse puanlar birbirine ve aritmetik ortalamaya uzaktır, grup heterojendir ve dağılım basıktır.
- Standart sapma küçükse puanlar birbirine ve aritmetik ortalama yakındır, grup homojendir ve dağılım sivridir.
- 47:14Madde İstatistikleri
- Madde küçük indeksi (PC), soruların kolaylığı ve zorluğu hakkında bilgi verir; 0,39 altında ise soru zordur.
- Madde ayırt edicilik indeksi (Rj), bir maddenin bilen ve bilmeyen öğrencileri birbirinden ayırt etme derecesidir ve -1 ile 1 arasında değişir.
- Bir maddenin testi alınabilmesi için ayırt ediciliğinin en az 0,30 olması gerekir, mükemmel ayırt edicilik derecesi ise 0,40 ve üzeri olacaktır.