Zeynep Gökmen Tez - Makine Öğrenmesi Yöntemleri ile Ortaokul Öğrencilerinin Başarılarının Değerlendirilmesi - 2023 PDF

Summary

Bu yüksek lisans tezi, makine öğrenmesi yöntemlerini kullanarak ortaokul öğrencilerinin akademik başarısını değerlendirmeyi amaçlıyor. Tez, öğrenci başarısını etkileyebilecek faktörleri ve bu faktörlerin tahmin modellerini inceliyor. Çalışma, 2023 yılında İstanbul Topkapı Üniversitesi'nde yapılmış.

Full Transcript

MAKİNE ÖĞRENMESİ YÖNTEMLERİ KULLANILARAK ORTAOKUL ÖĞRENCİLERİNİN BAŞARILARININ DEĞERLENDİRİLMESİ YÜKSEK LİSANS TEZİ ZEYNEP GÖKMEN Yazılım Mühendisliği Anabilim Dalı Yapay Zekâ Bilim Dalı MAKİNE ÖĞRENMESİ YÖNTEMLERİ KULLANILARAK ORTAOKUL ÖĞRENC...

MAKİNE ÖĞRENMESİ YÖNTEMLERİ KULLANILARAK ORTAOKUL ÖĞRENCİLERİNİN BAŞARILARININ DEĞERLENDİRİLMESİ YÜKSEK LİSANS TEZİ ZEYNEP GÖKMEN Yazılım Mühendisliği Anabilim Dalı Yapay Zekâ Bilim Dalı MAKİNE ÖĞRENMESİ YÖNTEMLERİ KULLANILARAK ORTAOKUL ÖĞRENCİLERİNİN BAŞARILARININ DEĞERLENDİRİLMESİ YÜKSEK LİSANS TEZİ ZEYNEP GÖKMEN 22221001002 Yazılım Mühendisliği Anabilim Dalı Yapay Zekâ Bilim Dalı Tez Danışmanı: Dr. Öğr. Üyesi Ali Haydar Eser ARALIK, 2023 KABUL VE ONAY ii AKADEMİK DÜRÜSTLÜK BEYANI Yüksek Lisans Tezi olarak sunduğum “Makine Öğrenmesi Yöntemleri Kullanılarak Ortaokul Öğrencilerinin Başarılarının Değerlendirilmesi” başlıklı çalışmanın, bilimsel ahlak ve geleneklere uygun olarak tarafımdan yazıldığını, yararlandığım eserlerin tamamının kaynaklarda gösterildiğini ve çalışmam içerisinde kullanıldıkları her yerde atıf yapıldığını belirtir ve onurumla doğrularım. 14.12.2023 Zeynep Gökmen iii TEŞEKKÜR Öncelikle bir kız çocuğuna Karadeniz’in ücra bir köyünden çıkıp öğretmen şansı veren ve akademik çalışmaları ile bilime katkıda bulunma imkânı sunan Ulu Önderimiz Mustafa Kemal Atatürk’e teşekkürlerimi borç bilirim. Tez çalışmam boyunca gerek bilgi birikimi gerek motivasyon desteği ile yardımlarını esirgemeyen değerli tez danışmanım Dr. Öğretim Üyesi Ali Haydar Eser’e ve eğitim hayatımın her aşamasında beni maddi manevi her zaman destekleyen aileme sonsuz teşekkür ederim. Zeynep Gökmen iv İÇİNDEKİLER KABUL VE ONAY.................................................................................................... ii AKADEMİK DÜRÜSTLÜK BEYANI................................................................... iii TEŞEKKÜR.............................................................................................................. iv İÇİNDEKİLER.......................................................................................................... v KISALTMALAR..................................................................................................... vii ŞEKİLLER LİSTESİ.............................................................................................. viii TABLOLAR LİSTESİ.............................................................................................. ix ÖZET........................................................................................................................... x ABSTRACT............................................................................................................... xi 1. GİRİŞ...................................................................................................................... 1 2. LİTERATÜR TARAMASI.................................................................................. 3 2.1. Çalışmanın Diğer Çalışmalardan Farkı.......................................................... 10 3. MATERYAL VE METOT................................................................................. 12 3.1. Materyal......................................................................................................... 12 3.1.1. Veri seti (data set)................................................................................. 12 3.2. Metot.............................................................................................................. 14 3.2.1. Makine öğrenmesi algoritmaları........................................................... 14 3.2.1.1. Random forest regression (rastgele orman regresyon)............ 14 3.2.1.2. Gradient boosting classifier (gradyan artırma sınıflandırıcısı) 15 3.2.1.3. Support vector machine (destek vektör makinesi)................... 15 4. UYGULAMA VE BULGULAR......................................................................... 17 4.1. Uygulama....................................................................................................... 17 4.1.1. Veri ön işleme....................................................................................... 17 4.1.2. Nitelik seçimi........................................................................................ 17 4.1.3. Değerlendirme metrikleri...................................................................... 18 4.1.3.1. Doğruluk (accuracy):.............................................................. 18 4.1.3.2. Kesinlik (precision):............................................................... 18 4.1.3.3. Duyarlılık (recall):.................................................................. 18 4.1.3.4. F1-score:................................................................................. 18 4.1.4. Sınıflandırma algoritmalarının modellenmesi...................................... 19 4.2. Bulgular.......................................................................................................... 25 4.2.1. Modellerin karşılaştırılması.................................................................. 25 v 5. SONUÇ VE ÖNERİLER.................................................................................... 27 5.1. Sonuç.............................................................................................................. 27 5.2. Öneriler........................................................................................................... 28 KAYNAKÇA............................................................................................................ 30 ÖZGEÇMİŞ.............................................................................................................. 35 vi KISALTMALAR RF : Random Forest GBC : Gradient Boosting Classifier SVM : Support Vector Machine TP : Gerçek pozitif -- Doğru Pozitif FP : Yanlış pozitif -- Yanlış Pozitif TN : Doğru Negatif -- Doğru Negatif FN : Yanlış negatif -- Yanlış Negatif RO : Rastgele Orman GAS : Gradyan Artırma Sınıflandırıcısı DVM : Destek Vektör Makinesi KNN : K-En Yakın Komşu DT : Karar Ağaçları CART : Classification And Regression Tree AutoML : Automated machine learning KÖAK : Korelasyon tabanlı öznitelik alt kümesi PISA : Uluslararası Öğrenci Değerlendirme Programı TIMSS : Uluslararası Matematik ve Fen Eğilimleri Araştırması vii ŞEKİLLER LİSTESİ Sayfa Şekil 3.1: Random Forest Regression Yapısı............................................................ 15 Şekil 3.2: Destek Vektör Makinesi Yapısı................................................................ 16 viii TABLOLAR LİSTESİ Sayfa Tablo 2.1: Literatür Taraması...................................................................................... 5 Tablo 3.1: Eğitim Veri Seti Nitelikleri ve Açıklamaları........................................... 12 Tablo 4.1: Random Forest Performans Sonuçları..................................................... 20 Tablo 4.2: Random Forest Başarıya Etki Eden Değişkenler..................................... 20 Tablo 4.3: Gradient Boosting Performans Sonuçları................................................ 22 Tablo 4.4: Gradient Boosting Başarıya Etki Eden Değişkenler................................ 22 Tablo 4.5: Support Vector Performans Sonuçları..................................................... 24 Tablo 4.6: Support Vector Özelliklerin Ağırlıkları................................................... 25 Tablo 4.7: Modellerin Karşılaştırılması.................................................................... 25 ix ÖZET MAKİNE ÖĞRENMESİ YÖNTEMLERİ KULLANILARAK ORTAOKUL ÖĞRENCİLERİNİN BAŞARILARININ DEĞERLENDİRİLMESİ Eğitimin hemen her kademesinde hedef öğrencilerin başarılı olmasıdır. Öğrenci başarısını arttırmak için ise başarıya etki eden unsurların tespit edilmesi ve ihtiyaç duyulan alanlarda öğrencilere destek verilmesi önem arz etmektedir. Bu çalışmada makine öğrenmesi yöntemleri kullanılarak öğrencilerin ders başarısına yüksek oranda etki eden değişkenler yardımıyla öğrencilerin yılsonu başarı durumlarını tahmin eden makine öğrenmesi modelleri geliştirilmiş ve bu modeller arası karşılaştırmalar yapılmıştır. Bu amaçla İstanbul Esenler’de resmî bir ortaokulda eğitim gören 307 7.sınıf öğrencisine başarıya etki edebileceği düşünülen soruların yer aldığı 31 soruluk bir anket uygulanmıştır. Anket cevapları temel alınarak ve öğrencilerin bir önceki dönem yılsonu notları kullanılarak makine öğrenimi algoritmaları yardımı ile başarı tahmini yapılmıştır. Başarı tahmininde Random Forest, Gradient Boosting Classifier, Support Vector Machine olmak üzere 3 farklı makine öğrenmesi algoritması kullanılmıştır. Çalışma sonucunda ankette yer alan ödevlerini düzenli yapıp yapmama, üniversite okumayı isteyip istememe, ders sırasında not alma, anne-babanın eğitim düzeyi değişkenlerinin yılsonu başarısını oldukça etkilediği görülmüştür. Başarı tahmininde en başarılı modelin %90 oranı ile Gradient Boosting Classifier algoritması kullanılarak geliştirilen model olduğu gözlemlenirken en başarısız modelin ise %82 oranı ile Support Vector Machine algoritması ile geliştirilen model olduğu gözlemlenmiştir. Daha erken bir aşamada başarı tahmini, kurumların öğrencilerin genel performansını artırabilen etkili öğrenme yaklaşımlarını göz önünde bulundurarak net kayıt yönergeleri oluşturmasına ve zayıf performanslardan kaçınmasına olanak sağlayacaktır. Anahtar kelimeler: yapay zekâ ve eğitim, kişiselleştirilmiş eğitim, makine öğrenmesi, akıllı eğitim x ABSTRACT EVALUATING THE ACHIEVEMENT OF SECONDARY SCHOOL STUDENTS BY USING MACHINE LEARNING METHODS The goal at almost every level of education is for students to be successful. In order to increase student success, it is important to identify the factors that affect success and provide support to students in areas where they are needed. In this study, using machine learning methods, machine learning models that predict students' end-of-year success status with the help of variables that have a high impact on students' course success were developed and comparisons were made between these models. For this purpose, a 31-question survey was applied to 307 7th grade students studying at a public secondary school in Esenler, Istanbul, including questions that were thought to affect success. Success prediction was made with the help of machine learning algorithms, based on the survey answers and using the students' end-of-year grades from the previous semester. Three different machine learning algorithms were used to predict success: Random Forest, Gradient Boosting Classifier and Support Vector Machine. As a result of the study, it was seen that the variables included in the survey, whether they do their homework regularly or not, whether they want to go to university or not, taking notes during class, and the education level of their parents, significantly affect the end-of-year success. It was observed that the most successful model in predicting success was the model developed using the Gradient Boosting Classifier algorithm with a rate of 90%, while the least successful model was the model developed with the Support Vector Machine algorithm with a rate of 82%. Predicting success at an earlier stage will enable institutions to establish clear enrollment guidelines and avoid poor performances, taking into account effective learning approaches that can improve students' overall performance. Keywords: artificial intelligence and education, personalised education, machine learning, smart education xi 1. GİRİŞ Eğitim, kişilerin topluma faydalı bir birey olabilmeleri için gerekli bilgi, beceri ve anlayışların kazandırıldığı planlı bir süreçtir (TDK, 2023). Eğitim sürecinde yaşanan aksaklıklar büyük ölçüde toplumun gidişatını etkilemektedir. Son yıllarda ülkemizde yapılan gerek ulusal sınavlarda gerekse PISA (Uluslararası Öğrenci Değerlendirme Programı) ve TIMSS (Uluslararası Matematik ve Fen Eğilimleri Araştırması) kapsamında yapılan uluslararası sınavlarda öğrencilerimizin sınav ortalamalarının oldukça düşük olduğu görülmektedir. Türkiye uluslararası sınavlarda averajın altında kalarak son sıralarda yer almaktadır (Acar, 2012; Sarıer, 2021). Bu sebeple öğrencilerimizin başarısını artırmak amacıyla pek çok proje ve çalışma yapılmaktadır (Fırat, 2019; Mahmut et al., 2020). Öğrencilerin ders başarısının artması için öncelikle başarıya etki eden değişkenlerin belirlenmesi ve bu değişkenlerin iyileştirilmesi önem arz etmektedir. Başarıyı etkileyen pek çok etmen vardır. Aile yaşantısı, anne babanın eğitim durumu, sosyoekonomik durum, çevre, okul, öğrencinin derse katılımı, öğrencinin başarılı olacağına inancı bu etmenlere örnektir (Dursun & Yüksel, 2004; Guven & Cabakcor, 2013). Makine öğrenmesi, algoritmaları veriler arasındaki kompleks ilişkileri en ince detaylarına kadar kavrayabilen, verilere dayalı yordamalar yapabilen, gerekli durumlarda karar verebilen algoritmalardır. Bu algoritmalar ile eğitim öğretim dönemi öncesinde performans tahmini yapılması potansiyel başarısızlığa karşı erken önlem alma imkânı tanıyacaktır. Hemen her alanda kullanılan makine öğrenmesi algoritmaları akademik başarının erken tahmininde de sıklıkla kullanılan yöntemlerden olmuştur (Agarwal, 2013). Makine öğrenmesi algoritmaları eğitimde pek çok alanda kullanılmaktadır. - Öğrenme Stillerinin Tespiti, - Kişiselleştirilmiş Eğitim (Akıllı Eğitim Sistemleri), - İçerik Geliştirme, - Ölçme Sistemleri, 1 - Diyalog Tabanlı Eğitim Sistemleri, - Eğitim Yönetimi, - Akademik Başarı Tahmini bunlardan bazılarıdır. Eğitimde veri madenciliği ve yapay zekâ algoritmalarının kullanılması; - Çeşitli analizlerle öğrenci düzeylerini belirlemede öğretmelere yardımcı olma, - Öğrencilerin zayıf veya güçlü yönlerine yönelik ilgi çekici materyal ve içerikler sunma, - Öğrencilerin performansını takip ederek değerlendirmelerde bulunma, - Dersi planlama aşamasında öğretmene destek olma, - Kişiselleştirilmiş eğitim platformları ile öğrencilerin hızına ve öğrenme stiline uygun içerikler sunma, gibi pek çok katkısı ile eğitimin kalitesini arttırmakta ve öğrencilerin daha verimli öğrenme deneyimleri kazanmasını sağlamaktadır. Başarıya etki eden etmenlerin eğitim dönemi öncesinde tespit edilmesi ve düşük performans göstermesi beklenen öğrencilere ihtiyaç duyduğu konularda destek verilmesi öğrencilerin başarısını arttıracaktır (Zeineddine et al., 2021). Bu çalışmada eğitim öğretim dönemi başında öğrencilere bir anket yapılmış ve ankette öğrenci başarısına etki edeceği düşünülen unsurlara yer verilmiştir. Yapılan anket cevapları temel alınarak makine öğrenmesi algoritmaları ile modeller oluşturulmuş ve ders başarısına yüksek oranda etki eden değişkenler belirlenmiştir. Ders başarısına yüksek oranda etki eden değişkenler yardımı ile de öğrencilerin başarı durumlarına yönelik tahminde bulunulmuştur. Başarı tahmininde e-okuldan alınan bir önceki dönem yılsonu genel başarı ortalamaları kullanılmıştır. Eğitim öğretim yılı başında öğrencilerin genel başarısının tahmin edilmesi düşük başarı göstermesi beklenen öğrencilere yönelik rehberlik çalışmaları yapılarak olası başarısızlığın engellenmesine imkân tanıyacaktır. 2 2. LİTERATÜR TARAMASI Makine öğrenmesi yöntemleri kullanılarak akademik başarının tahmin edilmesi konusunda yapılan literatür taramasında yurt içinde ve yurt dışında bu konuda pek çok çalışma yapıldığı görülmüştür. Irmak (2023), tez çalışmasında metin madenciliği yöntemleri ile uzaktan eğitimdeki sorunları tespit etmiştir. Veri seti olarak Türkiye’de bir devlet üniversitesinde görev yapan akademisyenlerin ve eğitim gören öğrencilerin uygulamalar üzerindeki yazışmaları kullanılmıştır. Çalışmada 6 farklı regresyon modeli kullanılmıştır. Sorun tespitinde en başarılı modelin yapay sinir ağları olduğu görülmüştür (Irmak & Ecevit Satı, 2022). Hussain ve Khan (2023), makine öğrenmesi kullanılarak ortaokul ve ortaöğretim düzeyindeki öğrencilerin akademik performansının tahmin edilmesi konulu çalışmada denetimli makine öğrenimi yaklaşımlarını kullanılarak öğrencilerin notlarına ve not tahminlerine odaklanmıştır. Bu araştırma çalışmasında kullanılan veri seti Peşaver, Khyber Pakhtunkhwa Ortaokul ve Ortaöğretim Kurulu'ndan (BISE) elde edilmiştir. Çalışmada 4 farklı algoritma kullanılmış ve çalışma sonunda not tahmininde en başarılı algoritmanın % 96,6 oranı ile Genetik Tabanlı Karar Ağacı algoritması olduğu görülmüştür (Hussain & Khan, 2023). Kye (2023), tez çalışmasında ABD üniversiteye kayıt tahmini modelleme için sınıflandırma performansının karşılaştırmalı analizi konusunda çalışmıştır. Çalışmada Midwest kentsel bölgesindeki kâr amacı gütmeyen bir üniversitenin 4 yıllık bir programına kabul edilen ve her biri 50 ilişkili özelliğe sahip 108.798 öğrenciye ilişkin yedi yıllık veri seti kullanmıştır. Öğrencilerin üniversiteye kayıt kararlarını tahmin etmek için 4 farklı regresyon modeli kullanılmıştır. Kayıt için üniversiteye gelen öğrencilerin verilerinden yola çıkarak kaydolma ihtimali düşük olanlar ve kesin kayıt olacaklar tahmin edilmiştir. Mevcut çalışmada destek vektör makinesi ve yapay sinir ağı modelleri üniversite için uygulanacak en iyi tahmin modelleri olarak tanımlanmıştır (Kye, 2023). 3 Baasha ve ark. (2022), yapay zekâ modelleri kullanılarak lisansüstü akademik performansın değerlendirilmesi konulu çalışmada Malezya'da özel bir üniversitenin lisansüstü eğitim programında eğitim gören 635 öğrencinin gerçek verileri veri seti olarak kullanılmıştır. Çeşitli regresyon algoritmaları yardımıyla öğrencilerin başarıları tahmin edilmiştir. Çalışmada 6 farklı regresyon algoritması kullanılmıştır. Çalışma sonunda yapay sinir ağları algoritmasının maksimum tahmin doğruluğu ile %89 oranında başarılı tahminler yaptığı görülmüştür (Baashar et al., 2022). Bastem (2021), tez çalışmasında makine öğrenimi ve istatistiksel yöntemler kullanarak öğrencilerin programlama dersindeki kazanım bilgileri ile başarı tahmini konusuna yoğunlaşmıştır. Çalışmada Kaggle’ın sitesinden indirilen Portekiz'de bulunan iki farklı okuldaki öğrencilere ait veri setini kullanılmıştır. 3 farklı regresyon algoritması ile başarı tahmini yapılmış ve en başarılı tahmin yapan modelin lojistik regresyon olduğu görülmüştür (Bastem, 2021). Abbasoğlu (2020), ortaokul öğrencilerinin akademik başarılarının eğitsel veri madenciliği yöntemleri ile tahmini konulu çalışmasında Yalova ilinde bulunan 4 farklı resmî ortaokulda eğitim gören öğrencilere ait sosyodemografik özelliklerin e-okul yönetim bilgi sisteminden alınmasıyla veri setini oluşturmuştur. 8 farklı regresyon algoritması kullanılarak başarı tahmini yapılmış ve en başarılı tahmin yapan algoritmanın lojistik regresyon olduğu görülmüştür (Bastem, 2021). Wakelam ve ark. (2020), minimum kullanılabilir niteliklere sahip küçük gruplarda öğrenci performansı tahmini potansiyeli konulu çalışmasında makine öğrenmesi algoritmalarının küçük guruplarda da işe yaradığını kanıtlamıştır. 23 kişilik üniversite son sınıf öğrenci grubu üzerinde yürütülen çalışmada Karar Ağacı, K-En Yakın Komşular ve Rastgele Orman modelleri kullanılmıştır. En başarılı tahminleri rastgele orman algoritmasının gerçekleştirdiği görülmüştür (Wakelam et al., 2020). Lau (2019), yapay sinir ağları kullanılarak öğrenci akademik performansının modellenmesi, tahmin edilmesi ve sınıflandırılması konulu çalışmasında Çin’deki bir üniversitede eğitim gören 175 kız ve 825 erkek olmak üzere toplam 1.000 lisans öğrencisine ait bilgileri veri seti olarak kullanmıştır. Öğrenci performansı, dört yıllık öğrenim süresi boyunca standartlaştırılmış genel not ortalaması kullanılarak belirlenmiştir. Çalışmada yapay sinir ağları kullanılarak makine öğrenmesi gerçekleştirilmiş ve başarılı sonuçlar elde edilmiştir (Lau et al., 2019). 4 Gök (2017), makine öğrenmesi yöntemleri ile akademik başarının tahmin edilmesi konulu çalışmasında Yalova’da bulunan 3 farklı ortaokuldaki öğrencilere uygulanan 24 soruluk bir anket sonucunda veri setini oluşturmuştur. Anket yardımıyla elde edilen veriler ve Matematik, Türkçe ve dönem sonu ortalamaları kullanılarak makine öğrenmesi gerçekleştirilmiştir. Notlar Milli Eğitim Bakanlığı puan ölçeğine göre 100’lük sistemin bölümlenmesi ile oluşturulmuştur. Çalışmada kullanılan 6 farklı regresyon modeli arasında puan tahmininde en iyi modelin Rastgele Orman Regresyonu not tahmininde ise Lojistik Sınıflandırma Algoritmasının en iyi başarımı gösterdiği görülmüştür (Gök, 2017). Makine öğrenmesi yöntemleri kullanılarak başarı tahmini konusunda yapılan akademik çalışmalar Tablo 2.1’de özetlenmiştir. Tablo 2.1: Literatür Taraması Yazar (Yıl) Çalışma Yöntemler Performans Odağı (Irmak Yapay Zekâ Destek Vektör Ön Lisans, Lisans & Ecevit Yöntemleri ile Uzaktan Makineleri, Yapay Sinir Satı, Eğitimdeki Sorunların Ağları, Lojistik 2022) Tespiti Ve Regresyon, Random Öğrencilerin Akademik Forest, K-En Yakın Performanslarının Komşu ve Naive (Basit) Tahmin Edilmesi Bayes Sınıflandırıcı (Christou Makine Öğrenimini Levenberg Marquardt Lisans et al., Kullanan Yüksek Geri Yayılım, Broyden, 2023) Öğrenim Öğrencileri Fletcher, Goldfarb ve İçin Performans ve Shanno Geri Yayılım, Erken Düşüş Tahmini Stokastik Gradyan İniş, RBF Tabanlı Sinir Ağı, Karar Ağacı, Bayes Ağı, Destek Vektör Makinesi Ve Sinir Ağı Yapısı (Hussain & Makine Öğrenmesi Karar Ağacı, Genetik Ortaokul ve Khan, Kullanılarak Ortaokul Tabanlı Karar Ağacı, K- Ortaöğretim 2023) ve Ortaöğretim En Yakın Komşular Düzeyindeki algoritması ve Genetik Öğrencilerin Akademik Tabanlı K-En Yakın Performansının Komşular Tahmin Edilmesi 5 Tablo 2.1: Literatür Taraması (Kye, ABD Üniversiteye Yapay Sinir Ağı, Karar Ortaöğretim 2023) Kayıt Tahmini Ağacı, Destek Vektör Modelleme İçin Makinesi, Lojistik Sınıflandırma Regresyon Performansının Karşılaştırmalı Analizi (Alkan, Akademik Başarının Lojistik Regresyon, Açık Üniversite 2023) Eğitsel Veri Linear Diskriminant Madenciliği Ve Analizi, Rastgele Orman, Makine Öğrenmesi K-En Yakın Komşu, Teknikleri Kullanılarak Karar Ağaçları, Destek Tahminlenmesi Vektör Makineleri ve Naive Bayes (Zilyas, Makine Öğrenmesi K-En Yakın Komşu, Ortaokul 2023) Yöntemi İle Eğitim Rastgele Orman, Lineer Başarısının Tahmini Regresyon, Bagged Trees, Modeli Gradient Boosting Regressor ve Karar Ağaçları (DT) (Civelek, Makine Öğrenmesi Yapay Sinir Ağları, K-En Lisans 2023) Yöntemleri İle Öğrenci Yakın Komşu Mezuniyet Notu Algoritması, Lineer Tahmini Regresyon, Destek Vektör Makineleri ve Karar Ağaçları (Bingül, Yapay Zekâ Destekli Random Forest, K- Ortaöğretim 2023) Makine Öğrenmesi Nearest Neighbors, Algoritmaları İle Destek Vektör Eğitsel Veri Makineleri, Logistic Madenciliği Alanında Regression Naive Bayes, Öğrencilerin Akademik Yapay Sinir Ağları, Karar Performanslarının Ağaçları Tahmin Edilmesi (Baashar et Yapay Zekâ Modelleri Sinir Ağları, En Küçük Lisansüstü al., 2022) Kullanılarak Kareler regresyonu, Lisansüstü Akademik Destek Vektör Performansın Makineleri, Karar Değerlendirilmesi Ağaçları, Gauss Süreç Regresyonu, Topluluk Modelleri 6 Tablo 2.1: Literatür Taraması (Çelik, Makine Öğrenmesi ile Rasgele Orman, K-En Ortaöğretim 2022) Lise Öğrencilerine Yakın Komşu, Destek Mesleki Alan Seçim Vektör Makineleri, Rehberi Gradyan Arttırma Maki- neleri, Aşırı Gradyan Arttırma, Hafif Gradyan Arttırma Makineleri, CatBoost, Yapay Sinir Ağları, Sınıflandırma ve Regresyon Ağaçları, Doğrusal Ayrım Analizi, Hiyerarşik Kümeleme (Kaya, Makine Öğrenmesi Karar Ağacı, Naive Bayes Ortaokul, 2022) Algoritmaları Çok Katmanlı Algılayıcı, Ortaöğretim, Lisans Kullanarak Azaltılmış, En Yakın Öğrencilerin Akademik Komşu Hata Budaması, Başarısını Etkileyen Destek Vektör Makineleri, Faktörlerin Tespit Yapay Sinir Ağları, Sıralı Edilmesi Minimal Optimizasyon, Rastgele Orman, Karar Tabloları, Sinir Ağı, (Duralioğlu, Makine Öğrenimi ve Doğrusal Regresyon, K- Ortaöğretim 2022) İstatistiksel Yöntemler En Yakın Komşu ve Kullanarak Karar Ağacı Öğrencilerin Programlama Dersindeki Kazanım Bilgileri ile Başarı Tahmini (Hasib et Ortaokul Öğrencisi Lojistik Regresyon, En Ortaokul al., 2022) Performansını Tahmin Yakın Komşu, Destek Etmeye Yönelik Vektör Makineleri, Makine Öğrenimi ve Xgboost ve Naive Bayes Açıklanabilir Yapay Zekâ Yaklaşımı (Bujang Denetimli Makine Karar Ağacı, Rastgele Lisans et al., Öğrenimi ile ÖğrencilerinOrman, Destek Vektör 2021) Not Tahmini İçin Makinesi, Lojistik Kestirimci Analitik Regresyon Modeli 7 Tablo 2.1: Literatür Taraması (Yağcı, Eğitsel Veri Rastgele Ormanlar, En Lisans 2022) Madenciliği: Makine Yakın Komşu, Destek Öğrenimi Vektör Makineleri, Algoritmalarını Lojistik Regresyon, Naive Kullanarak Bayes Ve K-En Yakın Öğrencilerin Akademik Komşu Performansının Tahmini (Koç & Liseye Giriş Sınavı Destek Vektör Regresyonu, Ortaokul Akın, Başarı Oranlarının Rastgele Orman, Karar 2022) Makine Öğrenmesi ve Ağacı Ve Beta Regresyon Beta Regresyon Modellerini Kullanarak Tahmin Edilmesi (Yavuzarsla Öğrenme Yönetim KNN, Naive Bayes, SVM, Lisans n & Erol, Sistemi Log Kayıtlarının CART ve C5.0 2022) Akademik Başarı Tahmininde Kullanılması (Bastem, Makine Öğrenme Karar Ağacı, Rastgele Ortaöğretim, 2021) Algoritmaları Orman ve Lojistik Lisans Kullanılarak Yapay Zekâ Regresyon Yoluyla Öğrencı̇ Akademik Performans Tahmini (Aghalarova Önerilen Yapay Sinir AutoML, KNN ve SVM Ortaokul & Bozkurt Ağı Algoritması ile Keser, 2021) Ortaokul Öğrencilerin Akademik Performansının Tahmini (Kanchana Öğrencilerin Akademik SVM, Naive Bayes ve Lisans et al., 2021) Performansının Erken Karar Ağacı Tahminine Yönelik Veri Madenciliği Yaklaşımı (Buraimoh et Makine Öğrenimi Doğrusal Diskriminant - al., 2021) Tekniklerinin Öğrenci Analizi, Lojistik Başarısının Tahminine Regresyon, Sınıflandırma Uygulanması ve Regresyon Ağacı, K-En Yakın Komşu, Naive Bayes, SVM 8 Tablo 2.1: Literatür Taraması (Abbasoğlu, Ortaokul Öğrencilerinin Lojistik Regresyon, Ortaokul 2020) Akademik Başarılarının Doğrusal Destek Vektör Eğitsel Veri Madenciliği Makineleri, Doğrusal Yöntemleri ile Tahmini Olmayan Destek Vektör Makineleri, Rastgele Orman, Naive Bayes, Bagging, K-En Yakın Komşu, Yapay Sinir Ağları (Selvi, Bilecik İlinde Karar Ağaçları, Yapay Ortaokul ve 2020) İlköğretimden Liseye Sinir Ağları, Bayes Ortaöğretim Geçiş Sınavlarında Sınıflandırması, Destek Makine Öğrenmesi Vektör Makineleri, K-En Yöntemleri ile Öğrenci Yakın Komşu, Genetik Başarısının Tahmini Algoritmalar (Haridas et Akıllı Bir Özel Ders Karar Ağacı, Lojistik - al., 2020) Sisteminden Okul Regresyon, Sinir Ağları, Performansını Ve Erken SVM, KNN ve Rastgele Başarısızlık Riskini Orman Tahmin Etmek (Wakelam Minimum Kullanılabilir Karar Ağacı, K-En Yakın Lisans et al., 2020) Niteliklere Sahip Küçük Komşu ve Rastgele Orman Gruplarda Öğrenci Performansı Tahmini Potansiyeli (Hashim et Denetimli Makine Karar Ağacı, Naive Bayes, Lisans al., 2020) Öğrenimi Lojistik Regresyon, Destek Algoritmalarına Dayalı Vektör Makinesi, K-En Öğrenci Performansı Yakın Komģu, Sıralı Tahmin Modeli Minimal Optimizasyon ve Sinir Ağları Algoritmalarının (Lau et al., Yapay Sinir Ağları Yapay Sinir Ağları Lisans 2019) Kullanılarak Öğrenci Akademik Performansının Modellenmesi, Tahmin Edilmesi ve Sınıflandırılması 9 Tablo 2.1: Literatür Taraması (Tomasevic Öğrenci Sınav K-En Yakın Komşular, Açık Üniversite et al., 2020) Performansı Tahmini Destek Vektör Makineleri, İçin Denetimli Veri Yapay Sinir Ağları, Karar Madenciliği Tekniklerine Ağaçları, Bayesian Genel Bakış ve Regresyon, Naif Bayes ve Karşılaştırma Lojistik Regresyon (Ulutan, Teog Fen Bilgisi Çok Düzeyli Regresyon Ortaokul 2018) Başarısını Etkileyen Analizi Değişkenlerin Çok Düzeyli Regresyon Modeli İle İncelenmesi (Miguéis et Öğrencilerin akademik Rastgele Ormanlar, Karar Lisans al., 2018) performanslarına göre Ağaçları, Destek Vektör erken segmentasyonu: Makineleri, Naif Bayes, Tahmine dayalı bir Torbalı modelleme yaklaşımı Ağaçlar ve Uyarlanabilir Güçlendirme Ağaçlar (Gök, Makine Öğrenmesi Naive Bayes K-En Yakın Ortaokul 2017) Yöntemleri İle Akademik Komşular, Doğrusal Destek Başarının Tahmin Vektör Makineleri, Radyal Edilmesi Tabanlı DVM ve Rastgele Orman, Lojistik (Aydemir, Veri Madenciliği Yapay Sinir Ağları, Ön Lisans 2017) Yöntemleri Kullanarak Genetik Algoritmalar, Meslek Yüksek Okulu Bayes Sınıflandırması, Öğrencilerinin Akademik Karar Ağaçları, K-En Başarı Tahmini Yakın Komşu, Destek Vektör Makineleri, 2.1. Çalışmanın Diğer Çalışmalardan Farkı - Veri seti daha önce kullanılmamış araştırmacı tarafından elde edilen orijinal bir veri setidir. - Anket yardımı ile elde edilen başarıya etki eden değişkenler diğer çalışmalarla kıyaslandığında farklılıklar görülmektedir. 10 - Öğrencilerin akademik başarısını tahmin etmeye yönelik yapılan çalışmalarda genellikle çalışma grubu olarak lisans, ön lisans ve lisansüstü öğrencilerin tercih edildiği görülmektedir. Bu çalışmada çalışma grubu olarak ortaokul öğrencileri tercih edilmiştir. 11 3. MATERYAL VE METOT Bu çalışmada öğrencilerden anket yoluyla toplanan orijinal veriler işlenerek veri yapıları ve formatı dönüştürüldü. Daha sonra farklı tahmin modelleri üretmek için python kullanılarak çeşitli sınıflandırma algoritmaları uygulandı. Son olarak model performansı, tahmine dayalı karar vermenin verimliliği ve doğruluğuna göre değerlendirildi. 3.1. Materyal 3.1.1. Veri seti (data set) Bu çalışmada kullanılan veri seti İstanbul Esenler’de bulunan bir ortaokuldaki 7.sınıf öğrencilerine uygulanan 31 soruluk anket sonucunda elde edilmiştir. Öğrencilere yapılan anket ile ilgili gerekli izinler alınmıştır. Eğitim veri seti 31 nitelik ve 307 örnekten oluşmaktadır. Veri seti, çalışmaya konu olan öğrencilerin 6. sınıf yılsonu başarı ortalaması kullanılarak başarı tahmini yapılması üzerine oluşturulmuş yapıdadır. Çalışmadaki bağımlı değişken öğrencilerin yılsonu başarı ortalaması olarak belirlenmiştir. Çalışmada kullanılan veri setine ait nitelikler Tablo 3.1’ de gösterilmiştir. Tablo 3.1: Eğitim Veri Seti Nitelikleri ve Açıklamaları Özellik Açıklama Cinsiyet Öğrenci cinsiyeti Yaş Öğrenci yaşı Ev Durum Öğrencinin yaşadığı evin kira olup olmaması Oda Öğrencinin ders çalışmak için kendine ait bir alanın olup olmaması Anne-Baba Durum Öğrencinin anne babasının hayatta olup olmaması ve birliktelik durumu Yaşam Öğrencinin kimle birlikte yaşadığı 12 Tablo 3.1: Eğitim Veri Seti Nitelikleri ve Açıklamaları Kardeş Öğrenci kardeş sayısı Aeğitim Annenin eğitim durumu Beğitim Babanın eğitim durumu Agelir Ailenin gelir düzeyi Öçalışma Öğrencinin okul saatleri dışında her hangi bir işte çalışma durumu Kişi Sayısı Öğrenci ile aynı evde yaşayan kişi sayısı Uzaklık Öğrencinin okula ulaşmak için harcadığı süre H.içi Ders Çalışma Öğrencinin okul dışında hafta içi günlük ortalama ders çalışma süresi H.sonu Ders Çalışma Öğrencinin okul dışında hafta sonu günlük ortalama ders çalışma süresi Öğrenme Yöntemi Öğrencinin öğrenmek için tercih ettiği yöntem Destekleme ve Yetiştirme Öğrencinin hafta sonu yapılan destekleme ve Kurslarına Katılım yetiştirme kurslarına katılıp katılmadığı Üniversite Okuma İsteği Öğrencinin üniversite okumak isteyip istememesi İnternet Erişimi Öğrencinin yaşadığı evde internet erişiminin olup olmaması Teknoloji ile Geçirilen Vakit Öğrencinin günlük televizyon/ tablet/ bilgisayar veya telefon ile geçirdiği süre ( Oyun ve eğlence amacıyla) Okul Öncesi Eğitim Öğrencinin okul öncesi eğitim alıp almadığı Öz Yeterlilik Öğrencinin çalışırsa başarılı olacağına inancı Zihinsel Yeterlilik Öğrencinin zihinsel olarak kendini nasıl hissettiği Tekrar Öğrencinin okuldan sonra o gün işlenen dersleri tekrar etme durumu Ödev Öğrencinin ödevlerini düzenli yapma durumu Aile Başarı İnancı Öğrencinin ailesinin öğrencinin başarılı olacağına inancı Not Alma Öğrencinin ders sırasında not alma durumu Odaklanma Öğrencinin ders sırasında derse odaklanma durumu 13 Tablo 3.1: Eğitim Veri Seti Nitelikleri ve Açıklamaları Devamsızlık Öğrencinin okuldaki devamsızlık durumu Sınav Kaygısı Öğrencinin sınavlarda başarısız olma kaygısı Uyku Saati Öğrencinin günlük ortalama uyku saati 3.2. Metot Bu tez çalışmasında Python programlama dili ve makine öğrenmesi algoritmaları kullanılarak öğrencilerin akademik başarısı tahmin edilecektir. Başarı tahmininde sınıflandırma algoritmaları kullanılacaktır. Kullanılan algoritmalar: - Random Forest Regression (Rastgele Orman Regresyon) - Gradient Boosting Classifier (Gradyan Artırma Sınıflandırıcısı) - Support Vector Machine (Destek Vektör Makinesi) 3.2.1. Makine öğrenmesi algoritmaları Regresyon çıktı ve çıktıyı etkileyen değişkenler arasındaki ilişkiyi tahmin etmeye yönelik istatistiksel yöntemlerin tümüdür(Yildiz et al., 2017). Bu çalışmada öğrencilerin başarısını etkileyen değişkenler yardımı ile Random Forest (RF), Gradient Boosting Classifier (GBC) ve Support Vector Machine (SVM) olmak üzere 3 farklı algoritma kullanılarak başarı tahmini yapılmıştır. 3.2.1.1. Random forest regression (rastgele orman regresyon) Rastgele Orman modelleme sonuçları için rastgele seçilen eğitim veri kümeleri ve tahmin değişkenlerinin rastgele alt kümeleri kullanılarak birçok sınıflandırma ve regresyon ağacı oluşturulur (Breiman, 2001). Her ağaçtan elde edilen sonuçlar, her gözlem için bir tahmin vermek amacıyla toplanır. Bu nedenle, rastgele orman, ağaç modellerinin bazı yararlı niteliklerini (örneğin, tahmin ediciler ve sonuç arasındaki ilişkileri yorumlama yeteneği) korurken, tek bir karar ağacı modeline kıyasla genellikle daha yüksek doğruluk sağlar (Speiser et al., 2019). Şekil 3.1’de Random Forest Regression yapısı gösterilmiştir. 14 Şekil 3.1: Random Forest Regression Yapısı Kaynak: (Zilyas, 2023) 3.2.1.2. Gradient boosting classifier (gradyan artırma sınıflandırıcısı) Gradyan Artırma Sınıflandırıcısı yanıt değişkeni daha doğru bir tahmin sağlamak için art arda yeni modellere uyarlar (Natekin & Knoll, 2013). Yinelenen bir şekilde tahmin modellerini belirli kurallarla birleştirerek güçlü tahmin modellerini bulmaya çalışır. İlk yineleme anında tahminler üreten f1 işlevi oluşturulmaktadır. Tahminler ile hedefler arasındaki değer farkı hesaplanarak farklılıklar için bir f2 işlevi oluşturulmaktadır. İkinci kez yineleme yapıldığında f1 ve f2 işlevleri ile yeniden tahminler ve hedefler arasındaki fark birleştirilir. Bu işlem tekrarlanarak f1 işlevinin başarısı sürekli eklenerek tahminler ve hedefler arasındaki farklılık sıfıra indirilmeye çalışılır (Friedman, 2001; Sönmez Sarıkaya, 2020) 3.2.1.3. Support vector machine (destek vektör makinesi) Destek Vektör Makinesi (DVM), çok boyutlu özellik vektörlerinin ikili sınıflandırmasını gerçekleştirmek için tasarlanan bir algoritmadır. DVM başlangıçta iki sınıflı doğrusal verilerin sınıflandırılmasında kullanılırken daha sonra geliştirilerek çok sınıflı doğrusal olmayan verilerin sınıflandırılmasında kullanılmaya başlanmıştır. Çalışma prensibi olarak sınıfları birbirinden ayıran en uygun fonksiyonun tahmin edilmesi, sınıfların birbirinden ayrılabilmesi için en uygun karar fonksiyonlarının hiper düzlemde tanımlanması temeline dayanmaktadır (Kavzoğlu & Çölkesen, 2010), (Hearst et al., 1998). Şekil 3.2’de Destek Vektör Makinesi yapısı gösterilmiştir. 15 Destek Vektör Makinesi Şekil 3.2: Destek Vektör Makinesi Yapısı Kaynak: (Civelek, 2023) 16 4. UYGULAMA VE BULGULAR 4.1. Uygulama Millî Eğitim Bakanlığı Okul Öncesi Eğitim Ve İlköğretim Kurumları Yönetmeliği Sekizinci Bölüm Madde 53’de kapsamında dönem sonu tüm derslerin ağırlıklı ortalaması 70-84.99 olanlar “Teşekkür”, 85-100 olanlar “Takdir” belgesi ile ödüllendirilmektedir (MEB, 2014). Bu madde kapsamında veri setimizdeki bağımlı değişken olan tüm dersler ağırlıklı yılsonu başarı ortalaması 70 ve üzeri olan öğrenciler “başarılı”, yılsonu başarı ortalaması 70’in altında olan öğrenciler “başarısız” olarak nitelendirilerek sınıflandırma yapılmıştır. 4.1.1. Veri ön işleme Yaptığımız çalışmada ankette sorulan soruların cevapları genellikle kategorik nitelik taşımaktadır. Fakat makine öğrenmesi algoritmaları kategorik yapılı veriler üzerinde doğrudan çalışmamaktadır. Bu sebeple string özellik taşıyan cevaplar One Hot Encoding yöntemi ile sayısal veriye dönüştürülmüştür. Sayısal veriye dönüşen veriler eğitim ve test şeklinde ikiye ayrılarak çeşitli algoritmalar kullanılarak makine öğrenmesi gerçekleştirilmiştir. 4.1.2. Nitelik seçimi Öğrenci başarısı tahmininde nitelik seçiminde korelasyon tabanlı öznitelik alt kümesi (Correlation-based Feature Subset Evaluation - KÖAK) yöntemini tercih edilmiştir. Öğrencinin bir önceki dönem yılsonu başarısı ile ankette belirlenen nitelikler arasında yüksek korelasyon değeri bulunanlar yardımıyla başarı tahmini yapılmıştır. Korelasyona bağlı nitelik seçimine göre öğrenci başarısına en çok etki eden değişkenlerin ödevleri düzenli yapıp yapmama, üniversite okumayı isteyip istememe, ders sırasında not alma, anne-babanın eğitim düzeyi olduğu görülmüştür. Korelasyon değeri yüksek olan değişkenler yardımı ile makine öğrenmesi gerçekleştirilmiş ve başarı tahmini yapılmıştır. 17 4.1.3. Değerlendirme metrikleri Sınıflandırma sonucunda her bir algoritma için Doğruluk (accuracy), kesinlik (precision), duyarlılık (recall), F1-Score değerlerine göre kullanılan algoritmaların başarı oranları hesaplanmış ve kıyaslamalar yapılmıştır. 4.1.3.1. Doğruluk (accuracy): Doğru yapılan tahminlerin sayısının tüm yapılan tahminlerin sayısına bölünmesiyle bulunur. Doğruluk formülü aşağıda gösterilmiştir (Coşkun & Baykal, 2011). 𝑇𝑃 + 𝑇𝑁 𝐷𝑜ğ𝑟𝑢𝑙𝑢𝑘 = 𝑇𝑃 + 𝐹𝑃 + 𝑇𝑁 + 𝐹𝑁 TP (Gerçek pozitif -- Doğru Pozitif): Başarılı öğrenciye başarılı demektir. FP (Yanlış pozitif -- Yanlış Pozitif): Başarısız öğrenciye başarılı demektir. TN (Doğru Negatif -- Doğru Negatif): Başarısız öğrenciye başarısız demektir. FN (Yanlış negatif -- Yanlış Negatif): Başarılı öğrenciye başarısız demektir. 4.1.3.2. Kesinlik (precision): Pozitif tahmin edilen örneklerden kaçının doğru tahmin edildiğinin oranlanmasıdır. Kesinlik formülü aşağıda gösterilmiştir (Coşkun & Baykal, 2011). 𝑇𝑃 𝐾𝑒𝑠𝑖𝑛𝑙𝑖𝑘 = 𝑇𝑃 + 𝐹𝑃 4.1.3.3. Duyarlılık (recall): Pozitif tahmin edilmesi gereken örneklerin oranlanıp ne kadarının doğru tahmin edildiğini gösterir. Duyarlılık formülü aşağıda gösterilmiştir (Coşkun & Baykal, 2011). 𝑇𝑃 𝐷𝑢𝑦𝑎𝑟𝑙𝚤𝑙𝚤𝑘 = 𝑇𝑃 + 𝐹𝑁 4.1.3.4. F1-score: F1 skoru duyarlılık ve kesinlik değerlerini birleştirip tek sayıya indirgemektedir. F1-Score formülü aşağıda gösterilmiştir (Coşkun & Baykal, 2011). 2𝑥𝑃𝑥𝑅 𝐹1 − 𝑆𝑐𝑜𝑟𝑒 = 𝑃+ 𝑅 P: Kesinlik (Precision) R: Duyarlılık (Recall) 18 F1 skoru, elimizde birden çok modelin doğruluk ve kesinlik değerleri olduğunda değerler arasından en iyi modelin seçilmesi için kullanılır. F1 skoru en çok 1 değerini alabilirken en düşük değer olarak da 0 değerini alabilmektedir. 4.1.4. Sınıflandırma algoritmalarının modellenmesi Bu çalışmada 7.sınıf öğrencilerinin yılsonu başarılarının tahmin edilmesi amacıyla Random Forest Regression (Rastgele Orman Regresyon), Gradient Boosting Classifier (Gradyan Artırma Sınıflandırıcısı), Support Vector Machine (Destek Vektör Makinesi) algoritmaları kullanılmıştır. 4.1.4.1. Random forest regression (rastgele orman regresyon) modelinin performans ölçütü Öncelikle One Hot Encoding yöntemi ile sayısal veriye dönüştürülen veri seti eğitim ve test seti olmak üzere rasgele olarak iki gruba ayrılmıştır. Random forest model eğitimi kodları model = RandomForestClassifier(random_state=42) model.fit(X_train, y_train) Komutları ile Rastgele Orman algoritması ile makine öğrenmesi gerçekleştirilmiştir. Algoritmanın performans değerleri aşağıdaki komutlar yardımı ile hesaplanmıştır. Random forest performansı değerlendirmesi (kodları) accuracy = accuracy_score(y_test, y_pred) precision = precision_score(y_test, y_pred) recall =recall_score(y_test, y_pred) f1 = f1_score(y_test, y_pred) Random forest performans metriklerinin gösterimi print(f'Model Accuracy: {accuracy}') print(f'Model Precision: {precision}') print(f'Model Recall: {recall}') print(f'Model F1-Score: {f1}') 19 Random Forest algoritması ile gerçekleştirilen makine öğrenmesi sonuçları Tablo 4.1’de verilmiştir. Tablo 4.1: Random Forest Performans Sonuçları Random Forest Regression (Rastgele Orman Regresyon) Modelinin Performans Sonuçları Model Accuracy (Doğruluk): 0.8548 Model Precision (Kesinlik): 0.8780 Model Recall (Duyarlılık) : 0.9 Model F1-Score (F1 Sonucu) : 0.8888 Random Forest algoritmasına göre başarıya etki eden değişkenlerin önem sırasına alınması ve sıralanması feature_importances = model.feature_importances_ sorted_feature_importance = sorted(feature_importance_dict.items(), key=lambda x: x, reverse=True) Random Forest algoritması ile oluşturulan modelde öğrencilerin başarısına en çok etki eden ilk 10 değişken Tablo 4.2’ de listelenmiştir. Tablo 4.2: Random Forest Başarıya Etki Eden Değişkenler Rastgele Orman Modeline Göre Öğrencilerin Yılsonu Başarısına En Çok Etki Eden Değişkenler 1 Ödevlerin düzenli yapımı 0.0449 2 Üniversite okumayı isteme 0.0383 (hedef belirleme) 3 Sınıfta derse konsantre olabilme 0.0279 4 Ders sırasında not alma 0.0226 5 Annenin eğitim durumu 0.0192 6 Öğrenmek için tercih edilen yöntem 0.0188 Her ikisi(Görsel/ Yazılı) 20 Tablo 4.2: Random Forest Başarıya Etki Eden Değişkenler 7 Evinizin durumu (kendimize ait) 0.0162 8 Ailenin başarıya inancı (ailem başarılı 0.0156 olacağıma inanır) 9 Anaokuluna gitme durumu (Evet) 0.0149 10 Sınav kaygısı (Orta) 0.01450 4.1.4.2. Gradient boosting classifier (gradyan artırma sınıflandırıcısı) modelinin performans ölçütü One Hot Encoding yöntemi ile sayısal veriye dönüştürülen veri seti eğitim ve test seti olmak üzere rasgele olarak iki gruba ayrılmıştır. Gradient Boosting Model Eğitimi model = GradientBoostingClassifier(random_state=42) model.fit(X_train, y_train) Komutları ile Gradient Boosting algoritması ile makine öğrenmesi gerçekleştirilmiştir. Algoritmanın performans değerleri aşağıdaki komutlar yardımı ile hesaplanmıştır. Gradient Boosting Performansı Değerlendirmesi: accuracy = accuracy_score(y_test, y_pred) precision = precision_score(y_test, y_pred) recall = recall_score(y_test, y_pred) f1 = f1_score(y_test, y_pred) Gradient Boosting Performans metriklerinin gösterimi print(f'Model Doğruluğu: {accuracy}') print(f'Model Precision: {precision}') print(f'Model Recall: {recall}') print(f'Model F1-Score: {f1}') 21 Gradient Boosting algoritması ile gerçekleştirilen makine öğrenmesi sonuçları Tablo 4.3’de verilmiştir. Tablo 4.3: Gradient Boosting Performans Sonuçları Gradient Boosting Classifier (Gradyan Artırma Sınıflandırıcısı) Modelinin Performans Sonuçları Model Accuracy (Doğruluk): 0.9032 Model Precision (Kesinlik): 0.9047 Model Recall (Duyarlılık) : 0.95 Model F1-Score (F1 Sonucu) : 0.9268 Gradient Boosting algoritmasına göre başarıya etki eden değişkenlerin önem sırasına alınması ve sıralanması feature_importances = model.feature_importances_ sorted_feature_importance = sorted(feature_importance_dict.items(), key=lambda x: x, reverse=True) Gradient Boosting algoritması ile oluşturulan modelde öğrencilerin başarısına en çok etki eden ilk 10 değişken Tablo 4.4’ de listelenmiştir. Tablo 4.4: Gradient Boosting Başarıya Etki Eden Değişkenler Gradient Boosting Modeline Göre Öğrencilerin Yılsonu Başarısına En Çok Etki Eden Değişkenler 1 Ödevlerin düzenli yapımı 0.1674 2 Annenin eğitim durumu 0.0555 3 Üniversite okumayı isteme 0.0523 (hedef belirleme) 4 Ders sırasında not alma 0.0365 5 Anaokuluna gitme durumu (Evet) 0.0356 6 Yaş (13) 0.0269 22 Tablo 4.4: Gradient Boosting Başarıya Etki Eden Değişkenler 7 Öğrenmek için tercih edilen yöntem 0.0263 Her ikisi(Görsel/ Yazılı) 8 Zihinsel olarak kendini nasıl 0.0256 hissediyorsun? (Çok iyi) 9 Sınıfta derse odaklanabilme (Genellikle) 0.0234 10 Evinizin durumu (kira) 0.0227 4.1.4.3. Support vector machine (destek vektör makinesi) modelinin performans ölçütü One Hot Encoding yöntemi ile sayısal veriye dönüştürülen veri seti eğitim ve test seti olmak üzere rasgele olarak iki gruba ayrılmıştır. Support Vector Model Eğitimi model = SVC(kernel='linear', random_state=42) model.fit(X_train, y_train) Komutları ile Support Vector algoritması ile makine öğrenmesi gerçekleştirilmiştir. Algoritmanın performans değerleri aşağıdaki komutlar yardımı ile hesaplanmıştır. Support Vector Performansı Değerlendirmesi: accuracy = accuracy_score(y_test, y_pred) precision = precision_score(y_test, y_pred) recall = recall_score(y_test, y_pred) f1 = f1_score(y_test, y_pred) Support Vector Performans metriklerinin gösterimi print(f'Model Doğruluğu: {accuracy}') print(f'Model Precision: {precision}') print(f'Model Recall: {recall}') print(f'Model F1-Score: {f1}') 23 Support Vector algoritması ile gerçekleştirilen makine öğrenmesi sonuçları Tablo 4.5’ de verilmiştir. Tablo 4.5: Support Vector Performans Sonuçları Support Vector Machine (Destek Vektör Makinesi) Modelinin Performans Sonuçları Model Accuracy (Doğruluk): 0.8225 Model Precision (Kesinlik): 0.8717 Model Recall (Duyarlılık) : 0.85 Model F1-Score (F1 Sonucu) : 0.8607 Support Vector Machine Ağırlık Büyüklüğü (Magnitude): Support Vector Machine algoritmasının modellenmesinde bir özelliğin ağırlığı ne kadar büyük olursa o özellik tahminde o kadar etkili olmaktadır. Özelliğin ağırlığı büyük olduğunda modelin tahminine daha fazla katkı sunmaktadır. Support Vector Machine Ağırlık İşaretleri (Sign): Belirli bir özellik artınca tahminin artması ya da azalması hakkında bilgi vermektedir. Pozitif ağırlık özellik arttıkça tahminin artması anlamına gelirken; negatif ağırlık özellik arttıkça tahminin azalması anlamına gelmektedir. Support Vector algoritması ağılık büyüklüğünün hesaplanması ve sıralanması ilgili komutlar aşağıda verilmiştir. if hasattr(model, 'coef_'): feature_weights = model.coef_.flatten() sorted_feature_weight = sorted(feature_weight_dict.items(), key=lambda x: x, reverse=True) Özelliklerin ağırlıkları hesaplanarak tahmine en çok etki eden ilk 10 özellik ve etki oranları aşağıda Tablo 4.6’ de belirtilmiştir. 24 Tablo 4.6: Support Vector Özelliklerin Ağırlıkları Support Vector Machine (Destek Vektör Makinesi) Özelliklerin Ağırlıkları Özellik Etki Oranı 1 Okul dışında hafta içi ders çalışma süresi 1.0900 2 Kardeş sayısı 1.0802 3 Ödev yapımı 0.8625 4 Babanın eğitim durumu 0.8204 5 Ders sırasında not alma durumu 0.6988 6 Kardeş sayısı 0.6712 7 Okul dışında hafta sonu ders çalışma süresi 0.6435 8 Sınıfta derse konsantre olabilme 0.6421 9 Aynı evde yaşanan kişi sayısı 0.6364 10 Sınavlarda başarısız olma kaygısı 0.5676 4.2. Bulgular 4.2.1. Modellerin karşılaştırılması Rastgele Orman, Gradyan Artırma Sınıflandırıcısı ve Destek Vektör Makinesi algoritmaları kullanılarak modeller ayrı ayrı eğitilmiş ve performans sonuçları aşağıdaki Tablo 4.7’ de açıklanmıştır. Tablo 4.7: Modellerin Karşılaştırılması Model Doğruluk Kesinlik Duyarlılık F1 Sonucu RO 0.85 0.87 0.9 0.88 GAS 0.90 0.90 0.95 0.92 DVM 0.82 0.87 0.85 0.86 Tablo 4.7’ de görüldüğü gibi Gradyan Artırma Sınıflandırıcısı modeli en yüksek doğruluk, kesinlik, duyarlılık ve F1 Score değerleri ile en başarılı model olmuştur. Rastgele Orman ve Gradyan Artırma Sınıflandırıcısı modellerinde başarıya en çok etki eden ilk 10 değişken arasında Ödevlerin düzenli yapımı, Üniversite okumayı isteme 25 (hedef belirleme), Sınıfta derse konsantre olabilme, Ders sırasında not alma, Annenin eğitim durumu, Öğrenmek için tercih edilen yöntem (Her ikisi(Görsel/ Yazılı)), Evinizin durumu (kendimize ait), Anaokuluna gitme durumu (Evet) değişkenlerinin ortak olduğu görülmektedir. 26 5. SONUÇ VE ÖNERİLER 5.1. Sonuç Resmî veya özel tüm eğitim kurumlarının amacı öğrenci başarısını arttırmaktır. Öğrenci başarısının artması içinse başarıya etki eden faktörlerin tespit edilmesi ve risk grubunda yer alan öğrencilerin ihtiyaç duyduğu alanda desteklenmesi gerekmektedir. Ülkemizin de katıldığı PİSA ve TIMSS gibi uluslararası sınavlarda öğrencilerimizin başarıları ortalamanın altında kalmaktadır. Bu sebeple öğrenci performansını iyileştirmeye yönelik daha fazla çalışmaya ihtiyaç duyulmaktadır. Bu çalışma velilere, öğrencilere ve öğretmenlere sınava girmeden önce akademik başarı projeksiyonu elde edebilme imkânı tanımaktadır. Çalışmada kullanılmak üzere İstanbul Esenler’de resmî bir devlet okulunda 7.sınıfta eğitim gören öğrencilere bir anket uygulanarak veri seti elde edilmiştir. Bu veri seti başarı tahmini yapılabilmesi ve başarıya etki eden değişkenlerin belirlenebilmesi için kullanılmıştır. Anket yardımı ile öğrencilerin başarısına etki edebileceği düşünülen yaş, cinsiyet, anne babanın eğitim durumu, ödev yapımı, hafta içi ve hafta sonu öğrencilerin okul dışında ders çalışma süreleri gibi 31 farklı özellik elde edilmiştir. Anket sonucu elde edilen veri seti kategoriler içerdiğinden One Hot Encoding yöntemi kullanılarak sayısallaştırılmıştır. Encode edilen veri seti eğitim ve test verileri olarak ikiye ayrılmış, python programlama dili kullanılarak 3 farklı algoritma ile modellenerek makine öğrenmesi gerçekleştirilmiştir. Kullanılan algoritmalar Random Forest, Gradient Boosting Classifier, Support Vector Machine algoritmalarıdır. Modellerde bağımlı değişken olarak gerekli izinler alınarak e-okul üzerinden elde edilen öğrencilerin 6.sınıf yılsonu başarı ortalamaları kullanılmıştır. Gerçekleştirilen makine öğrenmesi sonucunda %90 doğruluk oranı ile en başarılı modelin Gradient Boosting Classifier algoritması kullanılarak oluşturulan model olduğu görülmüştür. En başarısız modelin ise %82 doğruluk oranı ile Support Vector Machine algoritması kullanılarak oluşturulan model olduğu görülmüştür. Random Forest algoritması kullanılarak oluşturulan model ile ise %85 doğruluk oranı sağlamıştır. 27 Modellerde ortak olarak başarıya en çok etki eden ortak değişkenlerin: - Ödevlerin düzenli yapımı, - Üniversite okumayı isteme(hedef belirleme), - Sınıfta derse konsantre olabilme, - Ders sırasında not alma, - Annenin eğitim durumu, - Öğrenmek için tercih edilen yöntem (Her ikisi(Görsel/ Yazılı)), - Evinizin durumu (kendimize ait), - Anaokuluna gitme durumu (Evet) olduğu görülmüştür. Uygulanan modellere göre öğrenci başarısına en çok etki eden değişkenlerin çoğunun değiştirilebilir değişkenler olduğu görülmektedir. Bu çalışma sonunda aileler bilinçlendirilerek ve öğrencilere gerekli rehberlik çalışmaları yapılarak öğrencilerin başarılarının arttırılabileceği sonucuna ulaşılmıştır. 5.2. Öneriler Bu tez çalışması sonucunda şu önerilerde bulunulabilir: - Bu çalışmada başarıya etki eden değişkenlerin belirlenmesi ve başarı tahmininde bağımlı değişken olarak öğrencilerin bir önceki dönem yılsonu genel başarı ortalamaları kullanılmıştır. Fakat her dersin kazanımı ve çalışma metodu farklı olduğundan her ders için kazanım bazlı başarı tahmini yaptırılabilir. - Multi disipliner yaklaşım benimsenerek bir dersteki performans başarısının diğer derslere etkisi makine öğrenmesi metodları ile araştırılarak kazanımlar çıkan sonuçlara göre düzenlenebilir. - Başarıya etki eden değişkenlerin belirlenmesi ve eğitim öğretim dönemi öncesi başarı tahmini yapılması velilere ve öğretmenlere akademik başarıyı arttırabilmek için gerekli önlemlerin alınmasında rehber olabilir. - Makine öğrenmesi modelleri oluşturularak öğrencilerin öğrenme stilleri tespit edilebilir ve öğrencilerin yeteneklerine uygun öğrenme ortamları tasarlanabilir. - Özel yetenekli olan ve özel öğrenme güçlüğü yaşayan öğrencilerin yetenekleri makine öğrenmesi modelleri ile belirlenerek yeteneklerine uygun öğrenme platformları ve öğrenme materyalleri geliştirilebilir. 28 - Farklı makine öğrenmesi algoritmaları ve farklı veri setleri kullanılarak tahmin başarısı kıyaslanabilir. 29 KAYNAKÇA Abbasoğlu, B. (2020). Ortaokul öğrencilerinin akademik başarılarının eğitsel veri madenciliği yöntemleri ile tahmini. Veri Bilimi, 3(1), 1–10. Acar, T. (2012). Türkiye’nin PISA 2009 sonuçlarına göre OECD’ye üye ve aday ülkeler arasındaki yeri. Kuram ve Uygulamada Eğitim Bilimleri, 12(4), 2561– 2572. Agarwal, S. (2013). Data mining: Data mining concepts and techniques. 2013 International Conference on Machine Intelligence and Research Advancement, 203–207. Aghalarova, S., & Bozkurt Keser, S. (2021). Önerilen Yapay Sinir Ağı Algoritması ile Ortaokul Öğrencilerin Akademik Performansının Tahmini. Veri Bilimi, 4(2), 19–32. Alkan, A. (2023). Akademik başarının eğitsel veri madenciliği ve makine öğrenmesi teknikleri kullanılarak tahminlenmesi. (Tez No. 809148) [Yüksek lisans tezi, Burdur Mehmet Akif Ersoy Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Aydemir, B. (2017). Veri madenciliği yöntemleri kullanarak meslek yüksek okulu öğrencilerinin akademik başarı tahmini. (Tez No. 486838) [Yüksek lisans tezi, Pamukkale Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Baashar, Y., Hamed, Y., Alkawsi, G., Fernando Capretz, L., Alhussian, H., Alwadain, A., & Al-amri, R. (2022). Evaluation of postgraduate academic performance using artificial intelligence models. Alexandria Engineering Journal, 61(12), 9867–9878. https://doi.org/10.1016/j.aej.2022.03.021 Bastem, H. N. (2021). Student academic performance prediction via artificial intelligence using machine learning algorithms. (Tez No. 703366) [Yüksek lisans tezi, Çankaya Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Bingül, F. (2023). Yapay zekâ destekli makine öğrenmesi algoritmaları ile eğitsel veri madenciliği alanında öğrenci akademik performanslarının tahmin edilmesi. (Tez No.784774) [Yüksek lisans tezi, İstanbul Gedik Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Bujang, S. D. A., Selamat, A., & Krejcar, O. (2021). A predictive analytics model for students grade prediction by supervised machine learning. IOP Conference Series: Materials Science and Engineering, 1051(1), 1051. https://doi.org/10.1088/1757-899X/1051/1/012005 Buraimoh, E., Ajoodha, R., & Padayachee, K. (2021). Application of machine learning techniques to the prediction of student success. 2021 IEEE International IOT, Electronics and Mechatronics Conference (IEMTRONICS), 1–6. 30 Çelik, E. F. (2022). Makine öğrenmesi ile lise öğrencilerine mesleki alan seçim rehberi. (Tez No. 732376) [Yüksek lisans tezi, Manisa Celal Bayar Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Christou, V., Tsoulos, I., Loupas, V., Tzallas, A. T., Gogos, C., Karvelis, P. S., Antoniadis, N., Glavas, E., & Giannakeas, N. (2023). Performance and early drop prediction for higher education students using machine learning. Expert Systems with Applications, 225, 120079. Civelek, S. (2023). Makine öğrenmesi yöntemleri ile öğrenci mezuniyet notu tahmini. (Tez No. 809753) [Yüksek lisans tezi, Bolu Abant İzzet Baysal Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Coşkun, C., & Baykal, A. (2011). Veri madenciliğinde sınıflandırma algoritmalarının bir örnek üzerinde karşılaştırılması. Akademik Bilişim, 2011, 1–8. Duralioğlu, Ö. (2022). Makine öğrenimi ve istatistiksel yöntemler kullanarak öğrencilerin programlama dersindeki kazanım bilgileri ile başarı tahmini. (Tez No. 766340) [Yüksek lisans tezi, Sakarya Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Dursun, Ş., & Yüksel, D. (2004). Öğrencilerin matematikte başarısını etkileyen faktörler matematik öğretmenlerinin görüşleri bakımından. Gazi Üniversitesi Gazi Eğitim Fakültesi Dergisi, 24(2), 217–230. Fırat, İ. (2019). Türkiye’de matematik okuryazarlık ile ilgili 2020 yılına kadar yapılan çalışmaların doküman analizi yöntemiyle incelenmesi. (Tez No. 620110) [Yüksek lisans tezi, Amasya Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Friedman, J. H. (2001). Greedy function approximation: a gradient boosting machine. Annals of Statistics, 1189–1232. Gök, M. (2017). Makine öğrenmesi yöntemleri ile akademik başarının tahmin edilmesi. Gazi University Journal Of Science Part C: Design And Technology, 5(3), 139–148. Guven, B., & Cabakcor, B. O. (2013). Factors influencing mathematical problem- solving achievement of seventh grade Turkish students. Learning and Individual Differences, 23, 131–137. https://doi.org/10.1016/j.lindif.2012.10.003 Haridas, M., Gutjahr, G., Raman, R., Ramaraju, R., & Nedungadi, P. (2020). Predicting school performance and early risk of failure from an intelligent tutoring system. Education and Information Technologies, 25, 3995–4013. Hashim, A. S., Awadh, W. A., & Hamoud, A. K. (2020). Student performance prediction model based on supervised machine learning algorithms. IOP 31 Conference Series: Materials Science and Engineering, 928(3), 032019. https://doi.org/10.1088/1757-899X/928/3/032019 Hasib, K. M., Rahman, F., Hasnat, R., & Alam, M. G. R. (2022). A machine learning and explainable ai approach for predicting secondary school student performance. 2022 IEEE 12th Annual Computing and Communication Workshop and Conference (CCWC), 399-405). https://doi.org/10.1109/CCWC54503.2022.9720806 Hearst, M. A., Dumais, S. T., Osuna, E., Platt, J., & Scholkopf, B. (1998). Support vector machines. IEEE Intelligent Systems and Their Applications, 13(4), 18– 28. Hussain, S., & Khan, M. Q. (2023). Student-performulator: Predicting students’ academic performance at secondary and intermediate level using machine learning. Annals of Data Science, 10(3), 637–655. https://doi.org/10.1007/s40745-021-00341-0 Irmak, H., & Ecevit Satı, Z. (2022). Covid-19 pandemisi döneminde öğrencilerin uzaktan eğitimde yaşadıkları sorunların kelime bulutu ve gizli anlamsal dizinleme yöntemleriyle tespit edilmesi. Uluslararası Yönetim Bilişim Sistemleri ve Bilgisayar Bilimleri Dergisi, 6(2), 162–170. https://doi.org/10.33461/uybisbbd.1214562 Kanchana, J. D., Amarasinghe, G., Nanayakkara, V., & Perera, A. S. (2021). A data mining approach for early prediction of academic performance of students. 2021 IEEE International Conference on Engineering, Technology & Education (TALE), 1–8. https://doi.org/10.1109/TALE52509.2021.9678558 Kavzoğlu, T., & Çölkesen, İ. (2010). Destek vektör makineleri ile uydu görüntülerinin sınıflandırılmasında kernel fonksiyonlarının etkilerinin incelenmesi. Harita Dergisi, 144(7), 73–82. Kaya, F. H. (2022). Makine öğrenmesi algoritmaları kullanarak öğrencilerin akademik başarısını etkileyen faktörlerin tespit edilmesi. Koç, T., & Akın, P. (2022). Estimation of high school entrance examination success rates using machine learning and beta regression models. Journal of Intelligent Systems: Theory and Applications, 5(1), 9–15. https://doi.org/10.38016/jista.922663 Kye, A. (2023). Comparatıve analysıs of classıfıcatıon performance for u.s. college enrollment predıctıve modelıng usıng four machıne learnıng algorıthms (logıstıc regressıon, decısıon tree, support vector machıne, artıfıcıal neural network). (Publication No. 10169573) [Doctoral dissertation, Loyola Unıversıty Chıcago]. ProQuest Dissertations & Theses Global. 32 Lau, E. T., Sun, L., & Yang, Q. (2019). Modelling, prediction and classification of student academic performance using artificial neural networks. SN Applied Sciences, 1, 1–10. Mahmut, Ö., Gençoğlu, C., & Eren, S. (2020). Türkiye’de eğitimde eşitsizlikleri azaltmak için uygulanan politikalar. Ondokuz Mayis University Journal of Education Faculty, 39(2), 294–312. MEB, M. E. B. (2014). Millî Eğitim Bakanlığı okul öncesi eğitim ve ilköğretim kurumları yönetmeliği. Miguéis, V. L., Freitas, A., Garcia, P. J. V, & Silva, A. (2018). Early segmentation of students according to their academic performance: A predictive modelling approach. Decision Support Systems, 115, 36–51. Natekin, A., & Knoll, A. (2013). Gradient boosting machines, a tutorial. Frontiers in Neurorobotics, 7, 21. Sarıer, Y. (2021). Pisa Uygulamalarında Türkiye’nin Performansı ve Öğrenci Başarısını Yordayan Değişkenler. Türkiye Sosyal Araştırmalar Dergisi, 25(3), 905–926. Selvi, A. (2020). Bilecik ilinde ilköğretimden liseye geçiş sınavlarında makine öğrenmesi yöntemleri ile öğrenci başarısının tahmini. (Tez No. 637536) [Yüksek lisans tezi, Bilecik Şeyh Edebali Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Sönmez Sarıkaya, B. (2020). AES Algoritmasına Yapılan Zaman Odaklı Önbellek Saldırılarının Makine Öğrenmesi ile Tespiti. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 13(1), 57–68. Speiser, J. L., Miller, M. E., Tooze, J., & Ip, E. (2019). A comparison of random forest variable selection methods for classification prediction modeling. Expert Systems with Applications, 134, 93–101. TDK. (2023). “Eğitim”, “Güncel Türkçe Sözlük”, Türk Dil Kurumu. Erişim: 20 Eylül 2023. Tomasevic, N., Gvozdenovic, N., & Vranes, S. (2020). An overview and comparison of supervised data mining techniques for student exam performance prediction. Computers & Education, 143, 103676. Ulutan, E. (2018). TEOG fen bilgisi başarısını etkileyen değişkenlerin çok düzeyli regresyon modeli ile incelenmesi. (Tez No. 517251) [Yüksek lisans tezi, Hacettepe Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. Wakelam, E., Jefferies, A., Davey, N., & Sun, Y. (2020). The potential for student performance prediction in small cohorts with minimal available attributes. 33 British Journal of Educational Technology, 51(2), 347–370. https://doi.org/10.1111/bjet.12836 Yağcı, M. (2022). Educational data mining: prediction of students’ academic performance using machine learning algorithms. Smart Learning Environments, 9(1), 11. Yavuzarslan, M., & Erol, Ç. (2022). Öğrenme yönetim sistemi log kayıtlarının akademik başarı tahmininde kullanılması. Bilişim Teknolojileri Dergisi, 15(2), 199–207. https://doi.org/10.17671/gazibtd.837884 Yildiz, B., Bilbao, J. I., & Sproul, A. B. (2017). A review and analysis of regression and machine learning models on commercial building electricity load forecasting. Renewable and Sustainable Energy Reviews, 73, 1104–1122. https://doi.org/10.1016/j.rser.2017.02.023 Zeineddine, H., Braendle, U., & Farah, A. (2021). Enhancing prediction of student success: Automated machine learning approach. Computers & Electrical Engineering, 89, 106903. https://doi.org/10.1016/j.compeleceng.2020.106903 Zilyas, D. (2023). Makine öğrenmesi yöntemi ile eğitim başarısının tahmini modeli. (Tez No. 808254) [Yüksek lisans tezi, İstanbul Beykent Üniversitesi]. Yükseköğretim Kurulu Ulusal Tez Merkezi. 34 ÖZGEÇMİŞ Zeynep Gökmen Eğitim Derecesi Eğitim Kurumu Mezuniyet Yüksek Lisans İstanbul Topkapı Üniversitesi / 2024 Yapay Zekâ Lisans Gaziosmanpaşa Üniversitesi / Bilgisayar ve 2014 Öğretim Teknolojileri Öğretmenliği Lise Gerze Teknik Lise 2009 İş Deneyimi Kurum Yıl Milli Eğitim Bakanlığı 2014 - 2015 Şafak Okulları 2017 – 2019 Milli Eğitim Bakanlığı 2019 - Halen Daha Önce Yapılan Yayınlar Yayın Konferans Sayfalar Yapay Zekâ Uygulamalarının 8th International Aegean 122-139 Eğitime Etkileri Üzerine Bir Congress on Innovation İnceleme Technologies & Engineering 35

Use Quizgecko on...
Browser
Browser