Tập bài giảng Nhập môn Đo Lường và Đánh giá trong Giáo dục PDF
Document Details
Uploaded by UnbeatableEclipse9632
Đại học Giáo dục
2019
Tags
Summary
Tập bài giảng này, của trường Đại học Giáo dục, Hà Nội, tháng 12 năm 2019, giới thiệu về những khái niệm cơ bản về chất lượng và chất lượng trong giáo dục, bao gồm lịch sử, các khái niệm, chất lượng giáo dục phổ thông và đại học, và các loại hình đánh giá chất lượng giáo dục. Bài giảng trình bày các nội dung như đo lường, khung tham chiếu, mục tiêu, độ tin cậy và độ giá trị.
Full Transcript
TRƯỜNG ĐẠI HỌC GIÁO DỤC KHOA QUẢN TRỊ CHẤT LƯỢNG TẬP BÀI GIẢNG HỌC PHẦN NHẬP MÔN ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC Hà Nội, tháng 12 năm 2019 MỤC LỤC Chương 1 KHÁI QUÁT VỀ CHẤT LƯỢNG V...
TRƯỜNG ĐẠI HỌC GIÁO DỤC KHOA QUẢN TRỊ CHẤT LƯỢNG TẬP BÀI GIẢNG HỌC PHẦN NHẬP MÔN ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC Hà Nội, tháng 12 năm 2019 MỤC LỤC Chương 1 KHÁI QUÁT VỀ CHẤT LƯỢNG VÀ CHẤT LƯỢNG TRONG GIÁO DỤC................................................................................................................3 1.1. Chất lượng trong giáo dục................................................................................4 1.1.1 Lịch sử nghiên cứu và sự phát triển của khoa học quản lý.........................4 1.1.2 Một số khái niệm.........................................................................................5 1.2. Chất lượng giáo dục nhìn từ góc độ quản lý chất lượng..................................8 1.2.1 Đảm bảo chất lượng....................................................................................8 1.2.2 Chất lượng theo hợp đồng.........................................................................10 1.2.3 Chất lượng của khách hàng.......................................................................10 1.3. Chất lượng giáo dục phổ thông.......................................................................11 1.3.1 Chất lượng giáo dục phổ thông theo UNESCO........................................11 1.3.2 Chất lượng giáo dục phổ thông Việt Nam trong bối cảnh mới.................12 1.4. Chất lượng trong giáo dục đại học, cao đẳng và dạy nghề.............................13 1.4.1 Chất lượng là sự tuân thủ các tiêu chuẩn..................................................13 1.4.2 Các cách tiếp cận chất lượng trong giáo dục đại học................................14 1.4.3 Một số thành tựu và khó khăn của giáo dục đại học Việt Nam................16 Câu hỏi ôn tập, thảo luận.......................................................................................17 Tài liệu tham khảo.................................................................................................18 Chương 2 NHỮNG VẤN ĐỀ CƠ BẢN VỀ ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC...............................................................................................19 2.1. Giới thiệu chung về đo lường trong giáo dục.................................................20 2.2. Các loại hình khung tham chiếu để giải nghĩa kết quả đo lường...................24 2.3. Xác định mục tiêu/tiêu chí để đo lường..........................................................28 2.4. Độ tin cậy, độ giá trị của phép đo...................................................................31 Câu hỏi ôn tập, thảo luận.......................................................................................37 Tài liệu tham khảo.................................................................................................38 Chương 3 CÁC LOẠI HÌNH ĐÁNH GIÁ CHẤT LƯỢNG GIÁO DỤC..........39 1 3.1. Đánh giá dựa trên kết quả học tập của người học..........................................40 3.1.1 Đánh giá trên diện rộng.............................................................................40 3.1.2. Đánh giá trên lớp học...............................................................................45 3.2. Phân biệt các khái niệm: Đánh giá chẩn đoán, Đánh giá trong tiến trình, Đánh giá tổng kết.............................................................................................................46 3.2.1. Diagnostic assessment: Đánh giá chẩn đoán/ đánh giá ban đầu..............47 3.2.2. Formative assessment: Đánh giá phát triển/đánh giá hình thành/ đánh giá quá trình học tập của HS....................................................................................48 3.2.3. Summative assessment: Đánh giá tổng kết..............................................48 3.3. Các hoạt động đánh giá trong giáo dục..........................................................53 3.3.1. Đánh giá cơ sở giáo dục...........................................................................53 3.4. Đánh giá Chương trình đào tạo.......................................................................70 3.4.1. Đánh giá chương trình đào tạo.................................................................71 3.4.2. Tiêu chuẩn đánh giá chất lượng chương trình đào tạo.............................75 3.5. Đánh giá giáo viên..........................................................................................79 3.5.1. Chuẩn........................................................................................................80 3.5.2. Chuẩn nghề nghiệp...................................................................................80 Câu hỏi ôn tập, thảo luận.......................................................................................82 Tài liệu tham khảo.................................................................................................82 2 Chương 1 KHÁI QUÁT VỀ CHẤT LƯỢNG VÀ CHẤT LƯỢNG TRONG GIÁO DỤC Mục tiêu học tập: 1.1. Trình bày được các quan điểm khác nhau về chất lượng và chất lượng trong giáo dục; 1.2. Phân tích được một tình huống đánh giá chất lượng giáo dục để rút ra khái niệm phù hợp; 1.3. So sánh được điểm giống và khác nhau giữa CL giáo dục phổ thông và CL giáo dục sau phổ thông; 1.4 Liên hệ được thực tiễn chất lượng giáo dục phổ thông và sau phổ thông của Việt Nam. 3 1.1. Chất lượng trong giáo dục 1.1.1 Lịch sử nghiên cứu và sự phát triển của khoa học quản lý Theo Nguyễn Đức Chính, Trần Xuân Bách, Trần Thị Thanh Phượng (2015): - Quản lý chất lượng bắt nguồn từ thập niên 1920 khi lý thuyết xác suất thống kê lần đầu được áp dụng để kiểm định chất lượng sản phẩm (SP). - Các giai đoạn quản lý chất lượng: + Kiểm tra chất lượng: Tập trung phát hiện và loại bỏ SP cuối cùng không đạt chuẩn mực chất lượng. + Đảm bảo chất lượng: Tập trung phòng ngừa sự xuất hiện của những SP chất lượng thấp. + Cải tiến liên tục: thường xuyên nâng cao chất lượng thông qua việc tất cả thành viên trong tổ chức đều thấm nhuần các giá trị văn hoá chất lượng cao và nâng cao vai trò của người trực tiếp tạo ra SP. - Phương pháp: loại bỏ những biến động trong quá trình (sản xuất) sẽ giúp SP cuối cùng đạt tiêu chuẩn chất lượng (Nguyễn Đức Chính, Trần Xuân Bách, Trần Thị Thanh Phượng, 2015). Dựa trên quá trình phát triển (các mốc phát triển), cần làm rõ một số khái niệm sau: Kiểm soát Kiểm soát Đảm bảo Quản lý chất chất lượng quá trình chất lượng lượng tổng thể - TQM Là thuật ngữ lâu Ra đời để khắc Là một bước nâng Là mô hình có triết đời nhất về mặt phục những nhược cao hơn của kiểm lý rõ ràng. lịch sử. điểm của kiểm soát quá trình soát chất lượng. Hình thức: Kiểm Phòng ngừa SP lỗi Quảng bá, chứng Chất lượng SP soát, kiểm định bằng cách kiểm minh và tạo niềm không ngừng được các tiêu chí đã đặt soát chất lượng ở tin cho khách hàng nâng cao nhằm ra cho SP, phát từng khâu, hạn chế vào SP của nhà thoả mãn nhu cầu 4 hiện sai sót, loại lỗi ở SP cuối cùng. sản xuất. ngày càng tăng bỏ các SP cuối của khách hàng. cùng không đạt tiêu chuẩn và đưa ra phương pháp xử lý. Là bước cuối cùng Được thực hiện Được thực hiện Là một quá trình của quá trình sản trong cả quá trình trong cả quá trình cải tiến chất lượng xuất. sản xuất. sản xuất và không liên tục, hiệu quả ngừng phát triển cao. để đáp ứng tiêu chí chất lượng. Nhược điểm: Chỉ tập trung vào Chưa tạo ra hiệu Đảm bảo độ tin kiểm soát chất quả cao theo yêu cậy chất lượng SP lượng quá trình, cầu gia tăng liên nhưng không tạo chưa thể hiện giá tục của khách ra SP. SP làm ra trị của một tổ hàng trong quá không đáp ứng chức, chưa hướng trình cải tiến liên tiêu chuẩn chất tới xây dựng niềm tục. lượng sẽ bị loại tin của khách bỏ, gây lãng phí. hàng. 1.1.2 Một số khái niệm a) Chất lượng Theo các tác giả của "Chất lượng giáo dục - những vấn đề lý luận và thực tiễn", có nhiều cách hiểu về "chất lượng": Chất lượng là sự xuất sắc bẩm sinh, tự nó (là cái tốt nhất). Điều này chỉ có thể hiểu được, cảm nhận được nếu so sánh với những sự vật có cùng những đặc tính với sự vật đang được xem xét. Đây là cách tiếp cận tiên nghiệm về chất lượng. Chất lượng được xem xét trên cơ sở những thuộc tính đo được. Điều đó có nghĩa là chất lượng có thể được đo lường khách quan và chính xác. Một sự 5 vật có thuộc tính nào đó "cao hơn" cũng có nghĩa là nó "tốt hơn" và do đó, cũng "đắt hơn". Cách tiếp cận này gọi là cách tiếp cận dựa trên SP khi xem xét chất lượng. Chất lượng được xem như sự phù hợp với nhu cầu. Các SP và dịch vụ được "sản xuất" một cách chính xác với những "đặc tính kỹ thuật" đã định; mọi sự lệch lạc đều dẫn đến giảm chất lượng. Đây là cách tiếp cận chất lượng dựa trên sản xuất. Chất lượng là sự phù hợp với mục đích (mục tiêu), là "đáp ứng được nhu cầu khách hàng". Chất lượng được xem xét đơn giản chỉ trong con mắt của người chiêm ngưỡng sự vật hoặc sử dụng chúng. Trong các định nghĩa trên, "chất lượng là sự phù hợp với mục tiêu" có ý nghĩa hơn cả đối với việc xác định chất lượng giáo dục và cả việc đánh giá nó. Mục tiêu ở đây được hiểu một cách rộng rãi, bao gồm sứ mạng, mục đích; còn sự phù hợp với mục tiêu có thể là đáp ứng mong muốn của những người quan tâm, là đạt hay vượt qua các tiêu chuẩn đặt ra. Đây là định nghĩa thích hợp và thông dụng nhất khi xem xét các vấn đề của giáo dục (Nguyễn Hữu Châu chủ biên, 2008). b) Chất lượng trong giáo dục Giáo dục là một hoạt động hướng đích, chất lượng của giáo viên (GV) phụ thuộc nhiều vào mục tiêu giáo dục hoá, sự giải phóng, tự khẳng định. Mức 1: Cá nhân tiếp nhận kiến thức và hình thành kỹ năng (mới hình thành ở mức độ cá nhân). Mức 2: Hình thành văn hoá chất lượng thấm nhuần trong mỗi cá nhân và tổ chức (cá nhân thực hiện tốt để phát triển cả tổ chức). Mức 3: Sự giải phóng cá nhân (tiền đề giúp cá nhân phát triển toàn diện). Mức 4: phát triển toàn diện - khơi dậy tiềm năng, vượt qua mọi thử thách (Nguyễn Đức Chính, Trần Xuân Bách, Trần Thị Thanh Phượng, 2015). Theo Ngô Doãn Đãi (2012), chất lượng giáo dục thường được xác định và được đánh giá bởi những tiêu chí trong các lĩnh vực, như: cơ hội tiếp cận, sự nhập học, tỷ lệ tham dự học tập, tỷ lệ lưu ban, bỏ học, mức độ thông thạo đọc viết và tính toán, kết quả các bài kiểm tra, tỷ lệ đầu tư cho giáo dục trong ngân sách Nhà nước. Những tiêu chí về chất lượng này là hết sức quan trọng. Tuy nhiên, chúng vẫn không thực sự cho ta thấy một cách hiểu đầy đủ về chất lượng giáo dục. Luis 6 Eduarda Gonzalez (1998) đưa ra một mô hình kiểm tra và đánh giá chất lượng giáo dục trong các trường đại học. Tuy nhiên, mô hình của ông cũng tỏ ra hữu ích khi xem xét chất lượng không chỉ của giáo dục đại học mà là của cả hệ thống giáo dục. Trong mô hình này, chất lượng được xem như một hệ thống gồm các khía cạnh gắn kết với nhau: - Sự phù hợp (relevance): Sự hài hòa của mục đích giáo dục và của hệ thống giáo dục với những đòi hỏi của môi trường mà hệ thống giáo dục được đặt trong đó. - Hiệu quả (e ectiveness): Sự phù hợp vững chắc giữa những gì đã được lập ra trong kế hoạch và những gì đã đạt được, cũng có thể hiểu đó là sự phù hợp với mục tiêu giáo dục. - Nguồn (resources): Sự sẵn có của đội ngũ cán bộ, cơ sở vật chất, thiết bị và những nguồn thông tin cần thiết để giúp cho các cơ sở giáo dục có thể thực hiện được những cam kết của mình. - Hiệu suất (e iciency): Sự tiết kiệm đến mức tối đa trong việc sử dụng các nguồn tài lực được cung cấp nhằm đạt được các kiến thức, kỹ năng của người học, phát triển các nghiên cứu và dịch vụ. - Sự công hiệu (e icacy): Sự tương thích giữa các kết quả đạt được với việc sử dụng các nguồn lực. - Quá trình (process): Sự vận động của các thành tố giáo dục dưới sự chỉ đạo, quản lý, nhằm đạt được những kết quả mong muốn. Trong những khía cạnh trên thì sự phù hợp (relevance) đóng vai trò chủ chốt quyết định tới chất lượng giáo dục. Chương trình hành động 1998 của UNESCO về giáo dục đại học giải thích về sự phù hợp như sau: "Khả năng của hệ thống giáo dục và của những cơ sở giáo dục và đào tạo trong việc đáp ứng những nhu cầu đặt ra của cộng đồng, của địa phương hoặc của một đất nước, đó cũng là sự đáp ứng của giáo dục trước những yêu cầu của một thế giới mới với tầm nhìn, công cụ và cách thức hành động đã và đang tiếp tục thay đổi". Vấn đề sự phù hợp của hệ thống giáo dục và những ảnh hưởng của nó đối với chất lượng giáo dục đã được các nhà giáo dục nhận xét và bàn luận từ nhiều năm nay. Người ta chỉ ra rằng sự phát triển không ngừng và mau chóng của khoa học và công nghệ đã đòi hỏi hệ thống giáo dục phải linh hoạt hơn và có thêm khả năng đáp ứng đối với những yêu cầu của cộng đồng, của quốc gia cũng như quốc tế. 7 Một hệ thống giáo dục muốn đáp ứng được những yêu cầu của một nền kinh tế phát triển cao thì trước hết phải tạo lập lại cách học nhằm phát triển được những kỹ năng học tập mang tính phê phán và sáng tạo, đề cao tính dân chủ trong học tập, tập trung vào những phương pháp dạy học hướng đến người học, xây dựng những môn học tích hợp, đa dạng hóa các loại hình nhà trường và sau cùng là hướng đến việc học suốt đời. Như vậy, sự phù hợp của giáo dục là khía cạnh quan trọng nhất của chất lượng giáo dục, quyết định đầu vào, quá trình và kết quả của hệ thống giáo dục. Sự phù hợp đòi hỏi một sự đổi mới thực sự trong giáo dục vì một thế giới mới, vì các thế hệ tương lai. Sự phù hợp của giáo dục đòi hỏi trước hết là những phẩm chất trí tuệ cần có ở người học để phục vụ một tương lai (đây là đòi hỏi về kết quả); sau đó là cách thức để một xã hội thông qua hệ thống giáo dục của mình chuẩn bị cho những công dân lúc mới sinh cho tới khi trưởng thành hình thành và phát triển được những phẩm chất và năng lực như vậy (đây là những đòi hỏi về đầu vào và quá trình) (Ngô Doãn Đãi, 2012). 1.2. Chất lượng giáo dục nhìn từ góc độ quản lý chất lượng Nhìn từ góc độ quản lý chất lượng, chất lượng giáo dục có thể chia thành 3 nhóm: đảm bảo chất lượng; chất lượng theo hợp đồng; chất lượng của khách hàng. 1.2.1 Đảm bảo chất lượng Đảm bảo chất lượng giáo dục đã và đang là yêu cầu bắt buộc đối với tất cả các trường đại học để không ngừng nâng cao chất lượng đào tạo nhằm mục đích đáp ứng nhu cầu ngày càng cao của thị trường lao động. Trong hoạt động đảm bảo chất lượng (ĐBCL), ĐBCL bên trong được coi là yếu tố cốt lõi, có ý nghĩa quyết định đến chất lượng giáo dục của một trường đại học. Vậy thế nào là ĐBCL, ĐBCL bao gồm những thành tố nào? AUN-QA: ĐBCL giáo dục là sự quan tâm có hệ thống, có cấu trúc và liên tục đến chất lượng ở hai khía cạnh là duy trì chất lượng và cải tiến chất lượng. UNESCO (2003): xác định đảm bảo chất lượng giáo dục đại học như là “quy trình quản lý và đánh giá một cách hệ thống để kiểm soát hiệu quả của các cơ sở giáo dục đại học” 8 INQAAHE (2004): Đảm bảo chất lượng là các thái độ, đối tượng, hoạt động và thủ tục cùng các hoạt động kiểm soát chất lượng, đảm bảo chuẩn học thuật được duy trì và nâng cao (inqaahe.org). Lê Đức Ngọc (2008): Đảm bảo chất lượng toàn bộ các hoạt động có kế hoạch, có hệ thống được tiến hành trong hệ thống chất lượng và được chứng minh là đủ mức cần thiết để khách hàng thoả mãn các yêu cầu chất lượng. Nguyễn Đức Chính, Trần Xuân Bách, Trần Thị Thanh Phượng (2015): Đảm bảo chất lượng là việc xác lập những tiêu chuẩn, phương pháp phù hợp, những yêu cầu về chất lượng kèm theo quá trình thanh tra, đánh giá việc đáp ứng những tiêu chuẩn đó. Công việc này thường do một nhóm các chuyên gia hoặc một tổ chức chuyên môn thực hiện. Tóm lại, dù theo định nghĩa nào, ĐBCL phải đảm bảo những đặc điểm sau: + Thông qua các bộ tiêu chuẩn do chuyên gia xác lập. + Được giới thiệu như tập hợp các yêu cầu hay kỳ vọng mà nhà trường phải phấn đấu để đạt được. + Các tiêu chuẩn được đánh giá bằng các tiêu chí, chỉ báo. + Các tiêu chuẩn ĐBCL có thể cho phép xây dựng các phương án khác nhau tuỳ thuộc từng trường. Theo AUN-QA, đảm bảo chất lượng bao gồm 3 thành tố: ĐBCL bên trong, ĐBCL bên ngoài và kiểm định chất lượng. Đảm bảo chất lượng bên trong (IQA) là đảm bảo cho cơ sở đào tạo, hệ thống đảm bảo chất lượng hoặc một chương trình có chính sách và cơ chế hoạt động đáp ứng những mục tiêu và chuẩn mực đặt ra. Đảm bảo chất lượng bên ngoài (EQA) được thực hiện bởi một tổ chức hoặc cá nhân bên ngoài cơ sở đào tạo. Các đánh giá viên đánh giá hoạt động của cơ sở đào tạo, hệ thống hay chương trình để quyết định xem mức độ đáp ứng những tiêu chuẩn đã xác định. Kiểm định chất lượng là tiến trình đánh giá chất lượng từ bên ngoài, theo các tiêu chuẩn và tiêu chí xác định trước nhằm ĐBCL, cải tiến chất lượng và cấp giấy chứng nhận hoặc công nhận chất lượng cho cơ sở giáo dục (trường đại học, cao đẳng) hoặc chương trình giáo dục. 9 1.2.2 Chất lượng theo hợp đồng - Chất lượng giáo dục thông qua hợp đồng là hình thức người cung ứng cung cấp dịch vụ và tự đảm bảo chất lượng dịch vụ đã cung ứng. Chất lượng giáo dục thông qua hợp đồng được thực hiện thông qua phương pháp: 1) Hợp đồng giữa GV- HS: Bài tập về nhà (GV giao bài tập về nhà cho HS) và 2) Hợp đồng giữa GV- nhà trường: kế hoạch dạy học theo năm học của từng GV. - Đặc trưng: + Hợp đồng được thương thảo giữa 2 bên, được thương thảo hoá và ký kết trước khi thực hiện. + Hợp đồng mang tính địa phương và quy định trách nhiệm của các bên tham gia. + Những kỳ vọng về chất lượng được quy định trong hợp đồng. + Chất lượng công việc được các bên cùng đánh giá. + Chất lượng được đánh giá theo tiến trình chứ không qua thanh tra, kiểm tra. 1.2.3 Chất lượng của khách hàng Chất lượng của khách hàng là sự kỳ vọng của khách hàng (HS, SV, phụ huynh, người sử dụng lao động) vào chất lượng dịch vụ giáo dục. Mức độ đáp ứng kỳ vọng của khách hàng phản ánh chất lượng giáo dục. Việc xác định chất lượng giáo dục thông qua mức độ đáp ứng kỳ vọng của khách hàng khó xác định hơn so với các phương pháp khác. - Đặc trưng: + Khách hàng có thể xác định được kỳ vọng của mình một cách rõ ràng. + Kỳ vọng của khách hàng đôi khi không trùng với suy nghĩ của người cung ứng dịch vụ. + Khi nhà cung ứng và khách hàng hợp tác với nhau để xác định nhu cầu và dịch vụ đáp ứng nhu cầu đó thì chất lượng dịch vụ sẽ được cải tiến. + Nhà cung ứng dịch vụ có thể thoả mãn nhu cầu của số đông khách hàng. Theo Ngô Doãn Đãi (2012), chất lượng phải được đặt ra trong mối quan hệ phụ thuộc giữa người sử dụng dịch vụ (SV, cha mẹ SV, người sử dụng lao động và các nhóm xã hội khác), người cung cấp dịch vụ (giáo chức, các giới quản lý nhà trường) và chính phủ cũng như xã hội. 10 Phân tích quan hệ tam giác mà các đỉnh là nhà nước, khách hàng và nhà trường ta sẽ thấy vấn đề quản lý chất lượng thực chất là tạo ra cơ chế chịu trách nhiệm của trường đại học trước người cung cấp tài chính, người sử dụng dịch vụ và toàn bộ xã hội. Trong cơ chế bao cấp, nhà nước cấp kinh phí, cung cấp dịch vụ đào tạo và sử dụng người tốt nghiệp; lúc đó ba đỉnh của tam giác trùng làm một. Sự phân tách trách nhiệm giữa nhà trường và nhà nước trong cơ chế cũ không rõ ràng. Người sử dụng, người cung cấp dịch vụ và người trả tiền đều là nhà nước hoặc được sự bảo trợ của nhà nước. Trong cơ chế thị trường, ba lực lượng nằm ở ba đỉnh của tam giác, đóng ba vai trò khác nhau: vai trò cung cấp dịch vụ (nhà trường), vai trò sử dụng dịch vụ (người học, người sử dụng lao động) và vai trò giám sát, điều chỉnh mối quan hệ cung - cầu (chính phủ). * Xu hướng dịch chuyển chất lượng GD: chuyển động từ ĐBCL sang chất lượng theo hợp đồng và tiến tới chất lượng theo khách hàng. 1.3. Chất lượng giáo dục phổ thông 1.3.1 Chất lượng giáo dục phổ thông theo UNESCO Chất lượng của một trường phổ thông là chất lượng của 3 thành phần cơ bản: đầu vào, quá trình, đầu ra. Ba thành phần này được đặt trong một bối cảnh cụ thể. 11 1.3.2 Chất lượng giáo dục phổ thông Việt Nam trong bối cảnh mới Chất lượng giáo dục mới được xác định như sau: - Mục tiêu: phát triển phẩm chất, giá trị, năng lực đa dạng của HS, chuẩn bị hành trang để học tập suốt đời, đáp ứng yêu cầu CNH-HĐH hội nhập quốc tế và phát triển bền vững. - Giải pháp: + Xây dựng chương trình định hướng năng lực. + Người học đóng vai trò là chủ thể trong quá trình học tập của mình. + Nhà trường có tổ chức đa dạng, dân chủ, tự chủ và sáng tạo trong dạy học. + Kiểm tra đánh giá thường xuyên, định kỳ, tạo động lực cho người học. + Sử dụng công nghệ thông tin trong quá trình dạy học. - Tiêu chuẩn đánh giá chất lượng giáo dục phổ thông (Thông tư 18/2018/TT- BGDĐT ngày 22/08/2018): + Khái niệm: 12 Chất lượng giáo dục trường trung học là sự đáp ứng mục tiêu của trường trung học, đảm bảo các yêu cầu về mục tiêu giáo dục của Luật giáo dục, phù hợp với sự phát triển kinh tế - xã hội của địa phương và cả nước. Tiêu chuẩn đánh giá trường trung học là các yêu cầu đối với trường trung học nhằm đảm bảo chất lượng các hoạt động. Mỗi tiêu chuẩn ứng với một lĩnh vực hoạt động của trường trung học; trong mỗi tiêu chuẩn có các tiêu chí. Tiêu chuẩn đánh giá trường trung học có 4 mức (từ Mức 1 đến Mức 4) với yêu cầu tăng dần. Trong đó, mức sau bao gồm tất cả các yêu cầu của mức trước và bổ sung các yêu cầu nâng cao. Quy trình kiểm định chất lượng giáo dục và quy trình công nhận đạt chuẩn quốc gia đối với trường trung học được thực hiện theo các bước: 1. Tự đánh giá; 2. Đánh giá ngoài; 3. Công nhận trường đạt kiểm định chất lượng giáo dục và công nhận trường đạt chuẩn quốc gia. Các mức đánh giá trường trung học: Trường trung học được đánh giá theo 4 mức với 5 tiêu chuẩn sau: Tiêu chuẩn 1: Tổ chức và quản lý nhà trường Tiêu chuẩn 2: Cán bộ quản lý, giáo viên, nhân viên và học sinh Tiêu chuẩn 3: Cơ sở vât chất và trang thiết bị dạy học Tiêu chuẩn 4: Quan hệ giữa nhà trường, gia đình và xã hội Tiêu chuẩn 5: Hoạt động giáo dục và kết quả giáo dục 1.4. Chất lượng trong giáo dục đại học, cao đẳng và dạy nghề 1.4.1 Chất lượng là sự tuân thủ các tiêu chuẩn - Tiêu chuẩn là một công cụ đo lường/thước đo một sản phẩm/dịch vụ. Mỗi loại hàng hoá/dịch vụ sẽ có tiêu chuẩn đo phù hợp được đặt ra trước đó. - Tiêu chuẩn để đánh giá các trường đại học, cao đẳng (Văn bản hợp nhất Số: 06/VBHN-BGDĐT tháng 3/2014). + Khái niệm: Chất lượng giáo dục trường đại học là sự đáp ứng mục tiêu do nhà trường đề ra, đảm bảo các yêu cầu về mục tiêu giáo dục đại học của Luật giáo dục, phù hợp với yêu cầu đào tạo nguồn nhân lực cho sự phát triển kinh tế - xã hội của địa phương và cả nước. 13 Tiêu chuẩn đánh giá chất lượng giáo dục trường đại học là mức độ yêu cầu và điều kiện mà trường đại học phải đáp ứng để được công nhận đạt tiêu chuẩn chất lượng giáo dục. + Tiêu chuẩn: Tiêu chuẩn 1: Sứ mạng và mục tiêu của trường đại học Tiêu chuẩn 2: Tổ chức và quản lý Tiêu chuẩn 3: Chương trình đào tạo Tiêu chuẩn 4: Hoạt động đào tạo Tiêu chuẩn 5: Đội ngũ cán bộ quản lý, giảng viên và nhân viên Tiêu chuẩn 6: Người học Tiêu chuẩn 7: Nghiên cứu khoa học, ứng dụng, phát triển và chuyển giao công nghệ Tiêu chuẩn 8: Hoạt động hợp tác quốc tế Tiêu chuẩn 9: Thư viện, trang thiết bị học tập và cơ sở vật chất khác Tiêu chuẩn 10: Tài chính và quản lý tài chính 1.4.2 Các cách tiếp cận chất lượng trong giáo dục đại học Khi thảo luận về chất lượng trong giáo dục đại học, người ta thường nói đến các cách tiếp cận của Green. Chất Chất lượng trong giáo dục Chất lượng trong giáo dục đại học lượng nói Nguồn: Nguyễn Hữu Châu Nguồn: Green D. (1994), What is chung (chủ biên), Chất lượng giáo quality in higher education? Concepts, dục - những vấn đề lý luận Policy and Practice, in Green (ed) và thực tiễn, NXB Giáo What is quality in higher education? dục, 2008 London; SRHE/Open University Press, 1994. Là sự Chất lượng là sự xuất sắc Chất lượng là sự tuyệt hảo: Nhấn mạnh xuất sắc bẩm sinh: tự nó (là cái tốt chuẩn mực ở trình độ cao. Cái tốt nhất nhất - theo nghĩa tuyệt đối). là cái có chất lượng cao nhất, là sản phẩm không có lỗi, đạt đến sự tuyệt đối. Là sự đặc Chất lượng được xem xét Chất lượng là ngưỡng: Theo quan điểm 14 biệt trên cơ sở những thuộc tính này chất lượng được coi là việc đáp đo được (theo nghĩa tương ứng các yêu cầu của ngưỡng. Việc đặt đối). Điều đó có nghĩa là ra các tiêu chuẩn ngưỡng cũng có thể chất lượng có thể được đo cản trở việc đổi mới. Tuân thủ các tiêu lường khách quan và chính chuẩn ngưỡng không kích thích sự đổi xác. mới. Là sự Chất lượng được xem như Chất lượng là giá trị gia tăng: Quan hoàn hảo sự phù hợp với nhu cầu. niệm này nhấn mạnh vào những cái Các sản phẩm và dịch vụ xảy ra với sinh viên. Chất lượng là giá được "sản xuất" một cách trị thêm vào cho sinh viên trong quá chính xác với những "đặc trình GD & ĐT. Đó là phương pháp tính kỹ thuật" đã định; mọi xác định các kết quả học tập và hiện sự lệch lạc đều dẫn đến thực hóa các kết quả đó ở người tốt giảm chất lượng. nghiệp. Đáng giá Chất lượng là giá trị đồng tiền: Quan trị đồng niệm này tập trung vào hiệu quả, đo tiền lường đầu ra so với đầu vào. Quan điểm này thường được chính phủ ủng h vì liên quan tới trách nhiệm giải trình. Là sự Chất lượng là sự thỏa mãn khách hàng: tuân thủ Với sự phát triển của quan niệm "sinh các tiêu viên là khách hàng", chất lượng được chuẩn quy miêu tả là "một cái gì đó có chất lượng định khi nó đáp ứng những mong đợi của khách hàng; chất lượng là sự thỏa mãn khách hàng". Là sự phù Chất lượng là sự phù hợp Chất lượng là sự phù hợp với mục đích hợp với với mục đích (mục tiêu), là (là khái niệm phù hợp nhất trong giáo mục đích "đáp ứng được nhu cầu dục hiện nay) (mục tiêu) khách hàng". Chất lượng được xem xét đơn giản chỉ 15 trong con mắt của người chiêm ngưỡng sự vật hoặc sử dụng chúng. Tóm lại: Các nhà quản lý giáo dục phải xác định cho mình cách tiếp cận và quan điểm đúng đắn về chất lượng, từ đó đưa ra giải pháp phát triển giáo dục, đào tạo ra nguồn nhân lực chất lượng cao, đáp ứng nhu cầu hội nhập. 1.4.3 Một số thành tựu và khó khăn của giáo dục đại học Việt Nam Phát triển nguồn nhân lực, đặc biệt là nguồn nhân lực chất lượng cao gắn với sự phát triển của khoa học & công nghệ là một trong ba chiến lược đột phá mà Đảng và Nhà nước Việt Nam đưa ra để phát triển đất nước nhanh, ổn định trong những năm tới. Để đạt được mục tiêu này, một nhiệm vụ cấp bách đặt ra là phải thay đổi căn bản và toàn diện hệ thống giáo dục của quốc gia theo hướng chuẩn hóa, hiện đại hóa, xã hội hóa, dân chủ hóa và hội nhập quốc tế. Với mục tiêu phát triển giáo dục đại học rõ ràng, trong những năm qua, chất lượng đào tạo của các trường đại học Việt Nam không ngừng được cải thiện. Vấn đề đảm bảo chất lượng đã được triển khai rộng khắp dưới sự chỉ đạo của Bộ Giáo dục & Đào tạo và sự phối kết hợp của các trường đại học. Điều đó được thể hiện qua những kết quả cụ thể sau: Những thành tựu đã đạt được: Đầu tiên phải kể đến là hệ thống các cơ sở giáo dục đại học được phát triển và mở rộng trên phạm vi cả nước, đáp ứng tốt hơn nhu cầu học tập của xã hội. Năm 2013, Việt Nam có tổng cộng 476 cơ sở giáo dục đại học trong đó có 207 trường đại học, 214 trường cao đẳng và 55 viện nghiên cứu có đào tạo trình độ tiến sĩ. Hệ thống các trường ngoài công lập cũng được hình thành và phát triển, chiếm 19,7% trong tổng số 421 trường đại học, cao đẳng (54 trường đại học và 29 trường cao đẳng). Tổng số sinh viên đại học và cao đẳng là 2.204.313 trong đó số sinh viên học các trường ngoài công lập là 331.595 (chiếm 15,04%); 79.271 học viên cao học và 6.233 nghiên cứu sinh. Tổng số giảng viên trên toàn quốc là 84.109 giảng viên, trong đó 9,152 tiến sĩ (chiếm 10,88%), 36.360 thạc sĩ (chiếm 43,23%) (Vụ Giáo dục Đại học, Bộ Giáo dục và đào tạo, 2013). Thứ hai, hợp tác quốc tế về giáo dục đại học ngày càng được mở rộng và tăng cường. Trong thời gian qua, Việt Nam đã đàm phán ký kết các văn bản về công nhận tương đương bằng cấp giữa Việt Nam với trên 10 nước trên thế giới; gia hạn 16 và đàm phán ký mới hiệp định hợp tác về giáo dục với nước ngoài. Phối hợp với các đại học nước ngoài triển khai 35 chương trình tiên tiến ở 23 trường đại học của Việt Nam; hợp tác với Ngân hàng Thế giới, Ngân hàng phát triển Châu Á để xây dựng các đại học xuất sắc theo chỉ đạo của Thủ tướng Chính phủ (Vụ Giáo dục Đại học, Bộ Giáo dục và đào tạo, 2013). Thứ ba, về đảm bảo chất lượng: Hiện tại, đã có hơn 75% các trường đại học và 50% các trường cao đẳng đã có đơn vị đảm bảo chất lượng bên trong và 161 trường đại học, 165 trường cao đẳng đã hoàn thành báo cáo Tự đánh giá. Nhà nước cũng đã khuyến khích các trường đại học và các chương trình đào tạo đăng ký kiểm định hoặc đánh giá bởi các tổ chức kiểm định quốc tế. Hiện nay, có một số trường đã được Mạng lưới các trường đại học Đông Nam Á (AUN) và Chương trình ASEAN-QA đánh giá trong giai đoạn 2007-2013, như: Đại học Quốc gia Hà Nội và Đại học Quốc gia Thành phố Hồ Chí Minh, Trường Đại học Bách khoa Hà Nội, Trường Đại học Kinh tế TP. HCM, Trường Đại học Cần Thơ. Trường Đại học Bách khoa (Đại học Quốc gia Hồ Chí Minh) và Trường Đại học FPT đã có các chương trình đăng ký kiểm định bởi tổ chức kiểm định ABET, Hoa Kỳ (TS. Phạm Xuân Thanh, 2013). Bên cạnh những thành tựu đã đạt được, giáo dục Việt Nam đang phải đương đầu với nhiều khó khăn, thách thức, như: Hệ thống cơ sở giáo dục đại học còn phân bố chưa hợp lý giữa các địa phương, vùng miền; Bộ máy, cơ chế và cán bộ chưa thay đổi phù hợp với phương thức quản lý mới; Các điều kiện đảm bảo chất lượng mặc dù đã được quan tâm đầu tư và tăng cường, tuy nhiên chưa đáp ứng yêu cầu phát triển của hệ thống; Quản lý giáo dục và đào tạo còn nhiều bất cập, thiếu dự báo nhu cầu nguồn nhân lực cho quá trình công nghiệp hóa, hiện đại hóa đất nước; Sự gắn kết giữa Nhà trường và Doanh nghiệp trong đào tạo – nghiên cứu còn hạn chế; Chất lượng giáo dục đại học thấp so với yêu cầu thực tiễn; Thiếu một hệ thống chỉ số thực hiện và chuẩn mực chất lượng (Vụ Giáo dục Đại học, Bộ Giáo dục và đào tạo (2013); Phạm Xuân Thanh (2013)). Câu hỏi ôn tập, thảo luận 1. Nêu các quan điểm khác nhau về chất lượng và chất lượng trong giáo dục. 2. Thế nào là đảm bảo chất lượng, các thành tố của ĐBCL? 17 3. Vì sao chất lượng giáo dục có xu thế chuyển động từ ĐBCL sang chất lượng theo hợp đồng và tiến tới chất lượng theo khách hàng? 4. Xây dựng sơ đồ chất lượng giáo dục phổ thông và cao đẳng, đại học theo 3 yếu tố: đầu vào, quá trình, đầu ra. 5. Hãy đưa ra 5 khó khăn tiêu biểu nhất của giáo dục đại học ở Việt Nam và đề xuất giải pháp khắc phục nhằm nâng cao chất lượng giáo dục đại học. Tài liệu tham khảo 1. Nguyễn Đức Chính, Trần Xuân Bách, Trần Thị Thanh Phượng (2015), Quản lý chất lượng trong giáo dục, NXB Giáo dục Việt Nam. 2. Ngô Doãn Đãi (2012), Quản lý và kiểm định chất lượng, Tập bài giảng, Viện đảm bảo chất lượng giáo dục. 3. Nguyễn Hữu Châu chủ biên, 2008, Chất lượng giáo dục - những vấn đề lý luận và thực tiễn, NXB Giáo dục 4. Viện Đảm bảo chất lượng giáo dục- ĐHQGHN (2014), Đánh giá chất lượng chương trình đào tạo theo chuẩn quốc tế- hoạt động tự đánh giá và chuẩn bị cho đánh giá ngoài, Tài liệu tập huấn. 5. Vụ Giáo dục Đại học, Bộ Giáo dục và đào tạo (2013), Định hướng phát triển giáo dục đại học Việt Nam, Kỷ yếu Hội thảo quốc tế và Hội nghị bàn tròn của mạng lưới đảm bảo chất lượng ASEAN: “Xây dựng văn hóa chất lượng và Khung trình độ quốc gia”, Cục Khảo thí và đảm bảo chất lượng- Bộ Giáo dục & Đào tạo. 6. Phạm Xuân Thanh (2013), Đảm bảo chất lượng giáo dục đại học ở Việt Nam, Kỷ yếu Hội thảo quốc tế và Hội nghị bàn tròn của mạng lưới đảm bảo chất lượng ASEAN: “Xây dựng văn hóa chất lượng và Khung trình độ quốc gia”, Cục Khảo thí và đảm bảo chất lượng- Bộ Giáo dục & Đào tạo. 18 Chương 2 NHỮNG VẤN ĐỀ CƠ BẢN VỀ ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC Mục tiêu học tập: 2.1. Phân biệt được các khái niệm đo lường, đánh giá, định giá trị, chỉ ra được mối liên quan giữa các khái niệm này. 2.2. Nêu được vai trò của đo lường và đánh giá trong giáo dục; 2.3. Mô tả được một quy trình đo lường trong KHXH, phân tích ví dụ thực tiễn để minh hoạ. 2.4. Trình bày được 4 loại khung tham chiếu để lý giải kết quả đo lường, xác định được loại khung tham chiếu của một số trắc nghiệm phổ biến trong thực tiễn; 2.5. Trình bày được khái niệm mục tiêu, tiêu chuẩn, tiêu chí sử dụng trong đo lường; 2.6. Phân tích, đánh giá chất lượng của một hoạt động đo lường đơn giản trong giáo dục 19 2.1. Giới thiệu chung về đo lường trong giáo dục Bất kỳ một quá trình giáo dục nào mà một con người tham gia cũng nhằm tạo ra những biến đổi nhất định trong con người đó. Muốn biết những biến đổi đó xảy ra ở mức độ nào phải đánh giá hành vi của người đó trong một tình huống nhất định. Việc đánh giá cho phép chúng ta xác định, một là mục tiêu giáo dục được đặt ra có phù hợp hay không và có đạt được hay không, hai là việc giảng dạy có thành công hay không, học viên có tiến bộ hay không. Để việc đánh giá được đúng đắn phải triển khai đo lường: muốn so sánh vật nào nặng hơn trong hai vật có bề ngoài không khác nhau người ta phải đem cân chúng lên. Việc dạy và học đã xuất hiện trong lịch sử loài người hàng nghìn năm trước đây, và để tuyển dụng người giỏi, người ta phải tạo ra các hình thức thi để so sánh các thí sinh với nhau. Trong lịch sử giáo dục Việt Nam, nhằm giúp nhà vua đánh giá đúng hiền tài để tuyển dụng vào các chức quan lại trị nước, triều đình phải tổ chức các kỳ thi từ thấp đến cao: thi Hương, thi Hội, thi Đình. Ở các kỳ thi này, người ta ra đề thi cho sỹ tử làm bài, và các giám khảo đo lường năng lực của thí sinh qua các bài thi đó dựa vào sự nhận xét chủ quan của mình. Giám khảo giỏi và công bằng thì việc đo lường sẽ chính xác, giám khảo kém và không công bằng thì việc đo lường thường sai lệch, như vậy việc tuyển chọn đúng người tài cho quốc gia phụ thuộc nhiều vào độ chính xác trong phép đo lường năng lực thí sinh của giám khảo. Những ví dụ nêu trên cho thấy, việc đo lường và đánh giá trong giáo dục đã phát triển từ xa xưa, tuy nhiên, có thể nói một ngành khoa học thật sự về đo lường trong tâm lý và giáo dục mới bắt đầu hình thành từ cuối thế kỳ XIX. Ở Châu Âu, và đặc biệt là ở Mỹ, lĩnh vực khoa học về trắc nghiệm phát triển mạnh trong thế kỷ XX. Có thể kể những dấu mốc quan trọng trong tiến trình phát triển, như Trắc nghiệm trí tuệ Simon Binet được xây dựng bởi hai nhà tâm lý học người Pháp Al red Binet và Theodore Simon vào khoảng năm 1905, tiếp đến được áp dụng tại Đại học Stand ord ở Mỹ bởi Lewis Terman năm 1916, sau đó nó đã được cải tiến liên tục và được sử dụng ngày nay với tên gọi là Trắc nghiệm trí tuệ IQ (Intelligence Quotient). Bộ trắc nghiệm thành quả học tập tổng hợp đầu tiên Stan ord Achievement Test ra đời năm 1923 ở Mỹ. Với việc đưa vào chấm trắc 20 nghiệm bằng máy của IBM năm 1935, việc thành lập Hội đồng quốc gia về Đo lường trong giáo dục (National Council Measurement in Education – NCME) vào thập niên 1950, sự ra đời hai tổ chức tư nhân Educational Testing Service (ETS) năm 1947 và American College Testing (ACT) năm 1959, hai tổ chức làm dịch vụ trắc nghiệm lớn thứ nhất và thứ hai Hoa Kỳ, một ngành công nghiệp về trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo lường trong tâm lý và giáo dục đã phát triển liên tục, những phê bình chỉ trích đối với khoa học này cũng xuất hiện thường xuyên nhưng chúng không đánh đổ được nó mà chỉ làm nó tự điều chỉnh và phát triển mạnh mẽ hơn. Hiện nay ở Mỹ, ước tính mỗi năm số lượt trắc nghiệm tiêu chuẩn hóa cỡ ¼ tỷ và trắc nghiệm do giáo viên soạn lên đến con số 5 tỷ. Tương ứng với ngành công nghiệp trắc nghiệm đồ sộ và sự phát triển của công nghệ thông tin, lý thuyết về đo lường trong tâm lý giáo dục cũng phát triển nhanh. Các thành tựu lý luận quan trọng của khoa học về đo lường trong giáo dục đạt được cho đến thập niên 70 của thế kỷ trước được bao gồm trong “Lý thuyết trắc nghiệm cổ điển” (Classical Test Theory – CTT). Còn bước phát triển về chất của nó trong khoảng 4 thập niên vừa qua bao gồm trong “Lý thuyết trắc nghiệm hiện đại” mà cốt lõi là “Lý thuyết Ứng đáp Câu hỏi” (Item Response Theory – IRT). IRT đã đạt được những thành tựu quan trọng nâng cao độ chính xác của trắc nghiệm, và trên cơ sở lý thuyết đó, công nghệ Trắc nghiệm thích ứng nhờ máy tính (Computer Adaptive Test – CAT) ra đời. Ngoài ra, trên cơ sở những thành tựu của IRT và ngôn ngữ học máy tính, công nghệ Criterion chấm tự động các bài tự luận tiếng Anh nhờ máy tính của ETS đã được triển khai qua mạng Internet trong mấy năm qua. Đo lường (measurement) là một khái niệm chuyên dùng để chỉ sự so sánh một vật hay hiện tượng với một thước đo hay chuẩn mức, có khả năng trình bày kết quả dưới dạng thông tin định lượng hoặc định tính. Nói cách khác, đo lường là một hoạt động sử dụng thang đo với mục đích gán con số hoặc thứ bậc cho đối tượng đo (nghiên cứu) theo một hệ thống quy tắc hay chuẩn mực nào đó. Trong lĩnh vực giáo dục có nhiều định nghĩa khác nhau về đo lường: “Đo lường là gắn các con số vào các cá thể theo một quy tắc có hệ thống để biểu diễn các đặc tính của các cá thể đó” (Allen M.J và Yen W.M., 1979). 21 Đo lường là lượng hóa một đặc điểm hoặc khía cạnh nào đó của đối tượng để từ đó có thể miêu tả hay “đánh giá” đối tượng. (Griffin, 1993). “Đo lường là tiến trình đạt được sự mô tả bằng số lượng về mức độ mà một cá nhân làm được trong một lĩnh vực cụ thể.” (Gronlund, 1971). “Đo lường trong giáo dục là phương tiện để thu thập, phân tích dữ liệu về đặc tính, hành vi con người một cách có hệ thống làm cơ sở cho những hành động thích hợp”. (K.Stordahl, 1967). Những quan điểm trên đều thống nhất đo lường là sự xác định số lượng hay đưa một giá trị bằng số cho việc làm của cá nhân/ tổ chức, đó là một cách lượng hóa, là việc gán các con số hoặc thứ bậc theo một hệ thống quy tắc nào đó. Đối với hoạt động dạy học, đo lường là quá trình thu thập thông tin một cách định lượng về các đại lượng đặc trưng như nhận thức, tư duy, kỹ năng và các phẩm chất nhân cách khác trong quá trình giáo dục. Đo lường có thể thông qua việc thi kiểm tra để xác định mức độ người học nắm được kiến thức một môn học hoặc mức độ hiểu biết về một vấn đề nào đó. Kết quả thể hiện dưới dạng một đại lượng định lượng. Ví dụ phổ biến nhất của đo lường trong lớp học là khi người dạy chấm điểm vấn đáp hoặc bài kiểm tra. Những định nghĩa trên đồng thời cũng chỉ ra những bước quan trọng khi thực hiện đo lường trong giáo dục (Hình 1.1): Hình 2.1. Quá trình đo lường trong giáo dục Các loại thang đo có vai trò cực kỳ quan trọng. Thang đo lường trong nghiên cứu giáo dục có những loại chính sau đây: - Thang đo định danh: (nominal scale) là kiểu đo lường đánh giá sự vật, hiện tượng hay đặc tính theo tên gọi (định danh) theo giới tính nam-nữ; theo vùng miền (bắc, nam, trung); theo nhóm tuổi (trẻ em, người lớn); theo trình độ học lực (kém, trung bình, khá, giỏi..) hoặc khi cần phân loại theo đặc trưng màu sắc (xanh, đỏ, vàng..vv) 22 Thang định danh là phép đo khái quát không nhằm cung cấp thông tin cụ thể, chính xác về đặc tính và sự khác biệt của các đối tượng đo. - Thang định hạng: (ordinal scale) là kiểu đo lường đánh giá sự vật, hiện tượng hay đặc tính theo thứ bậc hay trật tự của chúng. Ví dụ khi muốn phân loại năng lực học tập một môn nào đó (như môn Toán chẳng hạn) của một nhóm học sinh theo thứ hạng điểm thi hoặc tổng kết từ điểm cao nhất đến điểm thấp nhất hoặc muốn phân loại đồ vật theo kích cỡ, trọng lượng từ to nhất, nặng nhất đến bé nhất, nhẹ nhất vv. Thang định hạng cũng là phép đo khái quát không nhằm cung cấp thông tin cụ thể, chính xác về đặc tính và mức độ khác biệt giữa các đối tượng mà chỉ nhằm chỉ ra vị trí, mối tương quan thứ bậc của các đối tượng đo. - Thang định khoảng: (interval scale) là kiểu đánh giá, phân loại các sự vật, hiện tượng hay đặc tính theo những đơn vị phân loại bằng nhau ở bất kỳ khoảng nào trên thang đo. Ví dụ cụ thể nhất là các phép đo bằng thước mét. Phép đo chiều cao bằng thước mét là một kiểu đo theo thang định khoảng: sự khác biệt giữa người cao 175cm-170cm và người cao 160cm -155 cm đều ở một khoảng như nhau là 5 cm. Hay các thang đo định khoảng về điểm đánh giá theo thang 10 điểm, 100 điểm..vv. Cần lưu ý một số đối tượng đo do tính chất đặc thù (khác với các phép đo cơ học ) có sự khác biệt giữa các khoảng tuyệt đối ở các mức khác nhau. Ví dụ khi đo vượt xà ở mức cao thì chênh 1-2 cm là khó đạt hơn khi còn ở mức xà thấp; những người có chỉ số IQ tương ứng là 110 và 120 (cách nhau 10 điểm) không có nghĩa giống sự cách biệt 10 điểm ở các mức 80-90 và như vậy ở đây mang tính chất của phép đo định hạng. - Thang định tỷ lệ (Ratio scale) là lại thang đo khi cần phân loại các sự vật, hiện tượng hay đặc tính với thang đo khoảng mà thang đo có điểm không thực sự. Ví dụ khi dùng thang đo vận tốc (km/giờ). Số km/giờ nói lên tốc độ chuyển động của một vật (ví dụ ôtô có vận tốc 50km/giờ). Mỗi km/giờ chỉ sự gia tăng tốc độ theo khoảng còn ở km/giờ ôtô đứng yên. Trong lĩnh vực đo đánh giá nhận thức, thái độ, năng lực, hành vi của một cá nhân trên thực tế không có điểm 0 thực sự mà là điểm 0 tự đặt (Arbitrary zero point) 23 Người ta cho rằng ít nhất là có năm trình độ/bậc chất lượng cần được định rõ trong một thang đánh giá tốt với nhiều bậc, với những mô tả về ít nhất là 3 trong 5 bậc đó. Thêm vào, có 3 loại chủ yếu của thang đánh giá nhiều bậc để lựa chọn: số, đồ hoạ và đồ hoạ mô tả. Thang đánh giá bằng số: Ví dụ: 5. Ưu tú, đạt được tất cả các tiêu chuẩn 4. Rất tốt, đạt được hầu hết các tiêu chuẩn 3. Tốt, đạt được một số tiêu chuẩn 2. Đạt, đạt được một số ít tiêu chuẩn 1. Kém, Không đạt tiêu chuẩn. Đo lường trong giáo dục có liên quan trực tiếp đến con người – chủ thể của các hoạt động giáo dục, của các mối quan hệ đa chiều. Con người là người vừa tạo ra thước đo vừa là đối tượng để đo. Để thực hiện đo lường, điều quan trọng là phải chuyển cái cần đo thành các dấu hiệu hay thao tác. Các phép đo lường chủ yếu được thực hiện một cách gián tiếp. Công cụ đo lường có thể là các nhiệm vụ cần hoàn thành hoặc các bài kiểm tra. Thông qua các bài tập này người ta xác định đặc tính của cái cần đo. Bởi trong giáo dục, có rất nhiều biến không thể đo trực tiếp (kiến thức, kĩ năng, thái độ) mà phải suy từ những kết quả đo của cái thay thế (kết quả làm bài trắc nghiệm để đo kiến thức của người học). Các biến cần đo thường dễ thay đổi và khó kiểm soát, chính vì vậy các phép đo lường trong giáo dục thường khó khăn và phức tạp. Đo lường trong giáo dục không thể không sử dụng phương pháp định tính. Định tính là sự mô tả về những dấu hiệu của biến và rõ ràng định lượng trong giáo dục không thể tách yếu tố định tính. Chính vì vậy muốn tiến hành phép đo trong giáo dục cần phải mã hóa các mô tả định tính thành các con số. Phép đo định tính và định lượng trong giáo dục phải hỗ trợ cho nhau khi thực hiện một phép đo. Nhiều tác giả nhấn mạnh tầm quan trọng của việc tuân thủ ba nguyên tắc căn bản của đo lường trong giáo dục là (John R. Hills, 1981): Quan sát từ nhiều kênh khác nhau Các quan sát phải được kiểm soát Kết quả của các quan sát phải được chuyển đổi thành các con số. 2.2. Các loại hình khung tham chiếu để giải nghĩa kết quả đo lường 24 4 loại hình khung tham chiếu để giải nghĩa kết quả đo lường bao gồm: khung tham chiếu khả năng, tham chiếu tăng trưởng, tham chiếu định mức và tham chiếu tiêu chí. Tham chiếu khả năng (Ability-referenced) Một trong các cách tiếp cận được sử dụng để giải thích điểm kiểm tra được gọi là tham chiếu theo khả năng. Với các diễn giải liên quan đến khả năng, kết quả kiểm tra của học sinh được so sánh với những gì người ta tin rằng học sinh có thể làm được dựa trên khả năng của mình. Người ta mong đợi rằng một học sinh có khả năng tốt hơn sẽ thực hiện bài kiểm tra tốt hơn so với một học sinh có khả năng trung bình. Mặc dù cách tiếp cận này nghe có vẻ khá hợp lý, nhưng thực ra nó còn tồn tại nhiều vấn đề. Khó khăn chính với cách tiếp cận này là rất khó để có được ước tính chính xác về khả năng của học sinh. Nhiều người tin rằng các bài kiểm tra I.Q và các bài kiểm tra khả năng khác có thể bằng cách nào đó kỳ diệu khai thác được khả năng bẩm sinh của chúng ta và đo lường chúng một cách chính xác. Trong những năm đầu tiên khi các bài kiểm tra dạng này được áp dụng, ngay cả các nhà tâm lý học cũng cảm thấy rằng chúng có thể khai thác và đo lường rất chính xác khả năng của người tham gia. Tuy nhiên, bây giờ với hơn 100 năm kinh nghiệm với các bài kiểm tra về khả năng, các nhà nghiên cứu đã nhận ra rằng điểm số trong các bài kiểm tra khả năng cần phải được giải thích một cách thận trọng. Có nhiều biến số ảnh hưởng đến kết quả của bài kiểm tra khả năng. Ví dụ, học sinh lớn lên trong nghèo khó hoặc thậm chí có một khuyết tật nhỏ (hoặc bị bệnh) thường đạt điểm quá thấp trong các bài kiểm tra khả năng. Những sinh viên lớn lên nói một ngôn ngữ khác, và sau đó mới học tiếng Anh, có xu hướng làm những bài kiểm tra bằng tiếng Anh kém hơn so với khả năng của họ. Đối với những sinh viên này, điểm kiểm tra của họ thường không phản ánh chính xác khả năng của họ. Với nhiều học sinh, các bài kiểm tra khả năng sẽ đánh giá thấp khả năng của học sinh. Lời khuyên là cần diễn giải các bài kiểm tra khả năng một cách thận trọng và chúng tôi không khuyến khích sử dụng khung tham chiếu theo khả năng. Tham chiếu tăng trưởng (Growth-referenced) Cách tiếp cận thứ hai để diễn giải điểm kiểm tra là cách tiếp cận so sánh. Với cách diễn giải tham chiếu tăng trưởng, người ta so sánh điểm kiểm tra của sinh viên 25 sau khi được hướng dẫn nội dung có liên quan trong bài kiểm tra với điểm số từ một bài kiểm tra tương tự được đưa ra trước khi giảng dạy. Về cơ bản, nó là một cách tiếp cận trước và sau (a pre/post approach). Bài kiểm tra đầu tiên được đưa ra trước khi được hướng dẫn và chứng minh những gì học sinh có thể làm trước khi được dạy tài liệu mới. Bài kiểm tra thứ hai được đưa ra sau khi hướng dẫn. Do đó, việc so sánh hai bài kiểm tra sẽ cung cấp một bức tranh rõ ràng về những gì học sinh đã học. Đôi khi người ta thậm chí sử dụng cùng một bài kiểm tra trong mỗi đợt thi và sau đó tính điểm chênh lệch giữa các thí sinh. Một học sinh đạt điểm cao hơn trong bài kiểm tra thứ hai so với bài kiểm tra đầu tiên học được nhiều hơn một học sinh có hỉ được tăng được 22 điểm ở bài số 2. Điều này rất hợp lý và được coi là một cách hợp lý để giải thích kết quả kiểm tra. Tuy nhiên, trong thực tế, phương pháp này vẫn có các vấn đề. Thứ nhất, đó là vấn đề ở lỗi đo lường. Về cơ bản, lỗi đo lường liên quan đến tất cả các yếu tố khiến một học sinh thực hiện bài kiểm tra theo cách khác với cách mà học sinh đó nên thực hiện. Thứ hai, Vấn đề thứ hai với các diễn giải tham chiếu tăng trưởng liên quan đến bản chất của đường cong học tập. Các đường cong học tập có xu hướng phi tuyến tính; nó có hình chữ S. Nếu đường tăng trưởng học tập là tuyến tính thì sau mỗi ngày được dạy một kỹ năng mới, kết quả học tập sẽ được cải thiện cùng một lượng từ ngày này sang ngày khác. Tuy nhiên, điều đó gần như không bao giờ xảy ra. Tham chiếu định mức (Norm-referenced) Cách thứ ba để diễn giải điểm kiểm tra là so sánh điểm số của học sinh ở bài kiểm tra đó với điểm của các học sinh khác đã làm bài kiểm tra tương tự. Với các diễn giải tham chiếu định mức, chúng ta so sánh điểm số mà một học sinh nhận được trong bài kiểm tra với điểm số từ một số nhóm định mức. 26 Trong trường hợp của một bài kiểm tra tiêu chuẩn hóa quốc gia, nhóm định mức đó thường bao gồm một lựa chọn ngẫu nhiên của hàng trăm sinh viên tương tự khác đã làm bài kiểm tra tương tự. Đối với bài kiểm tra trên lớp, nhóm định mức đó thường là các sinh viên khác trong lớp. Với các diễn giải tham chiếu định mức, về cơ bản, các sinh viên làm bài kiểm tra được xếp hạng từ những người có điểm cao nhất đến những người có điểm thấp nhất. Nếu một học sinh ở gần đầu danh sách, học sinh đó thường có được một số đánh giá tích cực khác. Nếu học sinh ở gần cuối danh sách, em sẽ nhận được điểm thấp hơn hoặc một số đánh giá kém hơn. Tuy nhiên, một vấn đề lớn với phương pháp này là các giáo viên thường bỏ qua một bước quan trọng là mô tả nhóm định mức. Vì đây là phương pháp so sánh nên rất cần thiết là phải mô tả nhóm mà học sinh đang được so sánh. Mô tả về nhóm định mức sẽ đặc biệt quan trọng nếu nhóm định mức nhỏ. Các nhóm định mức lớn hơn có nhiều khả năng đại diện được cho toàn bộ. Ngoài ra, một vấn đề khác là các diễn giải tham chiếu định mức thường không cho chúng ta biết nhiều về những kỹ năng mà học sinh đã thành thạo. Tham chiếu tiêu chí (Criterion - referenced) Cách thứ tư để diễn giải điểm kiểm tra là so sánh điểm của học sinh với một số tiêu chuẩn hoặc tiêu chí định sẵn. Điều này được gọi là tham chiếu tiêu chí. Đây có thể là một bộ tiêu chí như những tiêu chí chúng ta đã sử dụng khi còn học phổ thông: Đạt tiêu chí nào thì được xếp hạng Học sinh giỏi xuất sắc, hạng Giỏi, hạng Khá hay Trung bình. Một nhược điểm của phương pháp này là sinh viên có thể bị thiệt thòi vì giáo viên giảng dạy kém. Nếu giáo viên thực hiện công việc giảng dạy không tốt thì sinh viên nhiều khả năng sẽ thực hiện kém bài kiểm tra, điều này sẽ dẫn đến đạt điểm thấp. Tương tự, nếu giáo viên thiết kế một bài kiểm tra khó hơn tiêu chuẩn, sinh viên có thể cũng bị đạt điểm thấp. Từ quan điểm của sinh viên, đây là những bất lợi. Tuy nhiên, một số nhà giáo dục có thể lập luận rằng những vấn đề này làm cho giáo viên có trách nhiệm hơn để giảng dạy tốt hơn và thiết kế các bài kiểm tra phù hợp tiêu chí. Một nhược điểm khác của phương pháp tham chiếu theo tiêu chí là nó không thể được áp dụng cho tất cả các tình huống. Nếu một giáo viên đang thiết kế một bài kiểm tra về một chương duy nhất với số lượng mục tiêu tương đối nhỏ, thì có thể 27 thiết kế một bài kiểm tra theo tham chiếu tiêu chí. Tuy nhiên, với một bài kiểm tra bao gồm bốn chương, sẽ có nhiều mục tiêu cần được đạt trong bài kiểm tra với một định mức thời gian nhất định do GV đặt ra. Trong trường hợp đó, cách tiếp cận hợp lý duy nhất là phát triển một bài kiểm tra áp dụng cách diễn giải tham chiếu định mức. Vẫn còn một nhược điểm khác của phương pháp tham chiếu tiêu chí. Nhiều giáo viên tin rằng họ đang sử dụng cách tiếp cận tham chiếu tiêu chí đơn giản chỉ vì họ đã phát triển một số tiêu chuẩn đã có sẵn. Tuy nhiên, họ không xây dựng được một danh sách các mục tiêu và họ không thiết kế thử nghiệm để chắc chắn rằng họ đã bao quát một cách hợp lí những mục tiêu đó trong bài kiểm tra. Không có bước thứ hai, những giáo viên này thường xuyên thiết kế các bài kiểm tra khó diễn giải một cách phù hợp. 2.3. Xác định mục tiêu/tiêu chí để đo lường Để thiết kế quá trình dạy, học và đánh giá kết quả học tập, xác định rõ các mục tiêu của hoạt động giáo dục là rất quan trọng. Tại Hội nghị của Hội Tâm lý học Mỹ năm 1948, B.S.Bloom đã chủ trì xây dựng một hệ thống phân loại các mục tiêu đó. Ba lĩnh vực của các hoạt động giáo dục đã được xác định, đó là lĩnh vực về nhận thức (cognitive domain), lĩnh vực về cảm xúc, thái độ (a ective domain) và lĩnh vực về tâm lý vận động (kỹ năng). Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê phán. Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm cả những mối quan hệ như yêu ghét, thái độ nhiệt tình, thờ ơ, cũng như sự cam kết với một nguyên tắc và sự tiếp thu các ý tưởng. Lĩnh vực tâm lý vận động liên quan đến những kỹ năng đòi hỏi sự khéo léo về chân tay, sự phối hợp các cơ bắp và khả năng của thân thể từ đơn giản đến phức tạp để điều phối động tác. Các lĩnh vực nêu trên không hoàn toàn tách biệt hoặc loại trừ lẫn nhau. Phần lớn việc phát triển tâm linh và tâm lý đều bao hàm cả 3 lĩnh vực nói trên. 1. Lĩnh vực nhận thức 28 Bloom và những người cộng tác với ông ta cũng xây dựng nên các mức độ của các mục tiêu giáo dục, thường được gọi là cách phân loại Bloom, trong đó lĩnh vực nhận thức được chia thành các mức độ nhận thức (hay mức độ thao tác xử lý kiến thức) từ đơn giản nhất đến phức tạp nhất như sau: Biết (Knowledge): được định nghĩa là sự nhớ, thuộc lòng, nhận biết được và có thể tái hiện các dữ liệu, các sự việc đã biết hoặc đã học được trước đây. Điều đó có nghĩa là một người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là mức độ hành vi thấp nhất đạt được trong lĩnh vực nhận thức. Hiểu (Comprehension): được định nghĩa là khả năng nắm được ý nghĩa của tài liệu. Điều đó có thể thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác (từ các ngôn từ sang số liệu…), bằng cách giải thích tài liệu (giải nghĩa hoặc tóm tắt), mô tả theo ngôn từ của mình và bằng cách ước lượng xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng). Hành vi ở mức độ này cao hơn so với mức độ Biết, và cũng bao gồm cả mức độ Biết. Áp dụng (Application): được định nghĩa là khả năng sử dụng các tài liệu đã học vào một hoàn cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật và lý thuyết. Hành vi ở mức độ này cao hơn mức độ Biết và hiểu trên đây, và cũng bao gồm cả các mức độ đó. Phân tích (Analysis): được định nghĩa là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận, phân tích mối quan hệ giữa các bộ phận, và nhận biết được các nguyên lý tổ chức của chúng. Hành vi ở mức độ này cao hơn so với mức độ Biết, Hiểu và Áp dụng, và cũng bao gồm cả các mức độ đó, vì nó đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu. Tổng hợp (Synthesis): được định nghĩa là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế 29 hoạch hành động (dự án nghiên cứu), hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin). Hành vi ở mức độ này cao hơn so với các mức độ biết, hiểu, áp dụng, phân tích và cũng bao gồm cả các mức độ đó, nó nhấn mạnh các yếu tố sáng tạo, đặc biệt tập trung vào việc hình thành các mô hình hoặc cấu trúc mới. Đánh giá: (Evaluation): là khả năng xác định giá trị của tài liệu, phán quyết được về những tranh luận, bất đồng ý kiến (tuyên bố, tiểu thuyết, thơ, báo cáo nghiên cứu). Việc đánh giá dựa trên các tiêu chí nhất định. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí. Hành vi ở mức độ này cao hơn so với tất cả các mức độ Biết, Hiểu, Áp dụng, Phân tích, Tổng hợp và cũng bao gồm tất cả các mức độ đó. Cách phân chia mức độ thao tác xử lý kiến thức của lĩnh vực nhận thức trên đây do nhóm các nhà tâm lý học được chủ trì bởi B. Bloom đưa ra từ cách đây hơn nửa thế kỷ. Vào năm 2001, các học trò cũ của Bloom là Anderson L.W. và Krathwohl D.R sau một quá trình bàn luận với một số nhà tâm lý học, đã đưa ra phương án điều chỉnh phân loại mục tiêu trong lĩnh vực nhận thức Bloom. Nội dung chính của điều chỉnh bởi Anderson và Krathwohl là thay 2 thao tác xử lý kiến thức bằng các động từ thay vì danh từ như trước đây (trong tiếng Anh), và tạo thành một ma trận phân loại 2 chiều bằng cách, cùng với chiều đứng biểu diễn 6 thao tác xử lý kiến thức, đưa vào thêm chiều ngang biểu diễn 4 loại kiến thức liên quan đến sự vật (factual), khái niệm (conceptual), quy trình (procedural) và siêu nhận thức (metacognitive). Hiện nay trong cộng đồng giáo dục thế giới sử dụng cả hai cách phân loại cổ điển và điều chỉnh tùy theo thói quen của từng người. 2. Lĩnh vực tình cảm: Lĩnh vực tình cảm được phân chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau: Tiếp nhận (Receiving): Thể hiện sự tự nguyện tiếp nhận thông tin, sự quan tâm có lựa chọn. Đáp ứng (Responding): Thể hiện sự quan tâm tích cực để tiếp nhận, sự tự nguyện đáp ứng và cảm giác thỏa mãn. 30 Chấp nhận giá trị (Valuing): Thể hiện niềm tin và sự chấp nhận giá trị, sự ưa chuộng và sự cam kết. Tổ chức (Organization): Thể hiện sự khái quát hóa các giá trị và tổ chức thành hệ thống giá trị. Đặc trưng hóa (Characterization): Đây là cấp độ cao và phức tạp nhất. Nó bao gồm hành vi liên quan tới việc tiếp nhận một tập hợp các giá trị và sự khái quát thành đặc trưng của bản thân hay triết lý của cuộc sống. Cách phân loại mức độ hành vi của lĩnh vực tình cảm trên đây được đề xuất bởi nhóm nhà tâm lý học do Krathwohl D.R. (1964) chủ trì. 3. Lĩnh vực kỹ năng: Lĩnh vực kỹ năng được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau: Bắt chước thụ động (Imitation): Làm theo hành vi của một người khác một cách thụ động. Thao tác theo (Manipulation): Thực hiện các thao tác theo một sự hướng dẫn từng bước quy trình. Tự làm đúng (Precision): Thực hiện được một nhiệm vụ với sai sót nhỏ và dần dần chính xác hơn mà không có nguồn hướng dẫn. Thể hiện thao tác trơn tru, chính xác. Khớp nối được (Articulation): Sắp xếp được một chuỗi thao tác bằng cách kết hợp hai hay nhiều kỹ năng, có thể cải tiến thao tác cho phù hợp để giải quyết một vấn đề gì đó. Thao tác tự nhiên (Naturalisation): Chứng tỏ mức độ thực hiện thao tác một cách tự nhiên như bản năng (“không cần suy nghĩ”). Các kỹ năng được kết hợp, thao tác trình tự, thực hiện nhất quán dễ dàng, tức là mất ít năng lượng và thời gian. Cách phân loại mức độ hành vi của lĩnh vực kỹ năng trên đây được Dave R.H. (1970) đề xuất. Ngoài ra còn có một số cách phân loại đơn giản mục tiêu giáo dục khác, nhưng trên đây là các cách được sử dụng phổ biến nhất. 2.4. Độ tin cậy, độ giá trị của phép đo 31 Độ tin cậy được sử dụng để nói về sự chính xác (Precision) của việc đo đạc. Chúng liên quan đến việc đo cái gì và đã đo như thế nào, thông tin đem lại có đúng mục đích đo đạc đã nêu ra không. Nói đơn giản, độ tin cậy chỉ cho ta biết khoảng cách, sai số hay sai lệch giữa kết quả với mục đích đo đạc nêu ra. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Kiểm tra đánh giá để giúp cho nhận định, phán xét về kết quả học tập của người học không thể chỉ căn cứ vào một vài câu hỏi của bài kiểm tra mà còn phải nhận định, đánh giá hay phán xét về sự phát triển trong quá trình hoặc khả năng của người học bởi vì những bài làm và câu hỏi kiểm tra đó có thể được sao chép hoặc học thuộc lòng từ một bài làm có sẵn. Do đó cần phải tập hợp đầy đủ những quan sát tương tự để tăng thêm độ tin cậy của việc đo lường, đánh giá. Độ tin cậy phụ thuộc vào sai số của đo đạc, càng hạn chế được sai số thì càng làm tăng độ tin cậy. Sai số này có thể là do sinh viên, do sử dụng bài kiểm tra, do công cụ đo, do quản lý kiểm tra - đánh giá. Cần tìm cách biết được sai số này để làm tăng giá trị của thông tin đánh giá. - Sai số nảy sinh từ người học do họ thiếu động lực khi làm bài kiểm tra, do những kinh nghiệm trước đó đã không giúp ích gì cho họ, do lo lắng về kết quả kiểm tra, do tình trạng tâm sinh lý không ổn định, bất thường chẳng hạn như buồn bực, ốm đau hoặc do không được chuẩn bị làm bài kiểm tra. - Sai số do công cụ kiểm tra. Ví dụ trong trắc nghiệm đa phương án có các câu hỏi chứa đựng các từ mơ hồ, không rõ ràng, không sáng sủa có thể hiểu theo nhiều cách, những thông tin không được liên hệ với nhau, thang phân loại không rõ hoặc không đúng với tên gọi, những câu hỏi nêu ra so với mục tiêu chưa phải là đặc trưng, thích hợp. Những nội dung bài giảng, những điều giải thích, hướng dẫn có ý nghĩa khác nhau đối với từng người học. Một câu hỏi về dòng điện chạy qua dây dẫn có yêu cầu khác nhau giữa môn vật lý và môn kỹ thuật điện, dẫn đến điểm kiểm tra khác nhau đối với bài kiểm tra hai môn này. Vì vậy từng câu hỏi, từng câu hướng dẫn cần được lựa chọn cẩn thận trong từng bài kiểm tra. Những phần về cảm xúc trong mục tiêu giáo dục thường không rõ ràng và khó đo đạc, do đó khi đo sẽ phạm sai số lớn hơn khi đo phần nhận thức trong môn học. Sự khác nhau về độ tin cậy cũng có thể liên quan đến sự đo đạc nội dung môn học. Trong thực tiễn, các mục tiêu của quốc gia thường 32 là mờ và khó đo đạc bằng các phương pháp kiểm tra đánh giá. Sai số cũng có thể do điều kiện quản lý bài kiểm tra về cả thủ tục lẫn sản phẩm. Các nhà nghiên cứu giáo dục mong muốn không có sự khác nhau về điều kiện quản lý vì đó là nguyên nhân làm nhiễu các kết quả học tập, tác động rất xấu đến động lực học tập của sinh viên và tác hại đến kết quả giảng dạy. Các dạng độ tin cậy Có bốn dạng độ tin cậy khi xem xét tổng quan các dụng cụ đo đã được tiêu chuẩn hoá: - Dạng thứ nhất: Tin cậy về tính ổn định (Stability) của kết quả kiểm tra hàng năm. Nếu như lặp lại kiểm tra với cùng một loại sinh viên thì kết quả điểm số của nó cũng tương tự như điểm số kiểm tra trước đó một thời gian ngắn. Cả trắc nghiệm theo chuẩn và theo tiêu chí, xét về tính ổn định đều có thể cho kết quả với độ tin cậy cao. - Dạng thứ hai: Tin cậy về sự tương đương (Equivalence). Kết quả kiểm tra đối với một tập hợp sinh viên sẽ tương đương nếu ta thay bằng đề thi khác nhau trong cùng một bộ đề được soạn theo cùng bảng đặc tính. - Dạng thứ ba: Tin cậy về sự đồng nhất (Homogeneity). Kết quả kiểm tra đánh giá sẽ tương tự cho cùng đối tượng nếu ta thay đổi bài kiểm tra. - Dạng thứ tư: Tin cậy cùng loại (Interrater Reliability). Công việc của người học phù hợp với độ đo cùng thang kiểu đánh giá nghệ thuật hay thang phân loại kiểu đánh giá tác phẩm văn chương. Trong thống kê, độ tin cậy được gọi là hệ số tin cậy. Nếu kết quả đo có độ tin cậy thì có nghĩa là hoàn toàn tin tưởng, và có độ tin cậy 0 nghĩa là không tin tưởng một chút nào. Khi tiến hành kiểm tra, đề kiểm tra nếu đạt độ tin cậy từ 0,6 trở lên là có thể chấp nhận được, đối với cá nhân đòi hỏi độ tin cậy cao hơn, từ 0,7 trở lên. Khi tính toán độ tin cậy cho phù hợp, chúng ta sử dụng hai công thức khác nhau. Nếu trong các câu hỏi ta yêu cầu sinh viên trả lời riêng biệt là đúng hay sai thì ta áp dụng công thức Kuder- Richardson số 20 mà nhiều tài liệu đã nói đến (xem Trắc nghiệm và đo lường cơ bản trong giáo dục của Patric-Gri in, 1995) để tính độ tin cậy nội tại. Nếu trong các phương án trả lời có nhiều hơn một câu đúng thì ta tính hệ số tin cậy theo công thức của Cronbach. Các phương pháp xác định độ tin cậy Có nhiều phương pháp để xác định độ tin cậy của bài kiểm tra. 33 Thứ nhất: Phương pháp kiểm tra – kiểm tra lại Phương pháp này đòi hỏi hai lần tiến hành cùng một bài kiểm tra cho cùng một nhóm học sinh và tính toán độ tương quan giữa hai bộ điểm số thu được. Tuỳ thuộc vào bản chất của bài kiểm tra và khoảng thời gian giữa hai lần kiểm tra mà độ tin cậy có thể sẽ bị ảnh hưởng ở một mức độ nào đó bởi các nhân tố thuộc về người học (thay đổi về động cơ, tích luỹ thêm hay quên bớt một số điều v.v…). Nhược điểm chính của phương pháp này là phụ thuộc vào khoảng thời gian giữa hai lần kiểm tra. Thứ hai: Phương pháp dùng bài kiểm tra tương đương Đòi hỏi tiến hành hai bài kiểm tra có dạng tương đương nhau trên cùng một nhóm sinh viên và tính toán hệ số tương quan giữa hai bộ điểm số thu được. Cả hai bài kiểm tra này được tiến hành trong những thời điểm gần nhau nên độ tương quan thu được ít bị ảnh hưởng bởi các yếu tố thuộc về người học nói trên. Phương pháp dùng bài tương đương thông dụng hơn phương pháp kiểm tra lại, tuy nhiên việc xây dựng được hai bài kiểm tra tương đương về nội dung, về các đặc điểm của câu hỏi thì khó hơn. Thứ ba: Phương pháp phân nhỏ (phương pháp phù hợp nội tại) Phương pháp này đòi hỏi ước lượng hệ số tin cậy từ việc phân tích các điểm chấm của một lần kiểm tra, do vậy việc đánh giá độ tin cậy không phải tính đến các nhân tố thay đổi theo thời gian. Một trong những cách để thực hiện phương pháp này là phân chia bài kiểm tra thành hai phần tương đương nhau về tính chất, nội dung, độ khó của câu hỏi. Thông thường các câu hỏi đánh số chẵn được ghép thành một bộ, các câu hỏi đánh số lẻ được ghép thành một bộ, tính hệ số tương quan giữa hai bộ điểm số của hai nửa bài kiểm tra theo phương pháp thông thường. Một trong những khó khăn của cách tính này là do sự phân đôi theo cách khác nhau nên giá trị thu được có thể khác nhau về hệ số tương quan, mặt khác hệ số tương quan này thực ra là hệ số tương quan của nửa bài kiểm tra. Những yếu tố ảnh hưởng đến độ tin cậy Quá trình kiểm tra chịu ảnh hưởng của rất nhiều yếu tố, những yếu tố cơ bản ảnh hưởng đến độ tin cậy là: - Những yếu tố may rủi: Đối với những câu hỏi loại đúng – sai (2 lựa chọn) thì yếu tố may rủi cao hơn so với loại câu nhiều lựa chọn. Tuy nhiên, nhiều chuyên 34 gia cho rằng không nên áp dụng công thức sửa chữa việc đoán mò vì công thức này thường chỉ dùng đối với loại trắc nghiệm tốc độ. - Tính chất khó dễ của bài kiểm tra: Bài quá dễ, các điểm số có khuynh hướng tập trung vào đầu cao của thang điểm; bài quá khó, các điểm số sẽ tập trung vào phía đầu thấp của thang điểm. Điểm số không trải rộng nên khó thấy được sự khác biệt trong kết quả học tập. - Độ dài bài kiểm tra: Bài càng dài thì độ tin cậy càng cao (trong giới hạn chưa gây mệt mỏi và chán ngán). Những yêu cầu để gia tăng độ tin cậy Cùng với việc đưa ra các yếu tố ảnh hưởng đến độ tin cậy, một số tác giả có đề cập tới những điều cần thiết có thể làm gia tăng độ tin cậy cho bài kiểm tra. Đó là: - Hạn chế sử dụng các câu hỏi có ít lựa chọn để giảm các yếu tố may rủi đến mức tối đa. - Bài kiểm tra nên có độ dài phù hợp. - Các câu hỏi cần đảm bảo được yêu cầu về độ khó và độ phân biệt. - Các chỉ dẫn cho việc làm bài cần rõ ràng để sinh viên khỏi nhầm lẫn. Độ giá trị (Validity) Độ giá trị nói lên rằng các phương pháp và dụng cụ đo đạc cho phép thu được những thông tin cần phải có, đo được cái ta định đo, tức là mức độ đạt được mục đích đó. Việc đo chỉ có giá trị khi ta biết rõ ta đo lường cái gì, ở nhóm người nào. Phép đo bằng bài trắc nghiệm đạt được mục đích đo lường là phép đo có giá trị. Độ giá trị của bài trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài trắc nghiệm. Độ giá trị của kiểm tra đánh giá không thể đi vay mượn mà phải phù hợp với nội dung và phải có phương pháp thích hợp, nghĩa là không thể có phương pháp đúng cho tất cả mọi trường hợp mà chỉ đúng tùy người sử dụng nó. Một bài kiểm tra có thể là chứng cứ về giá trị cho kết quả dạy học của trường đại học này mà không thể là chứng cứ cho một trường đại học khác. Chẳng hạn Toán thống kê dùng trong trường Đại học Kinh tế có yêu cầu khác với Toán thống kê của trường Đại học Bách khoa. Người ta thường nói đến: 1. Độ giá trị bề mặt; 35 2. Độ giá trị liên quan đến tiêu chí; 3. Độ giá trị về nội dung; 4. Độ giá trị về cấu trúc Năm 1989, Messick nêu ra 6 loại độ giá trị: Loại thứ nhất: Giá trị thích hợp và tiêu biểu về nội dung. Đó là giá trị về mức độ bao trùm nội dung của môn học, bài học cần kiểm tra. Các câu hỏi trong bài kiểm tra phải là mẫu tiêu biểu cho tổng thể nội dung chương trình. Về mặt này thì với một số câu hỏi kiểm tra theo dạng tự luận sẽ khó đạt được độ giá trị cao so với một số lượng lớn các câu hỏi theo dạng trắc nghiệm lựa chọn đa phương án. Để chứng minh về độ giá trị này người ta phải lập bảng miêu tả chúng, trong đó chỉ ra ở bài kiểm tra chúng ta kiểm tra sự nắm vững môn học qua những câu hỏi nào. Loại thứ 2: Giá trị những chứng cứ cấu trúc trong của bài kiểm tra chỉ ra các câu hỏi kiểm tra đã bao phủ hầu hết nội dung giảng dạy cũng như mức độ bao phủ của các câu hỏi kiểm tra ở các trình độ từ dễ đến khó. Loại thứ 3: Giá trị của những chứng cứ về cấu trúc ngoài của bài kiểm tra. Đây là điều rất cần thiết để so sánh điểm của bài kiểm tra với các cách đo khác có liên quan. Loại thứ 4: Giá trị của những chứng cứ về sự trung thực trong quá trình kiểm tra nói lên điểm và thang phân loại qua kiểm tra có phản ánh đúng thực chất. Khi đó người xây dựng bài kiểm tra tin tưởng rằng sinh viên ít có điều kiện gian dối khi làm bài kiểm tra. Loại thứ 5: Giá trị của những chứng cứ về sự tương tự cũng như sự khác nhau qua nhiều lần tiến hành và với các nhóm người làm bài kiểm tra. Loại thứ 6: Giá trị chứng cứ về những mối liên quan của kiểm tra đánh giá với hệ quả xã hội mà việc thi cử, kiểm tra gây ra. Đây là những cơ sở giúp cho việc xây dựng qui trình kiểm tra. Trong quá trình lựa chọn các phương pháp cũng như các công cụ kiểm tra, bên cạnh sự quan tâm đến mục tiêu của chương trình, kiểm tra đánh giá còn phải chú ý đến sự công bằng và bình đẳng giữa các sinh viên, thể hiện ở độ tin cậy và độ giá trị. Theo truyền thống, độ tin cậy phải được xem xét trước hết bởi vì giá trị của kiểm tra đánh giá bị giới hạn bởi sự chính xác của nó. Mặt khác độ giá trị lại bị hạn 36 chế bởi độ tin cậy của kiểm tra. Một bài kiểm tra muốn có giá trị thì phải có độ tin cậy. Nếu bài kiểm tra, bài thi có độ tin cậy thấp thì việc kiểm tra đó không thể dẫn đến một kết quả gì cả về nội dung cũng như dự báo. Vì vậy, khi kiểm tra kết quả học tập cần quan tâm đến độ tin cậy. Câu hỏi ôn tập, thảo luận 1. Mô tả ngắn gọn các khái niệm cơ bản về đo lường và kiểm tra đánh giá trong giáo dục. Hãy chỉ ra mối quan hệ giữa các khái niệm đó và lấy ví dụ minh họa. 2. Ba loại hình chủ yếu trong kiểm tra đánh giá trong dạy học là gì? Phân biệt 3 loại hình dựa trên mục đích, về tính toán thời gian và loại thông tin thường được sử dụng để tiến hành. 3. Độ tin cậy và độ giá trị là gì? Chúng ảnh hưởng như thế nào tới kết quả kiểm tra đánh giá? 4. Gọi tên loại hình khung tham chiếu giải thích kết quả kiểm tra trong từng tình huống sau: a. Bố mẹ của Amanda muốn biết cô ấy học tập như thế nào ở lớp Sinh học. Khi họ gọi cho GV của con gái, cô Hower báo rằng Amanda có đạt điểm thi tốt hơn 70% các bạn khác trong lớp ở bài thi cuối kì. b. Cô Pierce cho học sinh làm bài pre-test trước khi cô dạy bài phân số. Sau 2 tuần, cô cho học sinh làm 1 bài kiểm tra tương tự để kiểm tra học sinh của cô đã học được những gì. c. Thầy Lean đặt ra nội qui trong lớp thầy rằng tất cả các học sinh cần đạt ít nhất 90% điểm bài thi chính tả nếu không học sinh đó sẽ phải thi lại vào ngày hôm sau. d. Vì học sinh của mình đã học về các hành tinh từ năm ngoái, cô Gates mong đợi các em làm bài thi về hệ mặt trời rất tốt. 5. Hãy đưa ra các ví dụ tương ứng v?