General

ใช้ AI ช่วยครูออกแบบการประเมิน ด้วยแนวคิด Backward Design

ชวนครูใช้ AI ร่วมกับแนวคิด Backward Design เริ่มจากผลลัพธ์ที่อยากเห็น แล้วย้อนกลับมาออกแบบหลักฐาน การประเมิน และกิจกรรมให้สอดคล้องกัน

อ.ยอ

Instructor

3 นาที

27 มีนาคม 2569

Backward Design Assessment Teaching Evaluation

เวลาเราจะออกแบบการเรียนการสอนสักหนึ่งหน่วย สิ่งที่ผุดขึ้นมาในหัวก่อนมักเป็นคำถามอย่าง จะสอนกิจกรรมอะไรดี หรือจะออกข้อสอบแบบไหนดี ซึ่งก็เป็นเรื่องปกติ เพราะครูต้องคิดหลายอย่างพร้อมกัน ทั้งเวลา เนื้อหา ความพร้อมของผู้เรียน และข้อจำกัดในห้องเรียนจริง

แต่ปัญหาที่พบอยู่บ่อยคือ เราอาจได้กิจกรรมที่ทำได้จริงในห้องเรียนและดูน่าสนใจ ทว่าเมื่อถึงเวลาวัดผลกลับพบว่าสิ่งที่วัดไม่ตรงกับสิ่งที่เราอยากให้เด็กได้จริง บางครั้งเราอยากวัดการคิดวิเคราะห์ แต่เครื่องมือที่ใช้กลับวัดการจำ บางครั้งเราอยากให้เด็กอธิบายอย่างมีเหตุผล แต่สุดท้ายกลับตัดสินจากคำตอบสุดท้ายเพียงอย่างเดียว

ตรงนี้เองที่แนวคิด Backward Design ของ Wiggins และ McTighe มีประโยชน์มาก เพราะมันชวนให้เราเปลี่ยนจุดเริ่มต้นของการออกแบบ จากการเริ่มที่กิจกรรมหรือแบบทดสอบ มาเริ่มที่ปลายทางก่อน กล่าวคือถามให้ชัดว่า เมื่อเรียนจบแล้วเราอยากเห็นอะไรจากผู้เรียน แล้วค่อยย้อนกลับมาออกแบบหลักฐาน การประเมิน และกิจกรรมให้สอดคล้องกัน

ฟังดูเหมือนเป็นเพียงการสลับลำดับการคิด แต่ในทางปฏิบัติ ผลที่ได้ต่างกันมาก เพราะเมื่อครูเริ่มจากสิ่งที่อยากเห็นจริง ๆ ภาพของหน่วยการเรียนจะคมขึ้นทันที ทั้งในแง่เป้าหมาย วิธีประเมิน และกิจกรรมที่เลือกใช้

และถ้าวันนี้ครูเริ่มใช้ AI ช่วยคิดโจทย์ ช่วยร่าง rubric หรือช่วยตั้งต้นแบบประเมิน วิธีคิดแบบนี้ยิ่งสำคัญขึ้นไปอีก เพราะ AI จะช่วยเราได้มากก็ต่อเมื่อโจทย์ตั้งต้นชัดพอว่า เรากำลังออกแบบการเรียนรู้เพื่ออะไร และอยากเห็นหลักฐานแบบไหนจากผู้เรียน

ทำไมการประเมินจึงมักเหนื่อย แต่ยังไม่คม

ครูจำนวนมากไม่ได้มีปัญหาเรื่องความตั้งใจ ตรงกันข้าม หลายคนตั้งใจมาก ออกแบบเอง ตรวจเอง ปรับเองแทบทุกขั้นตอน สิ่งที่ทำให้เหนื่อยคือ บางครั้งยิ่งทำเยอะก็ยิ่งรู้สึกว่าไม่แน่ใจว่าสุดท้ายแล้วเรากำลังวัดอะไรกันแน่

ยกตัวอย่างเช่น ครูวิทยาศาสตร์ ม.2 อาจอยากวัดว่าเด็กอธิบายความสัมพันธ์ในระบบนิเวศได้หรือไม่ แต่ข้อสอบที่ใช้กลับเป็นปรนัยถามคำศัพท์เรื่องผู้ผลิต ผู้บริโภค และผู้ย่อยสลาย ครูฟิสิกส์ ม.6 อาจอยากวัดความเข้าใจเรื่องกัมมันตภาพรังสี แต่ชิ้นงานที่ให้ส่งกลับกลายเป็นการแทนค่าสูตรจนไม่เห็นว่าเด็กตีความข้อมูลการสลายตัวได้จริงหรือไม่ หรือในวิชาภาษาไทย ครูอยากวัดการตีความ แต่ให้เด็กตอบสั้นเพียง 1-2 บรรทัด จนมองไม่เห็นกระบวนการคิด

ผลก็คือ เด็กเองก็ไม่แน่ใจว่าควรโฟกัสอะไร ส่วนครูก็ต้องทำงานหนักกับข้อมูลจำนวนมากที่ไม่ได้ช่วยให้ตัดสินใจเรื่องการสอนในคาบถัดไปได้จริง

Backward Design ช่วยให้เรากลับไปตั้งหลักกับคำถามที่สำคัญที่สุดก่อนว่า เมื่อหน่วยนี้จบลง เราอยากเห็นอะไรจากผู้เรียนจริง ๆ คำถามนี้ดูเรียบง่าย แต่เป็นจุดที่ทำให้การออกแบบทั้งหน่วยเริ่มมีทิศทาง

Backward Design เริ่มจากผลลัพธ์ ไม่ได้เริ่มจากข้อสอบ

ขั้นแรกของ Backward Design คือการกำหนดผลลัพธ์ที่ต้องการ หรือ Desired Results

ฟังดูคล้ายจุดประสงค์การเรียนรู้ทั่วไป แต่จริง ๆ แล้วลึกกว่านั้น เพราะมันไม่ได้ถามแค่ว่าเด็กต้องรู้เรื่องอะไร แต่ถามต่อด้วยว่า เด็กควรเข้าใจอะไร ควรนำไปใช้ต่อได้อย่างไร และควรมีหลักฐานแบบไหนที่บอกได้ว่าเขาได้จริง

ตัวอย่างเช่น แทนที่จะเขียนกว้าง ๆ ว่า “เข้าใจเรื่องแรงลัพธ์” เราอาจเขียนให้คมขึ้นว่า “นักเรียนสามารถใช้แนวคิดเรื่องแรงลัพธ์อธิบายได้ว่าทำไมวัตถุบางกรณีหยุดนิ่งแม้มีแรงหลายแรงกระทำ” หรือแทนที่จะเขียนว่า “รู้เรื่องกัมมันตภาพรังสี” ก็อาจระบุว่า “นักเรียนสามารถตีความข้อมูลการสลายตัวและอธิบายความหมายของ half-life ในสถานการณ์จริงได้”

ครูหลายคนคุ้นกับการเขียนเป้าหมายในระดับรู้ เข้าใจ หรือทำได้ ซึ่งยังจำเป็นอยู่ แต่ถ้าจะใช้ Backward Design ให้คมขึ้น เราควรถามเพิ่มอีกหน่อยว่า หน่วยนี้มีแก่นอะไรที่เราอยากให้เด็กพกติดตัวไปหลังเรียนจบ มีความเข้าใจผิดอะไรที่เด็กมักพลาด และถ้าเจอสถานการณ์ใหม่ เด็กควรเอาความรู้นี้ไปใช้ได้อย่างไร

เมื่อคำถามพวกนี้ชัดขึ้น ภาพของหน่วยการเรียนก็จะเปลี่ยน จากเดิมที่เห็นเป็นเพียงหัวข้อเนื้อหา จะเริ่มกลายเป็นเส้นทางของการพัฒนาความเข้าใจ ไม่ใช่เพียงการสอนให้ครบหัวข้อเท่านั้น

เมื่อปลายทางชัด เราจะเริ่มเห็นว่าควรใช้หลักฐานแบบไหน

ขั้นต่อมาคือการกำหนดหลักฐานที่ยอมรับได้ หรือ Assessment Evidence

จุดนี้เป็นหัวใจสำคัญมาก เพราะแทนที่จะถามว่า จะออกข้อสอบอะไรดี แนวคิดนี้ชวนให้ถามก่อนว่า ถ้าเด็กเข้าใจจริง เขาควรแสดงอะไรให้เราเห็น

บางหน่วยอาจเหมาะกับข้อสอบสั้น บางหน่วยอาจเหมาะกับการเขียนอธิบาย บางหน่วยอาจต้องใช้การทดลอง การนำเสนอ หรือชิ้นงานที่สะท้อนการใช้ความรู้ในสถานการณ์จริง

เช่น ถ้าอยากวัดการคิดเชิงวิทยาศาสตร์ในหน่วยกัมมันตภาพรังสี หลักฐานที่ใช้ก็อาจเป็นกราฟการสลายตัวแล้วให้เด็กอธิบายจากข้อมูล ไม่ใช่แค่เลือกข้อถูกจากตัวเลือก ถ้าอยากวัดการประยุกต์ใช้คณิตศาสตร์ อาจให้เด็กแก้โจทย์สถานการณ์จริงพร้อมอธิบายว่าทำไมจึงเลือกวิธีนี้ และถ้าอยากวัดการสื่อสาร อาจใช้ mini presentation 2 นาที พร้อมเกณฑ์ว่าการอธิบายที่ดีควรมีอะไรบ้าง

ประเด็นสำคัญคือ อย่ารีบผูกคำว่าการประเมินไว้กับข้อสอบเพียงอย่างเดียว

ถ้าเราอยากเห็นการคิดวิเคราะห์ เราอาจต้องดูเหตุผลของเด็ก ไม่ใช่ดูแค่ว่าตอบถูกหรือผิด ถ้าเราอยากเห็นการสื่อสารทางวิชาการ เราอาจต้องให้โอกาสเด็กอธิบายอย่างเป็นระบบ ถ้าเราอยากเห็นการประยุกต์ใช้ เราก็ควรมีภาระงานที่ไม่ใช่แค่ทำตามแบบเดิม

เมื่อคิดแบบนี้แล้ว การประเมินไม่ได้ยากขึ้นเสมอไป แต่กลับตรงขึ้น และเมื่อตรงขึ้น งานตรวจหลายอย่างก็มีความหมายมากขึ้นด้วย เพราะมันสะท้อนสิ่งที่เราอยากเห็นจริง ๆ

Rubric ที่ดีช่วยมากกว่าการให้คะแนน

หลายคนรู้สึกว่า rubric เป็นงานเพิ่ม แต่ในความเป็นจริง rubric ที่ดีช่วยทั้งครูและนักเรียนอย่างมาก

สำหรับครู มันช่วยให้เราตอบตัวเองได้ว่างานแบบไหนเรียกว่า “ถึงเป้า” งานแบบไหนยังไม่ถึง และอะไรคือความต่างระหว่างงานที่พอใช้กับงานที่แข็งแรงจริง

สำหรับนักเรียน rubric ที่ชัดจะช่วยให้เขารู้ว่าควรพัฒนาอะไรต่อ ไม่ใช่เห็นเพียงคะแนนรวมแล้วจบกันไป

สิ่งสำคัญคือ rubric ควรเขียนด้วยภาษาที่มองเห็นและสังเกตได้จริง เช่น ถ้าภาระงานคือให้เด็กอ่านกราฟการสลายตัวของสารแล้วอธิบายความหมายของ half-life rubric แบบสั้นอาจเขียนไว้ประมาณนี้

ระดับดี: อธิบายครบประเด็น ใช้หลักฐานจากกราฟ และเชื่อมเหตุผลได้ชัด
ระดับพอใช้: อ่านข้อมูลได้บางส่วนและตอบได้ใกล้เคียง แต่เหตุผลยังไม่ต่อเนื่อง
ระดับต้องพัฒนา: มีคำตอบ แต่ยังไม่ใช้ข้อมูลหรือเหตุผลรองรับ

เมื่อเกณฑ์ชัด การให้ feedback ก็ง่ายขึ้น และการปรับการสอนก็แม่นขึ้นด้วย ที่สำคัญ เด็กจะมองเห็นด้วยว่าคุณภาพของงานที่ดีหน้าตาเป็นอย่างไร

กิจกรรมยังสำคัญ แต่ควรมาหลังจากเป้าหมายและหลักฐาน

ใน Backward Design กิจกรรมยังมีความสำคัญมาก เพียงแต่กิจกรรมจะมาทีหลังจากเป้าหมายและหลักฐาน

นี่เป็นจุดที่ช่วยครูได้มาก เพราะทำให้เราหยุดถามเพียงว่ากิจกรรมนี้สนุกไหม แล้วเปลี่ยนเป็นถามว่า กิจกรรมนี้พาเด็กไปสู่สิ่งที่เราจะประเมินจริงหรือไม่

ถ้าปลายทางคือให้เด็กอภิปรายจากข้อมูลเรื่อง half-life ระหว่างทางก็ควรมีกิจกรรมที่ฝึกอ่านตาราง ฝึกตีความกราฟ และฝึกเขียนเหตุผลสั้น ๆ จากข้อมูลจริง ถ้าปลายทางคือ performance task เรื่องการจัดการขยะในโรงเรียน ระหว่างทางก็ควรมีกิจกรรมเก็บข้อมูล สัมภาษณ์ผู้เกี่ยวข้อง เปรียบเทียบทางเลือก และลองเสนอข้อเสนอที่มีเหตุผล

เมื่อมองเช่นนี้ กิจกรรมจึงไม่ได้หายไป แต่กลายเป็นสะพานที่ถูกออกแบบอย่างตั้งใจมากขึ้น ครูจะเริ่มเห็นว่ากิจกรรมที่ดีไม่ใช่แค่ทำให้ห้องเรียนคึกคัก แต่ต้องพาเด็กเข้าใกล้ผลลัพธ์ที่ต้องการด้วย

การประเมินที่ดีไม่ควรรอจนจบหน่วย

อีกเรื่องหนึ่งที่สำคัญมากคือความต่างระหว่างการประเมินเพื่อสรุปผล กับการประเมินเพื่อพัฒนาการเรียนรู้

ถ้าเรารอไปดูผลตอนสอบท้ายหน่วยอย่างเดียว หลายครั้งมันสายเกินไปที่จะช่วยเด็กที่ยังไม่เข้าใจ เพราะบทเรียนได้ผ่านไปแล้ว

แต่ถ้าเรามีการเก็บหลักฐานระหว่างทาง เช่น คำถามสั้นท้ายคาบ การให้เด็กเขียนเหตุผลสั้น ๆ การให้ลองอธิบายด้วยภาษาของตัวเอง หรือการสังเกตชิ้นงานระหว่างทำ ครูก็จะเห็นเร็วขึ้นว่าเด็กกำลังติดตรงไหน เช่น ท้ายคาบอาจให้เด็กตอบ exit ticket 1 ข้อว่า “จากกราฟนี้ ปริมาณสารจะเหลือประมาณเท่าไรหลัง 3 ครึ่งชีวิต และเพราะอะไร” หรือให้เขาเขียนสั้น ๆ ว่า “เมื่อก่อนฉันคิดว่า... ตอนนี้ฉันคิดว่า...” เพื่อดูว่าความเข้าใจเปลี่ยนไปอย่างไร

เมื่อเห็นเร็ว เราก็ปรับได้เร็ว ถ้าครูอ่านคำตอบแล้วพบว่าเด็กจำนวนมากยังสับสนเรื่อง half-life คาบถัดไปก็อาจต้องย้อนด้วยกิจกรรมสั้น ๆ ก่อนเดินต่อ ตรงนี้ทำให้การประเมินไม่ใช่แค่เรื่องของคะแนน แต่เป็นส่วนหนึ่งของการสอนจริง ๆ และทำให้ห้องเรียนตอบสนองต่อผู้เรียนมากขึ้น

Formative Assessment Loop ทำให้การประเมินมีชีวิต

สิ่งที่น่าเสียดายที่สุดไม่ใช่การออกแบบแบบประเมินไม่สวย แต่คือการเก็บข้อมูลแล้วไม่ได้นำกลับมาใช้ต่อ

ในห้องเรียนจริง การประเมินที่ทรงพลังมักมีลักษณะเป็นวงรอบ คือ สอน เก็บหลักฐาน ดูว่าผู้เรียนเข้าใจแค่ไหน แล้วปรับการสอน

ฟังดูธรรมดา แต่พอทำสม่ำเสมอ ห้องเรียนจะเปลี่ยนมาก เพราะครูจะไม่ต้องเดาอีกต่อไปว่าเด็กเข้าใจหรือยัง แต่มีหลักฐานเล็ก ๆ ระหว่างทางคอยบอกอยู่ตลอด

เด็กเองก็จะรู้สึกว่าการประเมินไม่ได้มีไว้ตัดสินอย่างเดียว แต่มีไว้ช่วยให้เขาไปต่อได้ดีขึ้นด้วย เมื่อการประเมินเชื่อมกับการสอนอย่างต่อเนื่อง ห้องเรียนก็จะค่อย ๆ เปลี่ยนจากพื้นที่ของการรอคะแนน ไปเป็นพื้นที่ของการพัฒนา

ถ้าอยากเริ่มใช้จริง ควรเริ่มอย่างไร

ถ้ายังไม่อยากปรับทั้งหน่วย ลองเริ่มจากเล็ก ๆ ก่อนก็ได้ เริ่มจากถามตัวเองว่า หลังจบคาบหรือจบหน่วยนี้ เราอยากเห็นอะไรจากผู้เรียน จากนั้นเลือกหลักฐานหนึ่งอย่างที่สะท้อนสิ่งนั้นได้จริง แล้วค่อยคิดกิจกรรมที่พาไปถึงตรงนั้น

เพียงเท่านี้ เราก็กำลังเริ่มคิดแบบ Backward Design แล้ว

ถ้าต้องการตัวช่วยในการจัดความคิดตั้งต้นให้เป็นระบบมากขึ้น สามารถเข้าไปดูได้ที่ https://styloracademy.com/labs/evaluation-prompt ซึ่งช่วยรวบข้อมูลสำคัญตั้งต้น เช่น วิชา ระดับชั้น หน่วย สิ่งที่อยากวัด หลักฐาน และข้อจำกัดของชั้นเรียน เพื่อให้ครูมองภาพรวมของงานประเมินได้ชัดขึ้นตั้งแต่ต้น

จาก prompt ตั้งต้น ไปสู่เอกสารประเมินจริง

จุดสำคัญคือ หน้า evaluation-prompt เป็นจุดเริ่มต้นของการจัดความคิด ไม่ใช่ปลายทางสุดท้ายของงานประเมิน เช่น ถ้าครูฟิสิกส์กำลังสอนหน่วยกัมมันตภาพรังสี ครูอาจกรอกไว้ว่าอยากวัดความสามารถในการตีความข้อมูลการสลายตัว หลักฐานที่ต้องการคือใบงานและการอธิบายจากข้อมูลที่ได้จากเครื่องคิดเลข เมื่อกรอกครบเท่าที่มีอยู่ ระบบจะได้ prompt ตั้งต้นที่ช่วยสรุปโจทย์ของเราให้อยู่ในรูปที่พร้อมนำไปทำงานต่อ

หลังจากนั้น ขั้นตอนที่ควรทำต่อคือคัดลอก prompt ที่ได้ออกจากหน้า evaluation-prompt แล้วนำไปวางใน LLM ที่ตนเองถนัด เช่น ChatGPT, Gemini, Claude หรือระบบอื่นที่ใช้ประจำ จากนั้นจึงรันต่อเพื่อให้ได้ผลลัพธ์ที่ละเอียดขึ้น บางครั้งผลลัพธ์อาจออกมาในรูปของ prompt ใหม่ที่คมกว่าเดิม บางครั้งอาจเป็นโครงร่างชุดประเมิน ข้อเสนอของ rubric หรือข้อความตั้งต้นที่พร้อมให้ครูหยิบไปปรับใช้ต่อ ในกรณีของครูฟิสิกส์ ตัวที่ได้กลับมาอาจเป็นโครงภาระงานที่ให้เด็กอ่านกราฟการสลายตัว อธิบายความหมายของ half-life และเชื่อมกับสถานการณ์จริงเรื่องเวลาและปริมาณสาร

เมื่อได้ผลลัพธ์รอบนั้นแล้ว ค่อยนำผลลัพธ์ไปใช้สร้างเอกสารประเมินจริงอีกที เช่น แผนประเมิน rubric ใบงานแบบ performance task หรือชุดหลักฐานการเรียนรู้ที่ต้องใช้ในหน่วยนั้น ครูอาจหยิบโครงที่ AI ช่วยร่างมาแปลงต่อเป็น rubric สำหรับตรวจการอธิบาย ใบงานสำหรับอ่านข้อมูล และคำถามสะท้อนคิดท้ายคาบ วิธีคิดแบบนี้ช่วยให้เครื่องมือทำหน้าที่เป็นตัวช่วยขยายความคิด แต่การตัดสินใจสุดท้ายยังอยู่ที่ครูและบริบทของห้องเรียนจริง

อีกจุดหนึ่งที่ควรระวังคือ ถ้าในผลลัพธ์มีคำว่า [ต้องเติม] ให้เข้าใจว่านั่นคือส่วนที่ AI ไม่ควรเดาแทนเรา เช่น ตัวชี้วัด เกณฑ์ผ่านขั้นต่ำ เงื่อนไขเฉพาะของโรงเรียน รูปแบบงานรายบุคคลหรือรายกลุ่ม เวลา หรือข้อจำกัดจริงในชั้นเรียน ในตัวอย่างนี้ ครูต้องกลับมาเติมให้ชัดว่าใช้เวลากี่คาบ มีนักเรียนกี่คน ใช้ชิ้นงานเดี่ยวหรือกลุ่ม และระดับใดจึงถือว่าผ่าน ก่อนนำไปใช้จริงเสมอ เพราะส่วนนี้คือบริบทสำคัญที่ทำให้งานประเมินใช้ได้จริง ไม่ใช่เพียงดูดีบนกระดาษ

สุดท้ายแล้ว การวัดที่ดีเริ่มจากคำถามที่ดี

Backward Design ไม่ได้เป็นวิธีที่ไกลจากห้องเรียนจริง ตรงกันข้าม มันเป็นวิธีคิดที่ช่วยให้สิ่งที่เราตั้งใจสอน สิ่งที่เด็กลงมือทำ และสิ่งที่เรานำมาตัดสินผล สอดคล้องกันมากขึ้น

เมื่อเริ่มจากปลายทางที่ชัด เราจะออกแบบการประเมินได้ตรงขึ้น เมื่อการประเมินตรงขึ้น กิจกรรมก็จะไม่หลุดเป้า และเมื่อทั้งหมดเชื่อมกัน การเรียนรู้ของผู้เรียนก็มีโอกาสลึกและยั่งยืนมากขึ้น

บางครั้งจุดเริ่มต้นที่สำคัญที่สุดอาจไม่ใช่คำถามว่า วันนี้จะสอนอะไรดี แต่เป็นคำถามที่เรียบง่ายกว่านั้น คือ เมื่อหน่วยนี้จบลง เราอยากเห็นอะไรจากผู้เรียนจริง ๆ

เอกสารอ้างอิง

McTighe, J., & Wiggins, G. (2012). Understanding by Design Framework. ASCD.
McTighe, J. (2014). Improve Curriculum, Assessment, and Instruction Using the Understanding by Design Framework. ASCD.
Wiggins, G., & McTighe, J. (2005). Understanding by Design (Expanded 2nd ed.). ASCD.
Wiggins, G., & McTighe, J. (2011). The Understanding by Design Guide to Creating High-Quality Units. ASCD.