กลับไปที่คอนเทนต์
General

ใช้ AI ช่วยครูออกแบบการประเมิน ด้วยแนวคิด Backward Design

ชวนครูใช้ AI ร่วมกับแนวคิด Backward Design เริ่มจากผลลัพธ์ที่อยากเห็น แล้วย้อนกลับมาออกแบบหลักฐาน การประเมิน และกิจกรรมให้สอดคล้องกัน

อ.ยอ's avatar
อ.ยอ
Instructor
10 นาที
27 มีนาคม 2569
Backward Design Assessment Teaching Evaluation

เวลาเราจะออกแบบการเรียนการสอนสักหนึ่งหน่วย สิ่งที่ผุดขึ้นมาในหัวก่อนมักเป็นคำถามอย่าง จะสอนกิจกรรมอะไรดี หรือจะออกข้อสอบแบบไหนดี ซึ่งก็เป็นเรื่องปกติ เพราะครูต้องคิดหลายอย่างพร้อมกัน ทั้งเวลา เนื้อหา ความพร้อมของผู้เรียน และข้อจำกัดในห้องเรียนจริง

แต่ปัญหาที่พบอยู่บ่อยคือ เราอาจได้กิจกรรมที่ทำได้จริงในห้องเรียนและดูน่าสนใจ ทว่าเมื่อถึงเวลาวัดผลกลับพบว่าสิ่งที่วัดไม่ตรงกับสิ่งที่เราอยากให้เด็กได้จริง บางครั้งเราอยากวัดการคิดวิเคราะห์ แต่เครื่องมือที่ใช้กลับวัดการจำ บางครั้งเราอยากให้เด็กอธิบายอย่างมีเหตุผล แต่สุดท้ายกลับตัดสินจากคำตอบสุดท้ายเพียงอย่างเดียว

ตรงนี้เองที่แนวคิด Backward Design ของ Wiggins และ McTighe มีประโยชน์มาก เพราะมันชวนให้เราเปลี่ยนจุดเริ่มต้นของการออกแบบ จากการเริ่มที่กิจกรรมหรือแบบทดสอบ มาเริ่มที่ปลายทางก่อน กล่าวคือถามให้ชัดว่า เมื่อเรียนจบแล้วเราอยากเห็นอะไรจากผู้เรียน แล้วค่อยย้อนกลับมาออกแบบหลักฐาน การประเมิน และกิจกรรมให้สอดคล้องกัน

ฟังดูเหมือนเป็นเพียงการสลับลำดับการคิด แต่ในทางปฏิบัติ ผลที่ได้ต่างกันมาก เพราะเมื่อครูเริ่มจากสิ่งที่อยากเห็นจริง ๆ ภาพของหน่วยการเรียนจะคมขึ้นทันที ทั้งในแง่เป้าหมาย วิธีประเมิน และกิจกรรมที่เลือกใช้

และถ้าวันนี้ครูเริ่มใช้ AI ช่วยคิดโจทย์ ช่วยร่าง rubric หรือช่วยตั้งต้นแบบประเมิน วิธีคิดแบบนี้ยิ่งสำคัญขึ้นไปอีก เพราะ AI จะช่วยเราได้มากก็ต่อเมื่อโจทย์ตั้งต้นชัดพอว่า เรากำลังออกแบบการเรียนรู้เพื่ออะไร และอยากเห็นหลักฐานแบบไหนจากผู้เรียน

ทำไมการประเมินจึงมักเหนื่อย แต่ยังไม่คม

ครูจำนวนมากไม่ได้มีปัญหาเรื่องความตั้งใจ ตรงกันข้าม หลายคนตั้งใจมาก ออกแบบเอง ตรวจเอง ปรับเองแทบทุกขั้นตอน สิ่งที่ทำให้เหนื่อยคือ บางครั้งยิ่งทำเยอะก็ยิ่งรู้สึกว่าไม่แน่ใจว่าสุดท้ายแล้วเรากำลังวัดอะไรกันแน่

ยกตัวอย่างเช่น ครูวิทยาศาสตร์ ม.2 อาจอยากวัดว่าเด็กอธิบายความสัมพันธ์ในระบบนิเวศได้หรือไม่ แต่ข้อสอบที่ใช้กลับเป็นปรนัยถามคำศัพท์เรื่องผู้ผลิต ผู้บริโภค และผู้ย่อยสลาย ครูฟิสิกส์ ม.6 อาจอยากวัดความเข้าใจเรื่องกัมมันตภาพรังสี แต่ชิ้นงานที่ให้ส่งกลับกลายเป็นการแทนค่าสูตรจนไม่เห็นว่าเด็กตีความข้อมูลการสลายตัวได้จริงหรือไม่ หรือในวิชาภาษาไทย ครูอยากวัดการตีความ แต่ให้เด็กตอบสั้นเพียง 1-2 บรรทัด จนมองไม่เห็นกระบวนการคิด

ผลก็คือ เด็กเองก็ไม่แน่ใจว่าควรโฟกัสอะไร ส่วนครูก็ต้องทำงานหนักกับข้อมูลจำนวนมากที่ไม่ได้ช่วยให้ตัดสินใจเรื่องการสอนในคาบถัดไปได้จริง

Backward Design ช่วยให้เรากลับไปตั้งหลักกับคำถามที่สำคัญที่สุดก่อนว่า เมื่อหน่วยนี้จบลง เราอยากเห็นอะไรจากผู้เรียนจริง ๆ คำถามนี้ดูเรียบง่าย แต่เป็นจุดที่ทำให้การออกแบบทั้งหน่วยเริ่มมีทิศทาง

Backward Design เริ่มจากผลลัพธ์ ไม่ได้เริ่มจากข้อสอบ

ขั้นแรกของ Backward Design คือการกำหนดผลลัพธ์ที่ต้องการ หรือ Desired Results

ฟังดูคล้ายจุดประสงค์การเรียนรู้ทั่วไป แต่จริง ๆ แล้วลึกกว่านั้น เพราะมันไม่ได้ถามแค่ว่าเด็กต้องรู้เรื่องอะไร แต่ถามต่อด้วยว่า เด็กควรเข้าใจอะไร ควรนำไปใช้ต่อได้อย่างไร และควรมีหลักฐานแบบไหนที่บอกได้ว่าเขาได้จริง

ตัวอย่างเช่น แทนที่จะเขียนกว้าง ๆ ว่า “เข้าใจเรื่องแรงลัพธ์” เราอาจเขียนให้คมขึ้นว่า “นักเรียนสามารถใช้แนวคิดเรื่องแรงลัพธ์อธิบายได้ว่าทำไมวัตถุบางกรณีหยุดนิ่งแม้มีแรงหลายแรงกระทำ” หรือแทนที่จะเขียนว่า “รู้เรื่องกัมมันตภาพรังสี” ก็อาจระบุว่า “นักเรียนสามารถตีความข้อมูลการสลายตัวและอธิบายความหมายของ half-life ในสถานการณ์จริงได้”

ครูหลายคนคุ้นกับการเขียนเป้าหมายในระดับรู้ เข้าใจ หรือทำได้ ซึ่งยังจำเป็นอยู่ แต่ถ้าจะใช้ Backward Design ให้คมขึ้น เราควรถามเพิ่มอีกหน่อยว่า หน่วยนี้มีแก่นอะไรที่เราอยากให้เด็กพกติดตัวไปหลังเรียนจบ มีความเข้าใจผิดอะไรที่เด็กมักพลาด และถ้าเจอสถานการณ์ใหม่ เด็กควรเอาความรู้นี้ไปใช้ได้อย่างไร

เมื่อคำถามพวกนี้ชัดขึ้น ภาพของหน่วยการเรียนก็จะเปลี่ยน จากเดิมที่เห็นเป็นเพียงหัวข้อเนื้อหา จะเริ่มกลายเป็นเส้นทางของการพัฒนาความเข้าใจ ไม่ใช่เพียงการสอนให้ครบหัวข้อเท่านั้น

เมื่อปลายทางชัด เราจะเริ่มเห็นว่าควรใช้หลักฐานแบบไหน

ขั้นต่อมาคือการกำหนดหลักฐานที่ยอมรับได้ หรือ Assessment Evidence

จุดนี้เป็นหัวใจสำคัญมาก เพราะแทนที่จะถามว่า จะออกข้อสอบอะไรดี แนวคิดนี้ชวนให้ถามก่อนว่า ถ้าเด็กเข้าใจจริง เขาควรแสดงอะไรให้เราเห็น

บางหน่วยอาจเหมาะกับข้อสอบสั้น บางหน่วยอาจเหมาะกับการเขียนอธิบาย บางหน่วยอาจต้องใช้การทดลอง การนำเสนอ หรือชิ้นงานที่สะท้อนการใช้ความรู้ในสถานการณ์จริง

เช่น ถ้าอยากวัดการคิดเชิงวิทยาศาสตร์ในหน่วยกัมมันตภาพรังสี หลักฐานที่ใช้ก็อาจเป็นกราฟการสลายตัวแล้วให้เด็กอธิบายจากข้อมูล ไม่ใช่แค่เลือกข้อถูกจากตัวเลือก ถ้าอยากวัดการประยุกต์ใช้คณิตศาสตร์ อาจให้เด็กแก้โจทย์สถานการณ์จริงพร้อมอธิบายว่าทำไมจึงเลือกวิธีนี้ และถ้าอยากวัดการสื่อสาร อาจใช้ mini presentation 2 นาที พร้อมเกณฑ์ว่าการอธิบายที่ดีควรมีอะไรบ้าง

ประเด็นสำคัญคือ อย่ารีบผูกคำว่าการประเมินไว้กับข้อสอบเพียงอย่างเดียว

ถ้าเราอยากเห็นการคิดวิเคราะห์ เราอาจต้องดูเหตุผลของเด็ก ไม่ใช่ดูแค่ว่าตอบถูกหรือผิด ถ้าเราอยากเห็นการสื่อสารทางวิชาการ เราอาจต้องให้โอกาสเด็กอธิบายอย่างเป็นระบบ ถ้าเราอยากเห็นการประยุกต์ใช้ เราก็ควรมีภาระงานที่ไม่ใช่แค่ทำตามแบบเดิม

เมื่อคิดแบบนี้แล้ว การประเมินไม่ได้ยากขึ้นเสมอไป แต่กลับตรงขึ้น และเมื่อตรงขึ้น งานตรวจหลายอย่างก็มีความหมายมากขึ้นด้วย เพราะมันสะท้อนสิ่งที่เราอยากเห็นจริง ๆ

Rubric ที่ดีช่วยมากกว่าการให้คะแนน

หลายคนรู้สึกว่า rubric เป็นงานเพิ่ม แต่ในความเป็นจริง rubric ที่ดีช่วยทั้งครูและนักเรียนอย่างมาก

สำหรับครู มันช่วยให้เราตอบตัวเองได้ว่างานแบบไหนเรียกว่า “ถึงเป้า” งานแบบไหนยังไม่ถึง และอะไรคือความต่างระหว่างงานที่พอใช้กับงานที่แข็งแรงจริง

สำหรับนักเรียน rubric ที่ชัดจะช่วยให้เขารู้ว่าควรพัฒนาอะไรต่อ ไม่ใช่เห็นเพียงคะแนนรวมแล้วจบกันไป

สิ่งสำคัญคือ rubric ควรเขียนด้วยภาษาที่มองเห็นและสังเกตได้จริง เช่น ถ้าภาระงานคือให้เด็กอ่านกราฟการสลายตัวของสารแล้วอธิบายความหมายของ half-life rubric แบบสั้นอาจเขียนไว้ประมาณนี้

  • ระดับดี: อธิบายครบประเด็น ใช้หลักฐานจากกราฟ และเชื่อมเหตุผลได้ชัด
  • ระดับพอใช้: อ่านข้อมูลได้บางส่วนและตอบได้ใกล้เคียง แต่เหตุผลยังไม่ต่อเนื่อง
  • ระดับต้องพัฒนา: มีคำตอบ แต่ยังไม่ใช้ข้อมูลหรือเหตุผลรองรับ

เมื่อเกณฑ์ชัด การให้ feedback ก็ง่ายขึ้น และการปรับการสอนก็แม่นขึ้นด้วย ที่สำคัญ เด็กจะมองเห็นด้วยว่าคุณภาพของงานที่ดีหน้าตาเป็นอย่างไร

กิจกรรมยังสำคัญ แต่ควรมาหลังจากเป้าหมายและหลักฐาน

ใน Backward Design กิจกรรมยังมีความสำคัญมาก เพียงแต่กิจกรรมจะมาทีหลังจากเป้าหมายและหลักฐาน

นี่เป็นจุดที่ช่วยครูได้มาก เพราะทำให้เราหยุดถามเพียงว่ากิจกรรมนี้สนุกไหม แล้วเปลี่ยนเป็นถามว่า กิจกรรมนี้พาเด็กไปสู่สิ่งที่เราจะประเมินจริงหรือไม่

ถ้าปลายทางคือให้เด็กอภิปรายจากข้อมูลเรื่อง half-life ระหว่างทางก็ควรมีกิจกรรมที่ฝึกอ่านตาราง ฝึกตีความกราฟ และฝึกเขียนเหตุผลสั้น ๆ จากข้อมูลจริง ถ้าปลายทางคือ performance task เรื่องการจัดการขยะในโรงเรียน ระหว่างทางก็ควรมีกิจกรรมเก็บข้อมูล สัมภาษณ์ผู้เกี่ยวข้อง เปรียบเทียบทางเลือก และลองเสนอข้อเสนอที่มีเหตุผล

เมื่อมองเช่นนี้ กิจกรรมจึงไม่ได้หายไป แต่กลายเป็นสะพานที่ถูกออกแบบอย่างตั้งใจมากขึ้น ครูจะเริ่มเห็นว่ากิจกรรมที่ดีไม่ใช่แค่ทำให้ห้องเรียนคึกคัก แต่ต้องพาเด็กเข้าใกล้ผลลัพธ์ที่ต้องการด้วย

การประเมินที่ดีไม่ควรรอจนจบหน่วย

อีกเรื่องหนึ่งที่สำคัญมากคือความต่างระหว่างการประเมินเพื่อสรุปผล กับการประเมินเพื่อพัฒนาการเรียนรู้

ถ้าเรารอไปดูผลตอนสอบท้ายหน่วยอย่างเดียว หลายครั้งมันสายเกินไปที่จะช่วยเด็กที่ยังไม่เข้าใจ เพราะบทเรียนได้ผ่านไปแล้ว

แต่ถ้าเรามีการเก็บหลักฐานระหว่างทาง เช่น คำถามสั้นท้ายคาบ การให้เด็กเขียนเหตุผลสั้น ๆ การให้ลองอธิบายด้วยภาษาของตัวเอง หรือการสังเกตชิ้นงานระหว่างทำ ครูก็จะเห็นเร็วขึ้นว่าเด็กกำลังติดตรงไหน เช่น ท้ายคาบอาจให้เด็กตอบ exit ticket 1 ข้อว่า “จากกราฟนี้ ปริมาณสารจะเหลือประมาณเท่าไรหลัง 3 ครึ่งชีวิต และเพราะอะไร” หรือให้เขาเขียนสั้น ๆ ว่า “เมื่อก่อนฉันคิดว่า... ตอนนี้ฉันคิดว่า...” เพื่อดูว่าความเข้าใจเปลี่ยนไปอย่างไร

เมื่อเห็นเร็ว เราก็ปรับได้เร็ว ถ้าครูอ่านคำตอบแล้วพบว่าเด็กจำนวนมากยังสับสนเรื่อง half-life คาบถัดไปก็อาจต้องย้อนด้วยกิจกรรมสั้น ๆ ก่อนเดินต่อ ตรงนี้ทำให้การประเมินไม่ใช่แค่เรื่องของคะแนน แต่เป็นส่วนหนึ่งของการสอนจริง ๆ และทำให้ห้องเรียนตอบสนองต่อผู้เรียนมากขึ้น

Formative Assessment Loop ทำให้การประเมินมีชีวิต

สิ่งที่น่าเสียดายที่สุดไม่ใช่การออกแบบแบบประเมินไม่สวย แต่คือการเก็บข้อมูลแล้วไม่ได้นำกลับมาใช้ต่อ

ในห้องเรียนจริง การประเมินที่ทรงพลังมักมีลักษณะเป็นวงรอบ คือ สอน เก็บหลักฐาน ดูว่าผู้เรียนเข้าใจแค่ไหน แล้วปรับการสอน

ฟังดูธรรมดา แต่พอทำสม่ำเสมอ ห้องเรียนจะเปลี่ยนมาก เพราะครูจะไม่ต้องเดาอีกต่อไปว่าเด็กเข้าใจหรือยัง แต่มีหลักฐานเล็ก ๆ ระหว่างทางคอยบอกอยู่ตลอด

เด็กเองก็จะรู้สึกว่าการประเมินไม่ได้มีไว้ตัดสินอย่างเดียว แต่มีไว้ช่วยให้เขาไปต่อได้ดีขึ้นด้วย เมื่อการประเมินเชื่อมกับการสอนอย่างต่อเนื่อง ห้องเรียนก็จะค่อย ๆ เปลี่ยนจากพื้นที่ของการรอคะแนน ไปเป็นพื้นที่ของการพัฒนา

ถ้าอยากเริ่มใช้จริง ควรเริ่มอย่างไร

ถ้ายังไม่อยากปรับทั้งหน่วย ลองเริ่มจากเล็ก ๆ ก่อนก็ได้ เริ่มจากถามตัวเองว่า หลังจบคาบหรือจบหน่วยนี้ เราอยากเห็นอะไรจากผู้เรียน จากนั้นเลือกหลักฐานหนึ่งอย่างที่สะท้อนสิ่งนั้นได้จริง แล้วค่อยคิดกิจกรรมที่พาไปถึงตรงนั้น

เพียงเท่านี้ เราก็กำลังเริ่มคิดแบบ Backward Design แล้ว

ถ้าต้องการตัวช่วยในการจัดความคิดตั้งต้นให้เป็นระบบมากขึ้น สามารถเข้าไปดูได้ที่ https://styloracademy.com/labs/evaluation-prompt ซึ่งช่วยรวบข้อมูลสำคัญตั้งต้น เช่น วิชา ระดับชั้น หน่วย สิ่งที่อยากวัด หลักฐาน และข้อจำกัดของชั้นเรียน เพื่อให้ครูมองภาพรวมของงานประเมินได้ชัดขึ้นตั้งแต่ต้น

จาก prompt ตั้งต้น ไปสู่เอกสารประเมินจริง

จุดสำคัญคือ หน้า evaluation-prompt เป็นจุดเริ่มต้นของการจัดความคิด ไม่ใช่ปลายทางสุดท้ายของงานประเมิน เช่น ถ้าครูฟิสิกส์กำลังสอนหน่วยกัมมันตภาพรังสี ครูอาจกรอกไว้ว่าอยากวัดความสามารถในการตีความข้อมูลการสลายตัว หลักฐานที่ต้องการคือใบงานและการอธิบายจากข้อมูลที่ได้จากเครื่องคิดเลข เมื่อกรอกครบเท่าที่มีอยู่ ระบบจะได้ prompt ตั้งต้นที่ช่วยสรุปโจทย์ของเราให้อยู่ในรูปที่พร้อมนำไปทำงานต่อ

หลังจากนั้น ขั้นตอนที่ควรทำต่อคือคัดลอก prompt ที่ได้ออกจากหน้า evaluation-prompt แล้วนำไปวางใน LLM ที่ตนเองถนัด เช่น ChatGPT, Gemini, Claude หรือระบบอื่นที่ใช้ประจำ จากนั้นจึงรันต่อเพื่อให้ได้ผลลัพธ์ที่ละเอียดขึ้น บางครั้งผลลัพธ์อาจออกมาในรูปของ prompt ใหม่ที่คมกว่าเดิม บางครั้งอาจเป็นโครงร่างชุดประเมิน ข้อเสนอของ rubric หรือข้อความตั้งต้นที่พร้อมให้ครูหยิบไปปรับใช้ต่อ ในกรณีของครูฟิสิกส์ ตัวที่ได้กลับมาอาจเป็นโครงภาระงานที่ให้เด็กอ่านกราฟการสลายตัว อธิบายความหมายของ half-life และเชื่อมกับสถานการณ์จริงเรื่องเวลาและปริมาณสาร

เมื่อได้ผลลัพธ์รอบนั้นแล้ว ค่อยนำผลลัพธ์ไปใช้สร้างเอกสารประเมินจริงอีกที เช่น แผนประเมิน rubric ใบงานแบบ performance task หรือชุดหลักฐานการเรียนรู้ที่ต้องใช้ในหน่วยนั้น ครูอาจหยิบโครงที่ AI ช่วยร่างมาแปลงต่อเป็น rubric สำหรับตรวจการอธิบาย ใบงานสำหรับอ่านข้อมูล และคำถามสะท้อนคิดท้ายคาบ วิธีคิดแบบนี้ช่วยให้เครื่องมือทำหน้าที่เป็นตัวช่วยขยายความคิด แต่การตัดสินใจสุดท้ายยังอยู่ที่ครูและบริบทของห้องเรียนจริง

อีกจุดหนึ่งที่ควรระวังคือ ถ้าในผลลัพธ์มีคำว่า [ต้องเติม] ให้เข้าใจว่านั่นคือส่วนที่ AI ไม่ควรเดาแทนเรา เช่น ตัวชี้วัด เกณฑ์ผ่านขั้นต่ำ เงื่อนไขเฉพาะของโรงเรียน รูปแบบงานรายบุคคลหรือรายกลุ่ม เวลา หรือข้อจำกัดจริงในชั้นเรียน ในตัวอย่างนี้ ครูต้องกลับมาเติมให้ชัดว่าใช้เวลากี่คาบ มีนักเรียนกี่คน ใช้ชิ้นงานเดี่ยวหรือกลุ่ม และระดับใดจึงถือว่าผ่าน ก่อนนำไปใช้จริงเสมอ เพราะส่วนนี้คือบริบทสำคัญที่ทำให้งานประเมินใช้ได้จริง ไม่ใช่เพียงดูดีบนกระดาษ

สุดท้ายแล้ว การวัดที่ดีเริ่มจากคำถามที่ดี

Backward Design ไม่ได้เป็นวิธีที่ไกลจากห้องเรียนจริง ตรงกันข้าม มันเป็นวิธีคิดที่ช่วยให้สิ่งที่เราตั้งใจสอน สิ่งที่เด็กลงมือทำ และสิ่งที่เรานำมาตัดสินผล สอดคล้องกันมากขึ้น

เมื่อเริ่มจากปลายทางที่ชัด เราจะออกแบบการประเมินได้ตรงขึ้น เมื่อการประเมินตรงขึ้น กิจกรรมก็จะไม่หลุดเป้า และเมื่อทั้งหมดเชื่อมกัน การเรียนรู้ของผู้เรียนก็มีโอกาสลึกและยั่งยืนมากขึ้น

บางครั้งจุดเริ่มต้นที่สำคัญที่สุดอาจไม่ใช่คำถามว่า วันนี้จะสอนอะไรดี แต่เป็นคำถามที่เรียบง่ายกว่านั้น คือ เมื่อหน่วยนี้จบลง เราอยากเห็นอะไรจากผู้เรียนจริง ๆ

เอกสารอ้างอิง

  • McTighe, J., & Wiggins, G. (2012). Understanding by Design Framework. ASCD.
  • McTighe, J. (2014). Improve Curriculum, Assessment, and Instruction Using the Understanding by Design Framework. ASCD.
  • Wiggins, G., & McTighe, J. (2005). Understanding by Design (Expanded 2nd ed.). ASCD.
  • Wiggins, G., & McTighe, J. (2011). The Understanding by Design Guide to Creating High-Quality Units. ASCD.