Confusion Matrix/ Error Matrix คือออะไร? และมีความสำคัญอย่างไร?
Confusion Matrix สามารถเรียกอีกอย่างนึงได้ว่า Error Matrix — ก็คือตาราง ที่ใช้ในการวัด Performance ของ Classification model (อีกนัยนึงก็คือ เอาไว้วัดประสิทธิภาพของModel ที่เราทำขึ้นมา ว่ามันสามารถทำงานได้ดีเพียงใด)
Then, What is TP,FP,FN,TN? — TP,FP,FN,TNคืออะไร?
ทำไม true แล้วถึง negative-positive ได้อีก?, Falseแล้วยังจะ positive???
(ตัดการแปลความหมายคำว่าTrue/False/ Positive/ Negative จากไทยเป็นอังกฤษออกจากหัวไปก่อน..เพราะมันอาจจะทำให้เราสับสน!)
เรามาพยายามทำความเข้าใจความหมายโดยใช้ตัวอย่างจากเรื่องการวัดค่าฝุ่นPM2.5 ว่า ณ วันหนึ่งๆจะเป็นอันตรายหรือไม่
—(Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพจริงๆ
— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพจริงๆ— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่ได้เป็นอันตรายต่อสุขภาพ
— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพ
Actual value and Predicted value
Actual Value: คือข้อมูลจริง ที่เรารู้/ถูกพิสูจน์มาแล้วว่าจริง เกิดขึ้นจริง เป็นค่าy/ เป็น label ที่เรารู้อยู่แล้ว
Predicted Value: คือข้อมูลที่เราได้มาจากการทำ analysis/ ค่าที่เราทำนายออกมา
→ Predicted = Actual ←
(เมื่อ สิ่งที่เราทำนาย ตรงกับสิ่งที่เกิดขึ้นจริง — ทำนายถูก)
True Positive (TP)
TP คือ สิ่งที่เราทำนายเป็น+(เป็นบวก)/ หรือเราทำนายว่า**มันจะเกิดขึ้น** แล้วผลลัพท์คือมัน**เกิดขึ้นจริงๆ** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพจริงๆ
เราpredicted ว่า ค่าฝุ่นจะเป็นอันตรายต่อสุขภาพ (เป็น+/เป็นPostitive), และเหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นเป็นอันตรายต่อสุขภาพ (เป็นจริง) — TP
TP: ทายว่าใช่ ผล คือใช่ — จริง
True Negative (TN)
TN คือ สิ่งที่เราทำนายเป็น-(เป็นลบ)/ หรือเราทำนายว่า**มันจะไม่เกิดขึ้น** แล้วผลลัพท์คือมัน**ไม่เกิดขึ้นจริงๆ** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพจริงๆ
เราpredicted ว่า ค่าฝุ่นจะไม่เป็นอันตรายต่อสุขภาพ (เป็น-/เป็นNegative), และเหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นไม่เป็นอันตรายต่อสุขภาพ (เป็นจริง) — TN
TN: ทายว่าไม่ ผลคือไม่ — จริง
→ Predicted != Actual ←
(เมื่อ สิ่งที่เราทำนาย ไม่ตรงกับสิ่งที่เกิดขึ้นจริง — ทำนายผิด)
False Positive (FP) — Type 1 Error
FP คือ สิ่งที่เราทำนายเป็น+(เป็นบวก)/ หรือเราทำนายว่า**มันจะเกิดขึ้น** แล้วผลลัพท์คือมัน**ไม่เกิดขึ้น** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพ
เราpredicted ว่า ค่าฝุ่นจะเป็นอันตรายต่อสุขภาพ (เป็น+/เป็นPostitive), แต่เหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นไม่ได้เป็นอันตรายต่อสุขภาพ (เป็นเท็จ) — FP
FP: ทายว่าใช่ ผล คือไม่ใช่ — เท็จ
False Negative (FN) — Type 2 Error
FN คือ สิ่งที่เราทำนายเป็น-(เป็นลบ)/ หรือเราทำนายว่า**มันจะไม่เกิดขึ้น** แล้วผลลัพท์คือมัน**เกิดขึ้น** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพ
เราpredicted ว่า ค่าฝุ่นจะไม่เป็นอันตรายต่อสุขภาพ (เป็น-/เป็นNegative), แต่เหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นเป็นอันตรายต่อสุขภาพ (เป็นเท็จ) — FN
FN: ทายว่าไม่ ผลคือใช่— เท็จ
Next → Understanding confusion Matrix : มาทำความเข้าใจ วิธีการคิด เพื่อให้ได้ Recall, precision, Accuracy