What is confusion matrix [for beginner]

YOKK m.
2 min readJan 27, 2020

--

Confusion Matrix/ Error Matrix คือออะไร? และมีความสำคัญอย่างไร?

Predicted value as Positive-Negative. Actual Value denoted as True -False

Confusion Matrix สามารถเรียกอีกอย่างนึงได้ว่า Error Matrix — ก็คือตาราง ที่ใช้ในการวัด Performance ของ Classification model (อีกนัยนึงก็คือ เอาไว้วัดประสิทธิภาพของModel ที่เราทำขึ้นมา ว่ามันสามารถทำงานได้ดีเพียงใด)

Then, What is TP,FP,FN,TN? — TP,FP,FN,TNคืออะไร?

ทำไม true แล้วถึง negative-positive ได้อีก?, Falseแล้วยังจะ positive???
(ตัดการแปลความหมายคำว่าTrue/False/ Positive/ Negative จากไทยเป็นอังกฤษออกจากหัวไปก่อน..เพราะมันอาจจะทำให้เราสับสน!)

เรามาพยายามทำความเข้าใจความหมายโดยใช้ตัวอย่างจากเรื่องการวัดค่าฝุ่นPM2.5 ว่า ณ วันหนึ่งๆจะเป็นอันตรายหรือไม่
—(Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพจริงๆ
— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพจริงๆ

— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่ได้เป็นอันตรายต่อสุขภาพ
— (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพ

Actual value and Predicted value

Actual Value: คือข้อมูลจริง ที่เรารู้/ถูกพิสูจน์มาแล้วว่าจริง เกิดขึ้นจริง เป็นค่าy/ เป็น label ที่เรารู้อยู่แล้ว
Predicted Value: คือข้อมูลที่เราได้มาจากการทำ analysis/ ค่าที่เราทำนายออกมา

→ Predicted = Actual ←

(เมื่อ สิ่งที่เราทำนาย ตรงกับสิ่งที่เกิดขึ้นจริง — ทำนายถูก)

True Positive (TP)

TP คือ สิ่งที่เราทำนายเป็น+(เป็นบวก)/ หรือเราทำนายว่า**มันจะเกิดขึ้น** แล้วผลลัพท์คือมัน**เกิดขึ้นจริงๆ** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพจริงๆ

เราpredicted ว่า ค่าฝุ่นจะเป็นอันตรายต่อสุขภาพ (เป็น+/เป็นPostitive), และเหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นเป็นอันตรายต่อสุขภาพ (เป็นจริง) — TP

TP: ทายว่าใช่ ผล คือใช่ — จริง

True Negative (TN)

TN คือ สิ่งที่เราทำนายเป็น-(เป็นลบ)/ หรือเราทำนายว่า**มันจะไม่เกิดขึ้น** แล้วผลลัพท์คือมัน**ไม่เกิดขึ้นจริงๆ** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพจริงๆ

เราpredicted ว่า ค่าฝุ่นจะไม่เป็นอันตรายต่อสุขภาพ (เป็น-/เป็นNegative), และเหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นไม่เป็นอันตรายต่อสุขภาพ (เป็นจริง) — TN

TN: ทายว่าไม่ ผลคือไม่ — จริง

→ Predicted != Actual ←

(เมื่อ สิ่งที่เราทำนาย ไม่ตรงกับสิ่งที่เกิดขึ้นจริง — ทำนายผิด)

False Positive (FP) — Type 1 Error

FP คือ สิ่งที่เราทำนายเป็น+(เป็นบวก)/ หรือเราทำนายว่า**มันจะเกิดขึ้น** แล้วผลลัพท์คือมัน**ไม่เกิดขึ้น** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะเป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 ไม่เป็นอันตรายต่อสุขภาพ

เราpredicted ว่า ค่าฝุ่นจะเป็นอันตรายต่อสุขภาพ (เป็น+/เป็นPostitive), แต่เหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นไม่ได้เป็นอันตรายต่อสุขภาพ (เป็นเท็จ) — FP

FP: ทายว่าใช่ ผล คือไม่ใช่ — เท็จ

False Negative (FN) — Type 2 Error

FN คือ สิ่งที่เราทำนายเป็น-(เป็นลบ)/ หรือเราทำนายว่า**มันจะไม่เกิดขึ้น** แล้วผลลัพท์คือมัน**เกิดขึ้น** เช่น (Predicted)ทำนายว่าวันจันทร์หน้า ค่าPM2.5 จะไม่เป็นอันตรายต่อสุขภาพ, (Actual)เรื่องจริง ค่าPM2.5 เป็นอันตรายต่อสุขภาพ

เราpredicted ว่า ค่าฝุ่นจะไม่เป็นอันตรายต่อสุขภาพ (เป็น-/เป็นNegative), แต่เหตุการณ์จริง(Actual) ก็คือ ค่าฝุ่นเป็นอันตรายต่อสุขภาพ (เป็นเท็จ) — FN

FN: ทายว่าไม่ ผลคือใช่— เท็จ

Next → Understanding confusion Matrix : มาทำความเข้าใจ วิธีการคิด เพื่อให้ได้ Recall, precision, Accuracy

--

--

YOKK m.
YOKK m.

Written by YOKK m.

a data scientist — Master of Data science is the degree, master of none is also me

No responses yet