How to read .CSV file (Thai) in MS excel: วิธีการเปิด/อ่านไฟล์ CSV ภาษาไทย ในMSExcel
CSV (Comma Separated Value) คือไฟล์ที่เก็บค่าเป็นplain text แยกจากกันด้วย comma(,) ในแต่ละบรรทัด CSVสามารถเปิดใช้งานได้ในหลายๆที่โดยไม่จำกัดอยู่ที่ MSExcel เช่นเปิดใน Notepad (หรือ text editorต่างๆ)
xls = Excel file คร่าวๆก็คือข้อมูลที่เก็บในformatของ excel ซึ่งสามารถบรรจุนอกจาก plain text ได้ เช่นข้อมูลgraph,รูปภาพ และสามารถอ่าน/เขียน ได้เฉพาะในMS Excelเท่านั้น
โดยปกติแล้วการanalyse data เราจะทำให้อยู่ในรูปตาราง หากเป็นในpython เราจะจัดข้อมูลให้อยู่ในรูป dataframe เพื่อง่ายต่อการmanipulate ทีนี้เวลาเราจะexport file ออกมามันสามารถทำได้สองวิธีหลักๆคือ pd.to_csv() กับ pd.to_excel() ซึ่งจากประสบการณ์(อันน้อยนิด)พบว่า ถ้าเป็นfileที่มีขนาดใหญ่มากๆ การexport เป็นexcelแล้วเปิดอ่าน excel fileนั้น ใช้เวลานานมากกกกกก ซึ่งต่างจากการเปิด CSVไฟล์ — ดังนั้น โดยปกติเราและคิดว่าคนส่วนใหญ่หากจะexport dataframe มักจะเลือก export เป็น CSV ซึ่งถ้าข้อมูลในนั้นเป็นภาษาอังกฤษและตัวเลข ก็ไม่มีปัญหา เปิดส่องไฟล์ในexcelได้เลย แต่เมื่อมันเป็นภาษาไทย..พบว่า ในส่วนที่เป็นภาษาไทยได้กลายเป็นภาษาต่างดาว เพราะฉะนั้นการจะอ่านไฟล์ CSVที่บรรจุภาษาไทยต้องเปลี่ยน File orgin ตามวิธีดังต่อไปนี้
- เปิด MS excel > Data
2. Select From text (choose .CSV file)> Get Data
3.เมื่อเลือกไฟล์แล้ว จะมีหน้าต่างดังรูปขึ้นมา (จะเห็นว่าตรงหน้าต่าง Preview of selected data เป็นภาษาต่างดาว)
4. ให้เปลี่ยน File origin เป็น Unicode (UTF-8)
5. สังเกตุตรง Preview selected data ภาษาได้เปลี่ยนเป็นาษาไทยแล้ว กด Next
6. เลือก Comma (ตามรูป) เพื่อ split ข้อมูลที่คั่นด้วย comma กดfinish
7. เลือกที่วาง วางตรงไหน sheetไหนก็ได้ที่ว่างๆ — เรียบร้อย