นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
Network
Members · Following: 0 · Followed: 16

อ่าน: 1294
ความเห็น: 1

จะกว้างหรือจะยาว แบบไหนดี: ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป

การจัดการ(ฐาน)ข้อมูลขึ้นอยู่กับ การนำข้อมูลไปใช้งานและความง่ายในการบริหารจัดการ โดยต้องไม่ลืมคิดถึงโอกาสผิดพลาดของข้อมูล

การจัดเก็บข้อมูลไม่ว่าจะเป็นการจัดเก็บข้อมูลงานวิจัยหรือข้อมูลอื่น ๆ ที่นอกเหนือจากข้อมูลงานวิจัยนั้น มีรูปแบบของการจัดเก็บอยู่ ๒ แบบใหญ่ ๆ คือ จัดเก็บในรูปแบบของ long form และจัดเก็บในรูปแบบของ wide form

 

long กับ wide ต่างกันอย่างไร

 

long ก็คือยาว ๆ

 

wide ก็คือกว้าง ๆ

 

แต่ถ้า long wide เขาว่า ใหญ่ยาวคับ

 

แล้วการจัดเก็บข้อมูลควรจะจัดเก็บในรูปไหนดี ระหว่าง long form กับ wide form

 

ถ้าจะให้เห็นภาพชัด ๆ ระหว่าง long form กับ  wide form ก็คงต้องยกตัวอย่างข้อมูลที่เป็นข้อมูลก่อน-หลัง หรือที่เรียกว่าเป็นข้อมูล pre-test post-test ครับ

 

สมมตินะครับว่า เราต้องการเก็บข้อมูลกลุ่มตัวอย่างจากงานวิจัยที่เกี่ยวกับการทดสอบความรู้ก่อนและหลัง (before-after data)

 

สิ่งที่เหมือนกันของข้อมูลก่อน (before/ pre-test) และข้อมูลหลัง (after/ post-test) ก็คือข้อมูลส่วนบุคคล เช่น ข้อมูลเพศ อายุ ระดับการศึกษา อาชีพ สถานภาพสมรส เป็นต้น ข้อมูลส่วนนี้เป็นข้อมูลเดียวกันของตัวอย่างคนเดียวกันทั้งก่อนและหลัง ดังนั้นข้อมูลส่วนนี้เราไม่จำเป็นต้องเก็บทั้งก่อนและหลัง เราเก็บข้อมูลก่อน (before) เพียงอย่างเดียวก็ได้

 

ยกเว้นระยะเวลาของก่อนและหลังห่างกันเป็นระยะเวลานานพอที่จะทำให้ข้อมูลบางอย่างเปลี่ยนแปลงไป

 

ส่วนข้อมูลที่เปลี่ยนแปลงไปในที่นี้ก็คือข้อมูลความรู้ของกลุ่มตัวอย่าง ซึ่งข้อมูลความรู้ของกลุ่มตัวอย่างอาจจะเท่าเดิมไม่มีการเปลี่ยนแปลง หรือมีการเปลี่ยนแปลง เพิ่มขึ้นหรือลดลงต่างกันในข้อมูลก่อนและหลัง

ผมยกตัวอย่างว่า หากเราเก็บข้อมูลที่ประกอบไปด้วย

ข้อมูลทั่วไปประกอบด้วย

เพศ (sex) อายุ (age) ระดับการศึกษา (education)

ข้อมูลที่ใช้ทดสอบความรู้ จำนวน ๕ ข้อ

a1, a2, a3, a4, a5

 

การจัดเก็บข้อมูลในแบบ wide form จะเป็น

 

เราต้องสร้างตัวแปรสำหรับเก็บข้อมูลการทดสอบความรู้ก่อน (prea1ถึง prea5) และตัวแปรสำหรับเก็บข้อมูลการทดสอบความรู้ครั้งหลัง (ที่สอง) (posta1 ถึง posta5)

 

แต่หากเราจัดเก็บข้อมูลในแบบ long form จะได้เป็น

 

 

ตัวแปรสำหรับเก็บคะแนนการทดสอบความรู้จะมีเพียงตัวแปร a1 - a5 เท่านั้นแต่จะมีตัวแปรอีก 1 ตัวคือ group เพิ่มเข้ามาเพื่อระบุว่าข้อมูลระเบียน (record/ บรรทัด) ใดเป็นข้อมูลก่อนหรือหลังเพิ่มเข้ามา ในที่นี้ ตัวแปร droup มีค่าเท่ากับ 1 หมายถึงข้อมูลก่อนและ 2 เป็นข้อมูลการทดสอบความรู้ครั้งหลัง (ที่ 2)

 

แต่เราจะเห็นว่ามีข้อมูลที่เราต้องป้อนข้อมูลซ้ำกันคือข้อมูลทั่วไป (เพศ อายุ ระดับการศึกษา) ของกลุ่มตัวอย่าง

 

แต่หากมีการจัดการออกแบบการจัดการข้อมูลตามกฎของ Data Normalization แล้วการจัดเก็บข้อมูลในแบบ long form ก็จะถูกจัดแยกข้อมูลออกเป็น ๒ ส่วนคือ ส่วนของข้อมูลทั่วไปและส่วนของข้อมูลคะแนนการทดสอบความรู้ก่อนและหลัง โดยแยกเก็บไว้คนละแฟ้มข้อมูล (หรือคนละ table) ตามกฎของ Normal Form

 

แต่การทำ Normalization อาจจะไม่ทำครบทุกขั้นของ Normal Form ก็ได้ ขึ้นอยู่กับ (ความซับซ้อน) ของข้อมูล

 

จากข้อมูลตัวอย่างข้างต้นเมื่อทำ Normalization แล้วก็จะแยกข้อมูลได้เป็น 2 ส่วนคือ

และ

 

แล้วเราจะใช้การจัดเก็บข้อมูลในรูปแบบของ long form หรือ wide form ดีล่ะ สำหรับข้อมูลวิจัยของเรา

 

คำตอบของเรื่องนี้ไม่มีตายตัวครับว่าจะต้องเก็บอยู่ในรูปแบบใดรูปแบบหนึ่ง ทั้งนี้ขึ้นอยู่กับว่า เราต้องการนำข้อมูลไปใช้ทำอะไรต่อ หรือเราจะวิเคราะห์ข้อมูลอย่างไร

วิธีการวิเคราะห์ข้อมูลทางสถิติบางวิธีการจะกำหนดรูปแบบของข้อมูลเอาไว้เฉพาะว่าข้อมูลจะต้องอยู่ในแบบ long form หรือ wide form อย่างใดอย่างหนึ่งเท่านั้นถึงจะใช้วิธีการวิเคราะห์ข้อมูลด้วยวิธีนั้นได้ หรือด้วยวิธีการวิเคราะห์ข้อมูลวิธีนั้นและโดยโปรแกรมวิเคราะห์ข้อมูลทางสถิติโปรแกรมนั้นได้

 

หรือสิ่งที่จะกำหนดว่าเราควรจะเก็บข้อมูลให้อยู่ในรูปแบบไหนนั้นขึ้นอยู่กับวิธีการวิเคราะห์ข้อมูลทางสถิติ และโปรแกรมวิเคราะห์ข้อมูลทางสถิติที่ใช้

 

โดยทั่วไปแล้วการจัดเก็บข้อมูลจะนิยมจัดเก็บในแบบ long form (ที่ผ่านการทำ Normalization ของข้อมูลแล้ว) ทั้งนี้เพราะต้องการลดโอกาสของความผิดพลาดของข้อมูลลง หรือต้องการควบคุมคุณภาพของข้อมูลนั่นเอง

 

แต่เมื่อต้องไปวิเคราะห์ข้อมูลจริง บางครั้งก็จำเป็นจะต้องทำการ "เปลี่ยนรูป" (re-shape) ของข้อมูลจาก long form ให้เป็น wide form เพื่อให้วิเคราะห์ข้อมูลกับวิธีการวิเคราะห์ข้อมูลที่ต้องการได้

 

หรือในทางกลับกันคือเปลี่ยนรูปของข้อมูลจาก wide form ให้เป็น long form

 

จะเก็บข้อมูลในรูปของ long form หรือ wide form ก็ได้ ขึ้นอยู่กับการนำข้อมูลไปใช้ ไม่มีว่าเก็บข้อมูลแบบไหนถูกหรือเก็บข้อมูลแบบไหนผิด

 

ข้อมูลมันเปลี่ยนรูปได้

 

สองสามวันนี้มีเพื่อนคนหนึ่งมาปรึกษาเรื่องข้อมูลวิตัยด้วยอาการ "ปวดหัว" "ปวดใจ" เพราะวิเคราะห์ข้อมูลไปเสร็จแล้ว ไปเจอด่านตรวจตั้งข้อหาว่า เก็บข้อมูลไม่ถูกรูปแบบ พร้อมกับไล่กลับมาให้ป้อนข้อมูลใหม่ให้อยู่ในแบบที่ (พนักงานด่านตรวจ) ต้องการแล้วมาเริ่มวิเคราะห์ข้อมูลกันใหม่

 

ปวดตับแทนไหมครับ

 

ฮา

 

อิอิอิ

 

เราเอง

 

ปล. ผมคุ้น ๆ ว่าเคยเขียนบันทึกเรื่องนี้ไปแล้ว แต่เขียนอีกรอบละกันครับ

 

เพลง: ผิดจนเกินอภัย
ศิลปิน: บิลลี่ โอแกน

 

หมวดหมู่บันทึก: วิจัย - วิจัยสถาบัน
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 13 พฤศจิกายน 2557 12:52 แก้ไข: 13 พฤศจิกายน 2557 12:52 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 คนธรรมดา, Ico24 ทดแทน, และ 3 คนอื่น.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ด่านแบบนี้ ขับฝ่าไม่ได้ด้วย อิอิ

 

"ใจสั่งมา"

ร่วมแสดงความเห็นในหน้านี้

ชื่อ:
อีเมล:
IP แอดเดรส: 3.81.29.254
ข้อความ:  
เรียกเครื่องมือจัดการข้อความ
   
ยกเลิก หรือ