นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
Network
Members · Following: 0 · Followed: 16

อ่าน: 985
ความเห็น: 0

รวมกันเมื่อฉันต่างกับเธอ: ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป

รวมข้อมูล (append) จากแฟ้มข้อมูล ๒ แฟ้มข้อมูลที่มีจำนวนตัวแปร/ ตัวแปรที่ต่างกันใน R

ในช่วงฝึกภาคสนามลงพื้นที่ชุมชนของนักศึกษาแพทย์ชั้นปีที่ ๓ ที่ผ่านมาเมื่อเดือนพฤศจิกายน ๒๕๕๗ นั้น มีนักศึกษาจำนวน ๕ กลุ่มที่ลงพื้นที่คอหงส์ ที่อยู่ในเขตความรับผิดชอบของเทศบาลเมืองคอหงส์

 

ทางภาควิชาฯ ตกลงร่วมกันที่จะให้นักศึกษาทั้ง ๕ กลุ่มนี้ลงพื้นที่จัดเก็บข้อมูลตามดัชนีสุขภาพชุดเดียวกัน โดยทางภาควิชาจะเป็นคนกำหนดว่าจะต้องเก็บข้อมูลของดัชนีสุขภาพอะไรบ้าง

 

ในขั้นตอนของการเก็บรวบรวมข้อมูลหลังจากลงพื้นที่เก็บข้อมูลแล้วนั้น ทางภาควิชาได้กำหนดตัวแปรต่าง ๆ เอาไว้ให้เรียบร้อยแล้วว่าแต่ละข้อมูลนั้นจะต้องใช้ตัวแปรอะไร (ชื่อ) จากนั้นก็ให้นักศึกษาแต่ละกลุ่มไปคีย์ข้อมูลที่เก็บมาได้จากการลงพื้นที่ โดยใช้โปรแกรม epidata เป็นโปรแกรมฐานข้อมูลในครั้งนี้

 

ชุดตัวแปรและแบบฟอร์มสำหรับการป้อนข้อมูลจากส่วนกลางนั้นล่าช้ากว่าการทำงานของกลุ่มไปนิดหน่อยเลยทำให้แต่ละกลุ่มไปจัดทำแบบฟอร์มป้อนข้อมูลกันเอง แต่โดยภาพรวมแล้วทุกกลุ่มจะใช้ตัวแปรที่กำหนดมาจากทางภาควิชาสำหรับเก็บรวบรวมข้อมูล แต่ก็มีบางกลุ่มที่มีการเปลี่ยนแปลงตัวแปรที่ใช้เก็บข้อมูล ส่งผลให้จำนวนตัวแปรในแฟ้มข้อมูลของแต่ละกลุ่มนั้นมีจำนวนไม่เท่ากัน และมีบางตัวแปรที่ทางกลุ่มกำหนดขึ้นมาเองรวมอยู่ด้วย

 

เมื่อทางภาควิชาฯ ต้องการรวมข้อมูลของนักศึกษาทั้ง ๕ กลุ่มเข้าด้วยกันเพื่อให้เป็นชุดข้อมูลเดียว (แฟ้มข้อมูลเดียว) นั้นจะใช้วิธีการตามปกตินั้นไม่ได้ต้องมีการจัดการให้จำนวนและชื่อของตัวแปรเหมือนกันเสียก่อน จึงจะรวบข้อมูลจากทั้ง ๕ กลุ่ม (append) ได้

 

ทั้งนี้ข้อมูลที่ได้จากการลงพื้นที่ของนักศึกษาในครั้งนี้จะนำไปใช้เป็นข้อมูลเพื่อประเมินภาวะสุขภาพของประชาชนในพื้นที่คอหงส์สำหรับการให้บริการสุขภาพ หรือการดำเนินโครงการส่งเสริมสุขภาพหรือป้องกันโรคให้กับประชาชนในพื้นที่ ซึ่งทางภาควิชาฯ (ในนามคณะแพทยศาสตร์) จะมีการลงนามในบันทึกข้อตกลง (MOU) กันกับเทศบาลเมืองคอหงส์สำหรับการพัฒนาการให้บริการสาธารณสุขให้กับพื้นที่ในเขตคอหงส์ โดยจะใช้พื้นที่บ้านปลักธง (หมู่ที่ ๗) เป็นพื้นสำหรับดำเนินการ

 

ขั้นตอนการลงนามยังอยู่ระหว่างการดำเนินการ

 

ในการรวมข้อมูลจากแต่ละกลุ่มเข้าด้วยกันนั้นจะใช้โปรแกรม R เป็นเครื่องมือสำหรับการจัดการ ซึ่งฟังก์ชันสำหรับการรวมข้อมูลที่เป็นการ append ข้อมูล หรือเป็นการเพิ่มจำนวนชุดข้อมูล (record) นั้นจะใช้ฟังก์ชัน rbind()

 

เช่น

 

แฟ้มข้อมูลที่ ๑ (data1) และแฟ้มข้อมูลที่ ๒ (data2) มีจำนวนและชื่อตัวแปรเหมือนกัน ก็จะใช้บรรทัดคำสั่งดังบรรทัดคำสั่งด้านล่างในการ append ข้อมูลเข้าด้วยกัน

 

> data12 <- rbind(data1, data2)

 

ตัวอย่างข้อมูล

ตรวจสอบจำนวนตัวแปรในแฟ้มข้อมูล data 1 และแฟ้มข้อมูล data2 ด้วยฟังก์ชัน ncol()

> ncol(data1)
[1] 10
> ncol(data2)
[1] 10

แฟ้มข้อมูล data1 และ data2 มีจำนวนตัวแปรเท่ากันคือ ๑๐ ตัวแปร

 

ตรวจสอบชื่อของตัวแปรในแฟ้มข้อมูล data1 และแฟ้มข้อมูล data2 ด้วยฟังก์ชัน names()

 

> names(data1)
 [1] "qid"        "group"      "houseid"    "community"  "villagenum" "numembers"
 [7] "h2"         "h201"       "h202"       "h3"       
> names(data2)
 [1] "qid"        "group"      "houseid"    "community"  "villagenum" "numembers"
 [7] "h2"         "h201"       "h202"       "h3"

 

ทั้งแฟ้มข้อมูล data1 และแฟ้มข้อมูล data2 มีชื่อของตัวแปรเหมือนกัน

 

ตรวจสอบจำนวนชุดของข้อมูล (records) ของแต่ละแฟ้มข้อมูลด้วยฟังก์ชัน nrow()

> nrow(data1)
[1] 20
> nrow(data2)
[1] 10

แฟ้มข้อมูล data1 มีจำนวน ๒๐ ชุดข้อมูลและแฟ้มข้อมูล data2 มีจำนวน ๑๐ ชุดข้อมูล

 

เมื่อแฟ้มข้อมูลทั้ง ๒ มีจำนวนและชื่อตัวแปรเหมือนกันเราจะใช้ฟังก์ชัน rbind(0 สำหรับรวมข้อมูลจากทั้ง ๒ แฟ้มข้อมูลเข้าด้วยกันโดยเมื่อรวมแล้วให้เก็บไว้ในแฟ้มข้อมูลชื่อ data12

> data12 <- rbind(data1, data2)

 

ตรวจสอบชุดข้อมูลในแฟ้มข้อมูล data12 ด้วยฟังก์ชัน nrow()

> nrow(data12)
[1] 30

 

แฟ้มข้อมูล data12 ที่เป็นแฟ้มข้อมูลที่เกิดจากการรวมกันของข้อมูลจากแฟ้มข้อมูลที่ ๑ และแฟ้มข้อมูลที่ ๒ ซึ่งมีจำนวนชุดข้อมูลแฟ้มข้อมูลละ ๒๐ และ ๑๐ ชุดข้อมูลตามลำดับ

 

แฟ้มข้อมูล data12 จะมีจำนวนชุดข้อมูล ๓๐ ชุดข้อมูล (๒๐ + ๑๐)

 

ตรวจสอบตัวแปรของแฟ้มข้อมูล data12 ด้วยฟังก์ชัน names()

> names(data12)
 [1] "qid"        "group"      "houseid"    "community"  "villagenum" "numembers"
 [7] "h2"         "h201"       "h202"       "h3"

 

แฟ้มข้อมูล data12 จะมีจำนวนและชื่อตัวแปรเหมือนกับแฟ้มข้อมูล data1 และหรือแฟ้มข้อมูล data2

 

แต่หากแฟ้มข้อมูลที่จะนำข้อมูลมารวมกันมีจำนวนและหรือมีชื่อตัวแปรที่ต่างกัน เราไม่สามารถใช้ฟังก์ชัน rbind() ในการรวมข้อมูลจากทั้งสองแฟ้มข้อมูลได้เหมือนข้างต้นโดย R จะแจ้งข้อความแสดงข้อผิดพลาดเป็น

> data34 <- rbind(data3, data4)
Error in match.names(clabs, names(xi)) :
  names do not match previous names

 

สำหรับการตรวจสอบชื่อและหรือจำนวนตัวแปรที่ต่างกันของแฟ้มข้อมูลที่จะนำมารวมกันนั้นยกเป็นบันทึกหน้าครับ

 

อิอิอิ

 

เราเอง

 

เพลง: Crying in the rain
ศิลปิน: Everly Brothers

 

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 21 ธันวาคม 2557 15:40 แก้ไข: 21 ธันวาคม 2557 15:40 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 คนธรรมดา, Ico24 โอ๋-อโณ, และ Ico24 ใยมะพร้าวน้องใยไหม.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ไม่มีความเห็น

ร่วมแสดงความเห็นในหน้านี้

ชื่อ:
อีเมล:
IP แอดเดรส: 18.207.255.49
ข้อความ:  
เรียกเครื่องมือจัดการข้อความ
   
ยกเลิก หรือ