นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1365
ความเห็น: 0

ระเริงคิด ๓: ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป [C]

ระเริงคิด จิตรวมศูนย์

ผมลองนั่งใส่ข้อมูลแบบมั่ว ๆ โดยข้อมูลประกอบไปด้วย ข้อมูล % ของสาร abc จริงที่มีในตัวอย่างจำนวน ๕๐ ตัวอย่าง (conc_sam) ข้อมูล % ของสาร abc ที่ตรวจวัดได้จากเครื่องมือ A ซึ่งเป็น gold standard (toola) และข้อมูล % ของสาร abc ที่ตรวจวัดได้ด้วยเครื่องมือ B (toolb)

 

ข้อมูลนี้ผมมั่วเอานะครับ เพื่อเป็นตัวอย่าง แต่มั่วแบบตั้งใจครับ ตั้งใจให้เป็นตัวอย่างผลแบบแรกครับ

 

หน้าตาของข้อมูลประมาณนี้ครับ

 

 

ข้อมูล % ของสาร abc ในตัวอย่างเป็นข้อมูล % ที่ทราบ % ของสาร abc แน่นอน

 

ข้อมูล % ของสาร abc ที่ทราบ % จริงนั้นผมใช้การไล่ระดับของ % จากค่าต่ำ ๆ (๑) ไปจนถึงค่าสูง (๙๘) โดยให้ระยะห่างของช่วง % อยู่ที่ ๒

 

ในการปฏิบัติจริงคงไล่ระดับ % แบบนี้ไม่ได้ หรือจำนวนตัวอย่างอาจจะมากไป เสียค่าใช้จ่ายในการวิเคราะห์มากเกินความจำเป็นก็ได้ แต่ที่ผมไล่ระดับ % ถี่ก็เพื่อที่จะให้เห็นการเปลี่ยนแปลงค่า % ของการวัดด้วยเครื่องมือ A และ B

 

เรามาดูข้อมูลกันนะครับ

> setwd("c:\\Rworkplace\\r2r")
> data1 <- read.csv("r2r.csv")
> summary(data1$conc_sam)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00   26.50   51.00   50.56   75.50   99.00
> summary(data1$toola)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   0.04   24.87   49.08   49.54   74.61   98.50
> summary(data1$toolb)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.98   29.68   51.72   52.12   74.03   97.68

จากข้อมูลค่า % จริงของสาร abc เราจะพบว่า

  • ค่า % ต่ำสุดของสาร abc อยู่ที่ ๑
  • ค่า 1st quatile อยู่ที่ ๒๖.๕
  • ค่ามัธยฐานเท่ากับ ๕๑
  • ค่าเฉลี่ยอยู่ที่ ๕๐.๕๖
  • ค่า 3rd quatile อยู่ที่ ๗๕.๗๕
  • ค่าสูงสุดอยู่ที่ ๙๙

ข้อมูลสาร abc จากการตรวจวัดด้วยเครื่องมือ A

  • ค่า % ต่ำสุดของสาร abc อยู่ที่ ๐.๐๔
  • ค่า 1st quatile อยู่ที่ ๒๔.๘๗
  • ค่ามัธยฐานเท่ากับ ๔๙.๐๘
  • ค่าเฉลี่ยอยู่ที่ ๔๙.๕๔
  • ค่า 3rd quatile อยู่ที่ ๗๔.๖๑
  • ค่าสูงสุดอยู่ที่ ๙๘.๕๐

ข้อมูลสาร abc จากการตรวจวัดด้วยเครื่องมือ B

  • ค่า % ต่ำสุดของสาร abc อยู่ที่ ๑.๙๘
  • ค่า 1st quatile อยู่ที่ ๒๙.๖๘
  • ค่ามัธยฐานเท่ากับ ๕๑.๗๒
  • ค่าเฉลี่ยอยู่ที่ ๕๒.๑๒
  • ค่า 3rd quatile อยู่ที่ ๗๔.๐๓
  • ค่าสูงสุดอยู่ที่ ๙๗.๖๘

ข้อมูลที่สมมติขึ้นนี้ค่าที่วัดได้จากเครื่องมือ A เครื่องมือ B และค่า % จริงของสาร abc จะมีค่าใกล้เคียงกัน

เราจะเห็นแนวโน้มเข้าสู่ส่วนกลาง (central tendency) จากค่าสถิติข้างต้น แต่ยังขาดค่าสถิติประกอบอีกค่าที่ใช้ดูการกระจายของข้อมูล ค่าที่ว่าก็คือค่า sd (Standard Deviation) เราใช้บรรทัดคำสั่งด้านล่างเพื่อหาค่า sd

> sd(data1$conc_sam)
[1] 29.6931
> sd(data1$toola)
[1] 30.31218
> sd(data1$toolb)
[1] 27.72466

 

ค่า sd ของทั้ง ๓ ข้อมูลมีค่าใกล้เคียงกัน แต่ที่น่าแปลกใจก็คือค่า sd ของเครื่องมือ B มีค่าน้อยกว่าข้อมูลของ % ตัวอย่างจริงและค่าที่วัดได้จากเครื่องมือ A

 

แต่ค่า sd ที่ได้ค่อนข้างจะสูง (ประมาณ ๓๐) เมื่อเทียบกับค่าเฉลี่ยที่มีค่าประมาณ ๕๐

 

ค่า sd นี้ก็พอจะบอกได้คร่าว ๆ ว่าข้อมูล % ของสาร abc ที่วัดได้นั้นค่อนข้างจะกระจายกันออกไป ไม่กระจุกอยู่ที่ % ใด % หนึ่ง

 

ซึ่งเรื่องนี้เป็นจริง เพราะเราไล่ % ของสารตัวอย่าง abc โดยไม่ซ้ำกันตั้งแต่ค่าต่ำ ๆ จนถึงค่าสูง ๆ

 

แต่เราอาจจะยังมองภาพโดยรวมไม่ออก

 

ผมนำเสนอข้อมูลทั้ง ๓ ด้วยกราฟ เพื่อที่จะให้เป็นภาพได้ชัดขึ้น กราฟที่ว่านี้ผมจะนำเสนอในรูปของ histogram และ boxplot

> par(mfcol=c(1,3))
> boxplot(data1$conc_sam, col="blue")
> title(names(data1)[2])
> boxplot(data1$toola, col="red")
> title(names(data1)[3])
> boxplot(data1$toolb,col="dark green")
> title(names(data1)[4])

 

> hist(data1$conc_sam, freq=F,col="blue")
> curve(dnorm(x, mean=mean(data1$conc_sam),sd=sd(data1$conc_sam)), col = 2, lwd = 2, add = TRUE)
> hist(data1$toola, freq=F, col="pink")
> curve(dnorm(x, mean=mean(data1$toola),sd=sd(data1$toola)), col = 2, lwd = 2, add = TRUE)
> hist(data1$toolb, freq=F,col="dark green")
> curve(dnorm(x, mean=mean(data1$toolb),sd=sd(data1$toolb)), col = 2, lwd = 2, add = TRUE)

 

distribution ของข้อมูลทั้ง ๓ ไม่แตกต่างกันมากนัก

แต่ histogram ของค่าที่วัดได้จากเครื่องมือ B นั้นค่อนข้างจะต่างจากค่าที่วัดได้จากเครื่องมือ A หรือค่า % ของสาร abc จริง ส่วน boxplot นั้นแทบจะไม่ต่างกันเลย

ผมใช้การทดสอบ Shapiro-Wilk สำหรับทดสอบว่าการกระจายของข้อมูลแต่ละชุดข้อมูลเป็นการกระจายที่เป็น Normal Distribution (Gaussian Distribution)  หรือไม่

 

> shapiro.test(data1$conc_sam)

        Shapiro-Wilk normality test

data:  data1$conc_sam
W = 0.9537, p-value = 0.0487

> shapiro.test(data1$toola)

        Shapiro-Wilk normality test

data:  data1$toola
W = 0.9507, p-value = 0.03647

> shapiro.test(data1$toolb)

        Shapiro-Wilk normality test

data:  data1$toolb
W = 0.9571, p-value = 0.06699

 

จากผลการทดสอบข้อมูลด้วย Shapiro-Wilk test พบว่ามีเพียงข้อมูลที่วัดได้จากเครื่องมือ B เท่านั้นที่มีการกระจายเป็นแบบ Normal Distribution (p-value = 0.06699)

 

ครั้งหน้าเรามาดูข้อมูล % สาร abc ที่เป็นค่า % จริงและค่าที่ตรวจวัดได้จากเครื่องมือ A  และเครื่องมือ B

 

อิอิอิ

 

เราเอง

 

เพลง:
ศิลปิน:

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 28 กันยายน 2557 02:12 แก้ไข: 28 เมษายน 2563 17:24 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 pompom, Ico24 คนธรรมดา, และ 3 คนอื่น.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ไม่มีความเห็น
คุณต้องทำการเข้าระบบก่อนแสดงความเห็น