นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1094
ความเห็น: 2

ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: Titanic ฉบับ rate R # ๑๓ [C]

หลังจากขยายแล้วก็มาดูในรายละเอียดของข้อมูล Titanic กัน

บันทึกที่เกี่ยวข้อง

 

บันทึกที่แล้วค้างไว้ตรงที่เราใช้วิธีการทางสถิติที่เรียกว่า Chi-Square Test สำหรับการทดสอบว่าสัดส่วนของผู้รอดชีวิตและเสียชีวิตในเพศชายและเพศหญิงต่างกันหรือไม่

 

นอกเหนือจากนี้แล้ว Chi-Square test ยังสามารถนำไปประยุกต์ใช้กับการทดสอบในนัยยะต่าง ๆ ได้อีกหลายนัยยะ

 

เช่น Association ระหว่างตัวแปรกลุ่ม (Categorical Variables) ด้วยกัน หรือทดสอบความเป็นอิสระต่อกัน (Independence Test) หรืออื่น ๆ

ดูข้อมูลเพิ่มเติมได้จาก sites.stat.psu.edu/~ajw13

 

การทดสอบ Chi-Square เป็นการทดสอบความแตกต่างระหว่างค่าสังเกต (Observed Values) กับค่าคาดหวัง (Expected Values)

 

เมื่อ O = ค่าสังเกตหรือข้อมูลที่เราเก็บมาได้

E = ค่าคาดหวังตามทฤษฏี

ดูข้อมูลเพิ่มเติมได้จาก  Pearson's Chi-sqaure test ใน Wikipedia

 

พื้นฐานของการคิดประยุกต์จาก discrete uniform distribution เช่นหากโอกาสเกิดและไม่เกิดเหตุการใดเหตุการณ์หนึ่งเป็น ๕๐:๕๐ (เช่นความน่าจะเป็นของการออกหัวเมื่อโยนเหรียญ ๑ ครั้ง) ดังนั้นหากเราทำการโยนเหรียญ ๑๐๐ ครั้ง ความถี่ของการออกหัวและก้อยตามทฤษฎีควรจะเป็น ออกหัว ๕๐ ครั้ง และออกก้อย ๕๐ ครั้ง

 

แต่เมื่อทำการโยนเหรียญ ๑๐๐ ครั้ง ความถี่ของการออกหัวหรือก้อยอาจจะไม่เท่ากับ ๕๐/ ๕๐ ก็ได้

 

นั่นคือเราทำการทดสอบว่าความถี่ของการเกิดเหตุการณ์ใดเหตุการณ์หนึ่งนั้นเท่ากับความถี่ของการเกิดเหตุการณ์นั้น ๆ ตามทฤษฎีหรือไม่

 

ค่าคาดหวัง (E) มีคำนวณได้จาก

 

จากข้อมูล Titanic

 

เมื่อเราดูข้อมูลการรอดชีวิตและเสียชีวิตในเพศชายและหญิงพบว่า

> table(titanix$sex,titanix$survived)
       
           No  Yes
  female  126  344
  male   1364  367

 

จากข้อมูลข้างต้นเราพบว่าเหตุการณ์ที่เพศหญิงจะเสียชีวิตมีความถี่เท่ากับ ๑๒๖ (คน) เหตุการณ์ที่เพศหญิงรอดชีวิตมีความถี่เท่ากับ ๓๔๔ (คน) ในขณะเดียวกันเพศชายที่เสียชีวิตมีความถี่เท่ากับ ๑๓๖๔ (คน) และเพศชายที่รอดชีวิตมีความถี่เท่ากับ ๓๖๗ (คน)

 

ค่าคาดหวังตามทฤษฎีของแต่ละเหตุการณ์ (ทั้ง ๔ เหตุการณ์ข้างต้น) มีค่าความถี่เป็นเท่าไหร่

 

จากสูตรการคำนวณค่าคาดหวังข้างต้น

 

ค่าคาดหวังของเพศหญิงที่เสียชีวิตตามทฤษฎีมีความถี่เป็น row total ของเพศหญิงหรือเพศหญิงทั้งหมด X  column total ของจำนวนคนที่เสียชีวิต หรือคือจำนวนคนที่เสียชีวิตทั้งหมด หารด้วยจำนวนคนทั้งหมด

 

E ของเพศหญิงที่เสียชีวิต = ((๑๒๖ + ๓๔๔) x (๑๒๖ + ๑๓๖๔)) / (๑๒๖ + ๓๔๔ + ๑๓๖๔ + ๓๖๗)

 

E ของเพศหญิงที่เสียชีวิต = (๔๗๐  x ๑๔๙๐) /  ๒๒๐๑ = ๓๑๘.๑๗

 

หรือค่าคาดหวังทั้งหมดมีค่าเป็น

              No    Yes
  female  318.17 151.83
  male   1171.83 559.17

 

ขั้นตอนต่อไปก็คือการคำนวณค่า Chi-Square ครับ

 

อิอิอิ

 

เราเอง

 

เพลง:
ศิลปิน:

หมวดหมู่บันทึก: เรื่องทั่วไป
คำสำคัญ (keywords): bad practice  r  Titamic dataset  ข้าวยำ  เฉาก๊วย
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 14 พฤษภาคม 2557 23:19 แก้ไข: 28 เมษายน 2563 17:36 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 คนธรรมดา, Ico24 ทดแทน, และ Ico24 ใยมะพร้าวน้องใยไหม.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

น้าฯ ยังใส่ keyword เป็น bad practice  เหมือนเดิม อิอิ

 

เอิ้ก เอิ้ก

 

"ใจสั่งมา"

bad practice จริงๆ ครับ ไม่ใช่ Best Practice หรือ Good Practice

อิอิอิ

เราเอง

คุณต้องทำการเข้าระบบก่อนแสดงความเห็น