นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1340
ความเห็น: 2

ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: Titanic ฉบับ rate R [C]

ข้อมูลตัวอย่างข้อมูลหนึ่งที่ถูกนำมาใช้เป็นข้อมูลตัวอย่างสำหรับการวิเคราะห์ข้อมูลคือข้อมูล Titanic

กินข้าวได้สักคำ ๒ คำ ก็ได้กลิ่นดินหอมกรุ่นโชยมา ฝนตกลงมาแล้วหลังจากที่ร้อนอยู่หลายวัน ตกลงมา ตกลงมา ตกลงมาเถิดฝนให้ดินชุมฉ่ำ ให้น้ำเติมเต็ม

....

Near, Far,
wherever you are,
I believe that the heart does go on.

Once more, you opened the door
And you're here in my heart,
and my heart will go on and on.

Love can touch us one time
and last for a lifetime
And never let go till we're gone.

.....

James Horner & Will Jennings: My Heart Will Go On

ตัวพระตัวนางในเรื่อง Titanic ทุกคนคงจำได้คือ Jack กับ Rose โดยเฉพาะฉากที่ Jack กับ Rose ยืนอยู่ที่หัวเรือ แต่มีอยู่เรื่องหนึ่งที่ยังไม่มีคำตอบ ซึ่งต้องถามท้าวแชร์คงงามตามท้องเรื่อง

เรื่องที่ยังไม่มีคำตอบก็คือผมจำนามสกุลของ Jack กับ Rose ไม่ได้ต้องรอถามท้าวฯ คนงามตามท้องเรื่องซะก่อน จำได้เลา ๆ ว่า อะไรสั้น ๆ หรือจะยาว ๆ ก็จำไม่ค่อยได้แล้ว

ท้าวฯ น่าจะรู้ดี และสงสัยอีกว่า Jack ที่บ้านท้าวฯ น่ะเป็นอย่างไร เหมือนในหนังหรือเปล่า

อิอิอิ

ช่วงที่ผ่านมาผมรื้อ ๆ ค้น ๆ ข้อมูลเกี่ยวกับ logistic regression diagnostic หรือค้นข้อมูลดูว่าวิธีการทดสอบ model logistic นั้น มีวิธีการอย่างไรบ้าง จะเหมือนหรือต่างกับวิธีการทดสอบ model ของ linear regression หรือไม่

distribution ของตัวแปรตาม (หรือ y) ระหว่าง linear regression กับ logistic regression จะต่างกันคือ linear หรือสมการเชิงเส้นตรงนั้น distribution จะเป็นแบบ Gaussian Distribution หรือที่เรารู้จักกันดีว่าคือ Normal Distribution ส่วน logistic นั้นมี distribution ของ y เป็นแบบ Binomial Distribution

logistic ชื่อก็บอกแล้วว่าเป็นความสัมพันธ์ในรูปของ log scale

logistic และ lonear Regression เป็นวิธีการทางสถติที่อยู่ในกลุ่มของการวิเคราะห์ตัวแปรร่วม (Multivariate Analysis) หรือการวิเคราะห์ตัวแปรพหุ

ถ้าเราต้องการทดสอบความสัมพันธ์ระหว่างตัวแปรต้นกับตัวแปรตามว่าตัวแปรต้นกับตัวแปรตามมีความสัมพันธ์กันหรือไม่อย่างไร โดยเฉพาะความสัมพันธ์ที่สามารถระบุถึง ขนาดของความสัมพันธ์ (Magnitude) ทิศทางของความสัมพันธ์ (Direction) วิธีการทางสถิติที่นิยมใช้ก็คือ linear regression และ logistic Regression การเลือกใช้ก็ขึ้นอยู่กับ Distribution ของ Y

โดยเฉพาะ Multiple Linear Regression และ Multiple Logistic Regression ที่ใช้เมื่อต้องการปรับค่า (Adjusted) อิทธิพล (effect) ของตัวแปรอื่น (มือที่สาม สี่ ห้า หก ...) โดยเฉพาะอิทธิพลที่ส่งผลมาในรูปแบบของ "ตัวกวน" (Confounder - Confounding Effect)

ก่อนที่จะไปไกลไหลลงทะเลนั้น กลับมาถึง Titanic กันดีกว่านะครับ

หลังจากที่รื้อ ๆ ค้น ๆ ก็พบว่ามีตัวอย่างที่เขาพูดถึงการทดสอบโมเดล logistic นั้น บางตัวอย่างเขาใช้ข้อมูลตัวอย่างของ Titanic

ผมลองกลับไปรื้อ ๆ ดูก็พบว่าข้อมูล Titanic นั้นมีรวมอยู่ในข้อมูลตัวอย่างของ R ใน Package ที่ชื่อ datasets ด้วย

หรือเมื่อติดตั้ง R แล้วตัวติดตั้งของ R ก็จะติดตั้ง package datasets ให้ด้วย นั่นคือจะแถมชุดข้อมูลของ Titanic มาให้ด้วย

หรือที่ผมเจอครั้งแรกก็เป็นข้อมูล Titanic ที่รวมอยู่ใน package effects

ไม่ฌฉพาะ R เท่านั้นนะครับ โปรแกรมทางสถิติโปรแกรมอื่น ๆ อย่างเช่น Stata SPSS SAS S-Plus ก็มีข้อมูล Titanic สำหรับใช้เป็นข้อมูลตัวอย่างในการวิเคราะห์ข้อมูลด้วย

ส่วนข้อมูล Titanic นั้นสามารถที่จะสืบค้นได้จาก Internet ครับ

ข้อมูล Titanic นั้นมีอยู่ด้วยกันหลายเวอร์ชัน ข้อมูลจะแตกต่างกันไปนิด ๆ หน่อยขึ้นอยู่กับเวอร์ชัน และการนำข้อมูลมาเป็นตัวอย่าง เช่น

  • ข้อมูลชั้นหรือระดับ (class) ของผู้โดยสาร ซึ่งบางข้อมูลตัวอย่างจะมีทั้งหมดหรือมีเพียงบางส่วนเท่านั้น class ของผู้โดยสารจะมี First Class, Second Class, Third Class และ Crew (ลูกเรือ)
  • รายชื่อของผู้โดยสาร
  • การรอดชีวิต (survived) จะเป็น รอดชีวิต หรือเสียชีวิต
  • อายุของผู้โดยสาร บางชุดข้อมูลจะเป็นข้อมูลอายุเป็นปี แต่บางชุดข้อมูลจะแบ่งเป็น เด็ก (Child) และผู้ใหญ่ (Adult) ส่วนกำนันไม่เกี่ยวนะลุง
  • เพศ (sex)
  • จำนวนพี่น้อง/ คู่สมรสที่ขึ้นเรือมาด้วย (Siblings/Spouses)
  • ข้อมูลตั๋วโดยสาร (หมายเลขตั๋วโดยสาร)
  • ห้องโดยสาร (Cabin)
  • ท่าเรือที่ใช้ขึ้นเรือ (Embarkation - Cherbourg, Queenstown, Southampton)
  • เรือชูชีพ (Lifeboat)
  • บ้าน/ จุดหมายปลายทาง (home/ destination)
  • ฯลฯ

บางข้อมูลต้นฉบับมีข้อมูลไม่ครบ เช่นข้อมูลอายุ ดังนั้นบางชุดข้อมูลตัวอย่างจะตัดให้เหลือเฉพาะจำนวนที่มีข้อมูลอายุเท่านั้น หรือบางชุดข้อมูลจะใช้วิธีการ "สร้าง" หรือ "impute" ข้อมูลอายุขึ้นมา

ดังนั้นแต่ละชุดข้อมูลของข้อมูล Titanic จะมีจำนวนข้อมูล ตัวแปร และรายละเอียดของข้อมูลที่แตกต่างกันไป

ข้อมูล Titanic ที่มีมาให้กับ package datasets ของ R นั้น มีเฉพาะข้อมูลการรอดชีวิต (survived) เพศ (sex) อายุ (age แบ่งเป็นเด็กและผู้ใหญ่) ชั้นหรือระดับของผู้โดยสาร (class)

สำหรับข้อมูลตัวอย่างใน R นั้น เมื่อเราเรียก R ขึ้นมาทำงาน เราก็สามารถที่จะเรียกข้อล Titanic มาใช้ได้เลย

ก่อนอื่นเราตรวจสอบโครงสร้างของข้อมูล Titanic กันก่อนนะครับ

> str(Titanic)
 table [1:4, 1:2, 1:2, 1:2] 0 0 35 0 0 0 17 0 118 154 ...
 - attr(*, "dimnames")=List of 4
  ..$ Class   : chr [1:4] "1st" "2nd" "3rd" "Crew"
  ..$ Sex     : chr [1:2] "Male" "Female"
  ..$ Age     : chr [1:2] "Child" "Adult"
  ..$ Survived: chr [1:2] "No" "Yes"
> class(Titanic)
[1] "table"
> is.array(Titanic)
[1] TRUE

เราพบว่าข้อมูลตัวอย่างของ Titanic นั้นมี class เป็น Table หรือ "ตาราง" ซึ่งมี ๔ มิติ ประกอบด้วย Class Sex Age และ Survived

เมื่อตรวจสอบเพิ่มเติมพบว่า Titanic นี้นอกเหนือจากมี class เป็น table แล้ว Titanic ยังเป็นวัตถุชนิด array อีกด้วย

array ใน R อ่านเพิ่มเติมได้จากบันทึก ratetable นะครับ

อิอิอิ

ก่อนจะออกทะเลไปไกลกับ Titanic ก็ให้ผู้อ่านทำใจกันก่อนนะครับ

สำหรับท้าวฯ ก็ดับของใส่พายให้เสร็จก่อนนะครับ

ก่อนออกเล

 

อิอิอิ

 

เราเอง

 

เพลง: My Heart Will Go On
ศิลปิน: Celine Dion

Music video by Céline Dion performing My Heart Will Go On. (C) 2007 Sony Music Entertainment Canada Inc.

CelineDionVEVO

My Heart Will Go On แต่งโดย James Horner และ Will Jennings ทั้งสองร่วมกันแต่งเพลงนี้โดยที่ปิดเป็นความลับไม่ให้ James Cameron ผู้กำกับ Titanic ทราบ เนื่องจาก James Cameron ไม่ต้องการให้ใช้เพลงที่มีเนื้อร้องใช้ประกอบภาพยนต์ Titanic ระหว่างนั้น James Horner ก็ทำ Demo เพลงไว้โดยให้ Celine Dion เป็นคนร้องเพลงและรอจังหวะที่เหมาะสมจึงนำเสนอเพลงนี้กับ James Cameron หลังจากได้ฟังหลายรอบ James Cameron ก็ตัดสินใจนำเพลงนี้มาใช้ประกอบภาพยนต์ Titanic และกลายเป็นเพลงที่โด่งดังไปทั่วโลกติด Top Chart ในหลาย ๆ ประเทศ

 

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 25 เมษายน 2557 15:11 แก้ไข: 01 พฤษภาคม 2563 09:32 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 Ikkyu, Ico24 pompom, และ 5 คนอื่น.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

มาลงเรือออกทะเลด้วยครับ

ได้รู้ว่า พ่อหนุ่ม Kittisakdi Choomalee สุนทรีไม่เบา

คุณต้องทำการเข้าระบบก่อนแสดงความเห็น