นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน
อ่าน: 2568
ความเห็น: 7

ถ้าผมมีแฟนเป็นสาวภาค math

"แตกต่างอย่างมีนัยสำคัญทางสถิติ"

 

ถ้าผมมีแฟนเป็นสาวสถิติ




               boyfriend from http://xkcd.com/539/


boyfriend from http://xkcd.com/539/



ญ: ชั้นพา "เพื่อนชาย" ไปด้วยได้มั้ย

ช: ชั้นไม่ใช่เพื่อนชายของเธอ!

ญ: ใช่แน่นอน

ช: แต่ชั้น "เดท" กับใครหลายคน
   
ญ: แต่เธอไปกับชั้นบ่อยกว่าคนอื่นสองเท่า
     และชั้น "แตกต่างอย่างโดดเด่น"
     (ดูกราฟก็กินขาดแล้วครับ ;-)


ช: คณิตศาสตร์ของเธอ ชั้นเถียงไม่ขึ้น

ญ: รับรู้ไว้  ในทางสถิติ ชั้นเป็นคนพิเศษของเธอ



อันนี้ผมเอง: ใครว่าคณิตศาสตร์และสถิติ ไม่เกี่ยวกับชีวิตประจำวัน? ไม่เกี่ยวกับงานประจำ? ;-)
                     เอากะแม่คุณทูนหัวสิ

ปล. อันนี้เป็นบันทึกเรื่อง "สถิติในชีวิตประจำวัน" นะครับ ไม่ได้เพ้อเรื่องรัก


ที่มาภาพ / original image: http://xkcd.com/539/


Sections: Miscellaneous
License: สงวนสิทธิ์ทุกประการ Copyright
created: 02 April 2009 21:18 Modified: 02 April 2009 21:22 [ Report Abuse ]
ดอกไม้
People Who Like This
 
Facebook
Twitter
Google

Other Posts By This Blogger

ความเห็น

Ico48
Our Shangri-La (Recent Activities)
02 April 2009 22:22
#43102

ฮ่าๆๆๆๆ

หัวเราะ ๕ ครั้ง

แต่ ภาษิตเขาว่าไว้ว่า

หัวเราะทีหลังดังกว่า
จริงหรือเปล่านี้

ขออนุญาตขยายความต่อครับ

ก่อนอื่นมาเรียนวิชาสถิติกันสักนิดครับ

กราฟที่เห็นในรูป ๔ หรือที่สาวชี้อยู่น่ะ เขาเรียกว่า "box plot" หรือ "box-and-whisker diagram/ plot"

box หรือกล่องนี้แสดงข้อมูลอะไรให้เรารู้บ้าง เพื่อความเข้าใจง่ายขึ้น สมมติว่า หนุ่มคนนี้เดตกับสาว ๑๐๐ คน

แกนนอน (จะเรียกว่าแกน x แต่ถ้ากราฟตั้งขึ้นก็เป็นแกน y .โดยปกตินะครับ) เป็นเวลาที่ใช้สำหรับการเดตกับสาวแต่ละคน เริ่มจากซ้ายสุดเป็นเวลาน้อยที่สุด อาจจะเริ่มจากศูนย์ก็ได้ แล้วแต่เวลาที่ใช้จริง

ข้อมูลเวลาที่ใช้ในการเดตกับสาวแต่ละคนจะถูก เรียงลำดับจากน้อยไปมากแล้วหั่นออกเป็น ๔ ส่วนเท่าๆ กันหรือภาษาสถิติเขาเรียกว่า ควอไทล์ (quartile) คือส่วนละ ๒๕ คน

จาก ส่วนที่เป็นเส้นซ้ายมือสุดถึงขีดล่าง(อันแรก) ของตัวกล่องเป็นข้อมูลเวลาที่ใช้กับสาว ๒๕ คนแรก เส้นขีดล่างของกล่องตรงนี้เรียกว่า ควอไทล์ที่ ๑ (1st quartile) (เป็นค่าเวลาที่ควอไทล์)

ต่อ ไปก็เป็นส่วนของกล่องซึ่งแบ่งเป็น ๒ ส่วน จาก ควอไทล์ที่ ๑ จนถึงขีดแบ่งกล่อง (ขีดภายในกล่อง) คือข้อมูลเวลาที่ใช้ในการเดตกับสาวอีก ๒๕ คน ขีดในกล่องนี้อาจจะอยู่ตรงกลางหรืออยู่ที่ตรงไหนของกล่องก็ได้ ขีดนี้เรียกว่า ควอไทล์ที่ ๒ (2nd quartile) หรือเรียกอีกอย่างว่าค่ามัธยฐาน (median) หรือค่ากลางของข้อมูลเวลาการเดตสาว

ถัดไปจากขีดในกล่องถึงส่วนบนของกล่องเป็นข้อมูลเวลาที่ใช้เดตกับสาวอีก ๒๕ คน ขีดนี้เรียกว่า ควอไทล์ที่ ๓ (3rd quartile)

จากขอบกล่องขวาสุด จนถึงขีดทางขวาสุด ตรงนี้จะเป็นข้อมูลเวลาการเดตกับสาวอีก ๒๕ คนที่เหลือ

รวมข้อมูลเวลาที่ใช้เดตกับสาวทั้ง ๑๐๐ คน

เวลา ดูก็ดูว่าแต่ละส่วนห่างเท่าๆ กันไหม หรือส่วนใด ส่วนหนึ่งแคบกว่ากัน ถ้าแคบก็แสดงว่า ข้อมูลเวลาในส่วนนั้น (๒๕ คน) มีความต่างกันน้อยมาก ระหว่างค่าสูงสุด กับค่าต่ำสุดในช่วงนั้นๆ ดูความสม่ำเสมอของชายว่างั้นเถอะ

ส่วนจุด ทางขวาสุดนั้น หรือที่เขาเรียกว่า outlier คือค่าเวลาที่แตกต่างจากกลุ่ม

ค่า outlier นี้เป็นไปได้ทั้งสองทาง คือมีค่าน้อยกว่ากลุ่มเยอะ หรือ มีค่ามากกว่ากลุ่มเยอะๆ

ค่าพวกนี้เวลาแบ่งข้อมูลเพื่อทำ box plot จะไม่ถูกนำมารวมกับกลุ่มจะแยกออกไปไว้ต่างหาก
คือพวกนอกกลุ่ม

เวลาเราคิดค่าเฉลี่ย (mean) ถ้าเราเอาค่าที่เป็น outlier มาคิดด้วยก็จะทำให้ได้ค่าเฉลี่ยที่ (อาจจะ) สูงกว่าความเป็นจริง ไม่ใช่ค่าเฉลี่ยของคนกลุ่มใหญ่จริง

และในการวิเคราะห์ข้อมูล ข้อมูลที่เป็น outlier นี้เราถือว่าเป็นข้อมูลที่ แปลก คือมีค่าต่างจากกลุ่มเยอะๆ เพราะฉะนั้นต้องพิจารณาเป็นพิเศษว่าจะ เขี่ยทิ้งและแนวโน้มที่จะถูกเขี่ยทิ้ง ดีไหม มีสูงด้วย เพราะค่า outlier เช่นนี้จะไปกวน (interfere) การวิเคราะห์ข้อมูล หากไม่ เขี่ยทิ้ง ก็จะถูกจัดการด้วยวิธีพิเศษบางอย่าง เพื่อไม่ให้กวนค่าที่เหลือ

เพราะฉะนั้นถ้าใครที่อยู่ในกลุ่มนี้คือคนที่มีโอกาสสูงที่จะถูกเขี่ยทิ้ง

หรือภาษาทางสถิติเขาว่า มีโอกาสที่จะถูกเขี่ยทิ้งอย่างมีนัยยะสำคัญทางสถิติที่ระดับความเชื่อมั่น ๙๕ %

ฮาๆๆๆๆๆๆๆๆๆ
๕๕๕๕๕๕๕๕๕๕

เราเอง

Ico48
mandala (Recent Activities)
03 April 2009 01:15
#43106


ประโยคแรกว่าเด็ดแล้ว "รับรู้ไว้  ในทางสถิติ ชั้นเป็นคนพิเศษของเธอ"
แต่ประโยคหลังเด็ดกว่า "มีโอกาสที่จะถูกเขี่ยทิ้งอย่างมีนัยยะสำคัญทางสถิติที่ระดับความเชื่อมั่น ๙๕ %"

เรื่องนี้สอนให้รู้ว่า เหนือฟ้ายังมีฟ้า เหนือสถิติพื้นฐาน ยังมีสถิติวิเคราะห์
ถ้ามันยากนัก อย่ารักมันเลยกับนักสถิติเลย


ของแถม
  ....นิยามความรักของนักสถิติ ....
ถ้าคุณรักใครสักคน ปล่อยเธอไป
ถ้าเธอรักคุณ ความน่าจะเป็นที่เธอจะกลับมาจะมีค่าสูง
แต่ถ้าเธอไม่รักคุณความสัมพันธ์ของคุณไม่มีความเป็นไปได้

น้องหลา :)

Ico48
NovemberRain (Recent Activities)
03 April 2009 06:00
#43110
ผมพยายามเขียนตัวอย่างที่ เกลอ ยกมา โดยใช้ R แบบง่ายๆ นะครับ

สมมติครับ สมมติ ว่าผม "เดท" กับดารา 7 คน
ผมก็สร้าง vector  แสดงจำนวนความถี่ที่ผมไปกับดาราแต่ละคนออกมา แล้วผมตั้งชื่อมันว่า mydate

> mydate <- c(5, 10, 1, 8, 20, 15, 60)

# ผมเดทกับ 7 คนที่ว่า ตามลำดับ จาก 5, 10, ...  ไปจนถึง 60 ครั้ง

> names(mydate) <- c("Paeng", "Chompoo", "May", "Tangmo", "Peemai", "Pinky", "Pancake")

# เพื่อไม่ให้สับสนว่าผมไปกับใครบ้าง อ่ะ -- ผมตั้งชื่อไว้หน่อยนึง
# มี แป้ง ชมพู่ เมย์ แตงโม ปีใหม่ พิ้งกี้ แล้วก็แพนเค้ก
# ผมไม่รู้หรอกครับ ว่าใครเป็นใคร อาศัยเปิดเอาจากหน้าบันเทิงไทยรัฐ
# เจอชื่อใครก่อน ก็เอาชื่อนั้น ดีหน่อยที่ไม่เจอชื่อ "คุณระเบียบ"

> mydate

# ดูหน่อย ว่าเราไปเดทกับใครกี่ครั้ง

  Paeng Chompoo     May  Tangmo  Peemai   Pinky Pancake
      5      10       1       8      20      15      60

> boxplot(mydate, main="my celebrity date", horizontal=TRUE)

# ลองสั่ง boxplot ดู ได้ผลเป็นข้างล่างครับ
# ใครจะลองเอาไปเล่นก็ได้ครับ R เบื้องต้นไม่ยากครับ
# ที่เห็นเป็น "#" คือ comment ของ program รวมเบ็ดเสร็จจากสร้างข้อมูลจนถึง plot แค่สามคำสั่งเองครับ
#  สีน้ำเงินคือ output


mydate

Date พะ..พะ..พร้อมกัน 7 คน เลยหรือครับ

55555 ยกทั้งนิ้วและมือให้เลยครับ

ฝะ..ฝะ..ฝีมือ ครับ

 

 

ต้องการคู่เดตคนที่แปดไหมคะ...ไม่ต้องเปิดหน้าไทยรัฐด้วยนะ  คิคิ  (ล้อเล่นค่ะ)

 

 

Ico48
ญ.ไทย [IP: 124.121.69.65]
05 April 2009 20:48
#43175

ดีคร้า รายงานตัวเป็นสมาชิกใหม่อ่ะ

Ico48
NovemberRain (Recent Activities)
06 April 2009 02:55
#43180
  • แหะๆ -- มันเป็นเรื่องสมมติทั้งนั้นครับ ท่านคนธรรมดา ครับ ;-)
    จริงๆ คงไม่มีปัญญา

  • Welcome to the club -- เอ้ย-ย ไม่ใช่ -- ขอบคุณครับ น้องปุย แค่เจ็คคนก็ไม่ไหวแล้วครับ ;-)
    อย่าให้ต้องมีคนที่ 8-9-10 เลย เดี๋ยวจนแย่ครับ ;-)

  • ขอบคุณครับ คุณ  ญ.ไทย  ไม่ต้องรายงานตัวครับ เข้ามาแจมได้ทุกเมื่อ

  • ขอบคุณ น้องหลา และ เกลอ ที่ให้ความกระจ่างเกี่ยวกับ box plot
     
  • สรุปว่าน้องแพนเค้กเป็น outlier นะครับ  -- ว้าาา อุตส่าห์ไปกินข้าวด้วยกันออกบ่อย กลายเป็นโดนเขี่ยทิ้งซะงั้น

  • นึกถึงวลีเด็ด ที่เราชอบแซวนักสถิติกันบ่อยๆ -- "There are three kinds of lies:  lies, damned lies, and statistics" -- โกหกมีอยู่สามแบบ: โกหก, โกหกหน้าด้านๆ , และสถิติ (ฮา) 

ร่วมแสดงความเห็นในหน้านี้

ชื่อ:
อีเมล:
IP แอดเดรส: 100.26.176.182
ข้อความ:  
เรียกเครื่องมือจัดการข้อความ
   
ยกเลิก หรือ