นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Ico24 ถ้าผมมีแฟนเป็นสาวภาค math

Ico48
Our Shangri-La (Recent Activities)
02 April 2009 22:22
#43102

ฮ่าๆๆๆๆ

หัวเราะ ๕ ครั้ง

แต่ ภาษิตเขาว่าไว้ว่า

หัวเราะทีหลังดังกว่า
จริงหรือเปล่านี้

ขออนุญาตขยายความต่อครับ

ก่อนอื่นมาเรียนวิชาสถิติกันสักนิดครับ

กราฟที่เห็นในรูป ๔ หรือที่สาวชี้อยู่น่ะ เขาเรียกว่า "box plot" หรือ "box-and-whisker diagram/ plot"

box หรือกล่องนี้แสดงข้อมูลอะไรให้เรารู้บ้าง เพื่อความเข้าใจง่ายขึ้น สมมติว่า หนุ่มคนนี้เดตกับสาว ๑๐๐ คน

แกนนอน (จะเรียกว่าแกน x แต่ถ้ากราฟตั้งขึ้นก็เป็นแกน y .โดยปกตินะครับ) เป็นเวลาที่ใช้สำหรับการเดตกับสาวแต่ละคน เริ่มจากซ้ายสุดเป็นเวลาน้อยที่สุด อาจจะเริ่มจากศูนย์ก็ได้ แล้วแต่เวลาที่ใช้จริง

ข้อมูลเวลาที่ใช้ในการเดตกับสาวแต่ละคนจะถูก เรียงลำดับจากน้อยไปมากแล้วหั่นออกเป็น ๔ ส่วนเท่าๆ กันหรือภาษาสถิติเขาเรียกว่า ควอไทล์ (quartile) คือส่วนละ ๒๕ คน

จาก ส่วนที่เป็นเส้นซ้ายมือสุดถึงขีดล่าง(อันแรก) ของตัวกล่องเป็นข้อมูลเวลาที่ใช้กับสาว ๒๕ คนแรก เส้นขีดล่างของกล่องตรงนี้เรียกว่า ควอไทล์ที่ ๑ (1st quartile) (เป็นค่าเวลาที่ควอไทล์)

ต่อ ไปก็เป็นส่วนของกล่องซึ่งแบ่งเป็น ๒ ส่วน จาก ควอไทล์ที่ ๑ จนถึงขีดแบ่งกล่อง (ขีดภายในกล่อง) คือข้อมูลเวลาที่ใช้ในการเดตกับสาวอีก ๒๕ คน ขีดในกล่องนี้อาจจะอยู่ตรงกลางหรืออยู่ที่ตรงไหนของกล่องก็ได้ ขีดนี้เรียกว่า ควอไทล์ที่ ๒ (2nd quartile) หรือเรียกอีกอย่างว่าค่ามัธยฐาน (median) หรือค่ากลางของข้อมูลเวลาการเดตสาว

ถัดไปจากขีดในกล่องถึงส่วนบนของกล่องเป็นข้อมูลเวลาที่ใช้เดตกับสาวอีก ๒๕ คน ขีดนี้เรียกว่า ควอไทล์ที่ ๓ (3rd quartile)

จากขอบกล่องขวาสุด จนถึงขีดทางขวาสุด ตรงนี้จะเป็นข้อมูลเวลาการเดตกับสาวอีก ๒๕ คนที่เหลือ

รวมข้อมูลเวลาที่ใช้เดตกับสาวทั้ง ๑๐๐ คน

เวลา ดูก็ดูว่าแต่ละส่วนห่างเท่าๆ กันไหม หรือส่วนใด ส่วนหนึ่งแคบกว่ากัน ถ้าแคบก็แสดงว่า ข้อมูลเวลาในส่วนนั้น (๒๕ คน) มีความต่างกันน้อยมาก ระหว่างค่าสูงสุด กับค่าต่ำสุดในช่วงนั้นๆ ดูความสม่ำเสมอของชายว่างั้นเถอะ

ส่วนจุด ทางขวาสุดนั้น หรือที่เขาเรียกว่า outlier คือค่าเวลาที่แตกต่างจากกลุ่ม

ค่า outlier นี้เป็นไปได้ทั้งสองทาง คือมีค่าน้อยกว่ากลุ่มเยอะ หรือ มีค่ามากกว่ากลุ่มเยอะๆ

ค่าพวกนี้เวลาแบ่งข้อมูลเพื่อทำ box plot จะไม่ถูกนำมารวมกับกลุ่มจะแยกออกไปไว้ต่างหาก
คือพวกนอกกลุ่ม

เวลาเราคิดค่าเฉลี่ย (mean) ถ้าเราเอาค่าที่เป็น outlier มาคิดด้วยก็จะทำให้ได้ค่าเฉลี่ยที่ (อาจจะ) สูงกว่าความเป็นจริง ไม่ใช่ค่าเฉลี่ยของคนกลุ่มใหญ่จริง

และในการวิเคราะห์ข้อมูล ข้อมูลที่เป็น outlier นี้เราถือว่าเป็นข้อมูลที่ แปลก คือมีค่าต่างจากกลุ่มเยอะๆ เพราะฉะนั้นต้องพิจารณาเป็นพิเศษว่าจะ เขี่ยทิ้งและแนวโน้มที่จะถูกเขี่ยทิ้ง ดีไหม มีสูงด้วย เพราะค่า outlier เช่นนี้จะไปกวน (interfere) การวิเคราะห์ข้อมูล หากไม่ เขี่ยทิ้ง ก็จะถูกจัดการด้วยวิธีพิเศษบางอย่าง เพื่อไม่ให้กวนค่าที่เหลือ

เพราะฉะนั้นถ้าใครที่อยู่ในกลุ่มนี้คือคนที่มีโอกาสสูงที่จะถูกเขี่ยทิ้ง

หรือภาษาทางสถิติเขาว่า มีโอกาสที่จะถูกเขี่ยทิ้งอย่างมีนัยยะสำคัญทางสถิติที่ระดับความเชื่อมั่น ๙๕ %

ฮาๆๆๆๆๆๆๆๆๆ
๕๕๕๕๕๕๕๕๕๕

เราเอง