นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
Network
Members · Following: 0 · Followed: 16

อ่าน: 4061
ความเห็น: 0

ก้าวย่าง ทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: งดเที่ยวบาร์ แต่มาท่องข้อมูล ๖

probability density curve ของข้อมูลที่เบ้ซ้าย

ขออีกสักบันทึกก็แล้วกันนะครับสำหรับเรื่องของการสร้างเส้นโค้ง probability density ของข้อมูล ซึ่งยังเหลือข้อมูลที่เบ้ซ้าย (skewed to the left)

อันที่จริงคำสั่งทั้งหลายก็เหมือนกับในบันทึกที่ผ่านมาครับ ใจความหลักจริง ๆ อยู่ที่การสร้างข้อมูลแบบสุ่มขึ้นมาให้ได้ distribution ตามที่ต้องการ ซึ่งเป็นเรื่องที่ต้องหาวิธีเอา หรือต้องทราบ distribution ของข้อมูลในรูปแบบต่าง ๆ มาเป็นฐานในการสร้างข้อมูลแบบสุ่มให้มี distribution ตามที่ต้องการ

ผมพยายามหาทางสร้างข้อมูลที่เบ้ซ้ายอยู่หลายแบบแต่ไม่ประสบความสำเร็จซะที เลยต้องมาทำวิธีที่เรียกว่าหักคอเอา

อันที่จรองแล้วยังมี distribution อีก ๑ distribution ที่น่าสนใจและสามารถนำมาใช้ในการสร้างข้อมูลแบบสุ่มให้มี distribution ตามที่ต้องการได้ นั่นคือ Gamma distribution

เพียงแต่ผมยังไม่เข้าถึงในรายละเอียดของ Gamma distribution มากนักซึ่งการสร้างข้อมูลแบบสุ่มของ gamma distribution ในโปรแกรม R นั้นต้องกำหนดค่า shape และ scale/ rate ของข้อมูลด้วย โดยค่าปกติในการสร้างตัวเลขแบบสุ่มของ Gamma distribution นั้น หากไม่กำหนด scale ก็จะหมายถึงกำหนดให้ scale มีค่าเท่ากับ 1

ส่วน shape นั้น หากค่า shape มีค่าน้อย ๆ หรือน้อยมาก ๆ หรือเข้าใกล้ศูนย์ (๐) และค่าของ scale มีค่ากลาง ๆ (moderate scale) จะมีข้อมูลที่สร้างขึ้นแบบสุ่มจำนวนมากมีค่าเข้าใกล้ศูนย์ (a large parts of the mass of the Gamma distribution is on values of x so near zero)

ผมลองให้ดูตัวอย่าง Gamma distribution ของข้อมูลที่สร้างขึ้นแบบสุ่ม โดยกำหนดค่า shape และ scale ต่าง ๆ ดังรูป (สร้างจากโปรแกรม R โดยให้รวม ๖ histogram ไว้ในรูปเดียวกัน)

คลิกที่รูปเพื่อดูรูปขนาดใหญ่

ลองดู distribution ของข้อมูลแบบสุ่มเมื่อกำหนดค่า shape ให้คงที่คือเท่ากับ 10 เมื่อเปลี่ยน scale เป็น 1 5 10 1/5 1/10 และ 1/20 ตามลำดับ โปรดสังเกตค่าเฉลี่ย ค่าต่ำสุด และค่าสูงสุดของแต่ละ histogram นะครับ (ดูการเปลี่ยนตำแหน่ง (กระจาย) ของข้อมูลในแกนนอน)

 

 

จะเห็นว่า distribution ของข้อมูลไม่ต่างกันมานัก (ลักษณะเส้นโค้งฯ และ histogram) แต่ที่ขยับไปเมื่อ scale เปลี่ยนไปก็คือช่วงของข้อมูลแกนนอน

เมื่อค่า scale เพิ่มมากขึ้นช่วงของข้อมูลแกนนอนจะยิ่งห่างจากแกนตั้งหรือห่างจากศูนย์มากขึ้น แต่หากค่า scale ลดลอง ค่าของแกนนอนจะขยับเข้าใกล้ศูนย์มากขึ้น

มาถึงการสร้างข้อมูลแบบสุ่มที่เบ้ซ้ายกันบ้างนะครับ

จากที่กล่าวไปข้างต้นว่าผมยังหาทางสร้างข้อมูลแบบสุ่มที่เบ้ซ้ายไม่ได้ ก็เลยต้องมาใช้วิธีแบบหักคออย่างที่ว่าครับ

ก็ไม่มีอะไรมาก จำการสร้างข้อมูลแบบสุ่มที่เบ้ขวาได้ไหมครับ

ผมก็ใช้วิธีเดียวกับการสร้างข้อมูลที่เบ้ขวาจาก Chi-sqaure distribution เหมือนกัน เพียงแต่พอสร้างเสร็จ ผมก็จัดการสั่งให้กลายเป็น negative ไปซะ

ถีบ ๆ อะไรหรือครับ ก็ทำให้กลายเป็นค่าลบไปซะนั่นเองครับ

ผมกำหนดค่า df=5  เหมือนในบันทึกที่แล้วนะครับ เปลี่ยนค่าที่สร้างขึ้นมาแบบสุ่มให้เป็นค่าลบ โดยการใช้เครื่องหมายลบ ให้ดูคำสั่งในบรรทัดที่ ๒ นะครับ (abc2 <- -(abc2))

-(abc2) ให้ค่า abc2 เป็นค่าลบ

abc2 <- -(abc2) นำค่า abc2 ที่เปลี่ยนเป็นค่าลบแล้วกลับไปเก็บไว้ในวัตถุชื่อ abc2 เช่นเดิม (แทนที่ค่าเดิมด้วยค่าใหม่)

> abc2 <- rchisq(1000, 5)
> abc2 <- -(abc2)
> h22 <- hist(abc2, col="green")
> xfit<-seq(min(abc2),max(abc2),length=1000)
> yfit <- dnorm(xfit, mean=mean(abc2), sd=sd(abc2))
> yfit <- yfit*diff(h22$mids[1:2])*length(abc2)
> lines(xfit, yfit, col="blue", lwd=2)

histogram และ probability density curve distribution ของข้อมูลที่เบ้ซ้ายจึงได้เป็น

 

 

เราเอง

ผมคุ้น ๆ เพลงนี้เหมือนจะจำได้ว่าเป็นเพลงประกอบภาพยนต์เรื่องใดสักเรื่องหนึ่ง แต่นึกไม่ออกสักที

How Much Sorrow

จาก "ก็ลองนับดูสายฝนนั่น นั่นคือน้ำตาจากใจ" ใน "นึกเสียว่าสงสาร" คงละม้ายคล้ายคลึงกับ If you ask, how much sorrow could I endure? It's as much as the Spring river flowing to the east.

ดุจดั่งสายน้ำในยาม (ฤดู) ดอกไม้บาน !!!

*Spring flowers, Autumn Moon, will the seasons ever end…?
Affairs of yesterday, how much could I remember still?
Last night, yet again this little attic embraced in Eastern winds…
In this moonlight, it's such a pain to reminisce for my lost motherland.
The engraved rails and jaded blocks should be there still,
Only those rosy cheeks could have paled with age.
If you ask, how much sorrow could I endure?
It's as much as the Spring river flowing to the east.

*จากความเห็นของวิดีโอนี้

Sections: บริการวิชาการ
License: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
created: 02 November 2012 17:46 Modified: 03 November 2012 14:03 [ Report Abuse ]
ดอกไม้
People who like this: Ico24 ServiceMan, Ico24 kitty, and 3 others.
People Who Like This
 
Facebook
Twitter
Google

Other Posts By This Blogger

ความเห็น

ไม่มีความเห็น

ร่วมแสดงความเห็นในหน้านี้

ชื่อ:
อีเมล:
IP แอดเดรส: 35.170.76.39
ข้อความ:  
เรียกเครื่องมือจัดการข้อความ
   
ยกเลิก หรือ