นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1111
ความเห็น: 2

ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: ทางสายเปิดกว้าง รกร้างคนร่วมทางจริงหรือ?

ถนนสาย Open Source ไม่ปลอดภัย ไร้คนร่วมทาง อยู่นอกโลกกว้างจริงหรือไร?

จากบันทึก "ไล่ล่าหรือถูกไล่ล่า"

ผมกลับไปคิดว่า จริงๆ แล้ว R หรือ Open Sorce Software นั้นไม่ดีจริงหรือ เป็นทางสายที่เปลี่ยวร้างผู้คนจริงหรือ

กับข้อสงสัยที่ว่า

- ผลการคำนวณจากโปรแกรม R นั้นให้ผลต่างจากโปรแกรมทางการค้าอื่น ๆ เราจึงไม่เชื่อในผลลัพธ์จากการคำนวณของ R ?

- ไม่มีใครสามารถตรวจสอบได้ว่า สิ่งที่เกิดขึ้นจาก R นั้นถูกต้องจริงหรือไม่?

- R นั้นยาก

- ฯลฯ

ในบางประเด็น แนวคิดในการคำนวณค่าบางอย่างนั้นมีทางเลือกในการคำนวณค่าได้มากกว่า ๑ ทาง ดังนั้นเมื่อใช้ทางเลือกที่แตกต่างกัน ผลที่ได้ย่อมมีโอกาสแตกต่างกันได้เช่นกัน

ถามว่า แตกต่างกันในระดับตำแหน่งของทศนิยมนั้นยอมรับได้หรือไม่?

- แตกต่างกันเท่าไหร่ถึงจะยอมรับไม่ได้

- ผลที่แตกต่างกันระหว่างผลที่ได้จาก R และผลที่ได้จาก Comercial software อื่น ๆ นั้น อย่างไหนถูกต้อง แม่นยำมากกว่ากัน ?

- สามารถตรวจสอบกลับได้ว่าผลที่ได้จาก Commercial Software นั้นถูกต้องจริง?

อาจจะมีคนนำผลจากการคำนวณของ R และผลจากการคำนวณของโปรแกรมอื่น ๆ มาเปรียบเทียบกันแล้วพบความแตกต่างในผลการคำนวณระหว่างโปรแกรม เราคิดว่าผลลัพธ์จากโปรแกรมไหนที่ถูกต้องจริง ๆ ผลลัพธ์จากโปรแกรมไหนน่าเชื่อถือได้มากกว่า

ผมมองว่าหลักการของการคำนวณนั้นเมื่อเราเปรียบเทียบผลจากการคำนวณที่ใช้วิธีการคำนวณวิธีเดียวกัน เช่นใช้สูตรเดียวกันในการคำนวณ หากผลการคำนวณหรือผลที่แตกต่างกันในระดับของตัวเลขทศนิยมไกล ๆ นั้นเกิดขึ้นจากอะไรได้บ้าง

นั่นคือการย้อนกลับไปดูว่าวิธีการคำนวณนั้น ๆ แม้จะใช้สูตรเดียวกันในการคำนวณ แต่ลำดับขั้นตอนของการนำค่าต่าง ๆ มาแทนในสูตรนั้น มีลำดับขั้นตอนอย่างไร การที่จะได้มาซึ่งค่านั้น ๆ ได้มาอย่างไร

ข้อเท็จริงอย่างหนึ่งที่เราทราบกันดีคือ โดยส่วนใหญ่แล้ว Commercial software นั้นเราย้อนกลับไปตรวจสอบที่มาที่ไปได้ยาก เนื่องจากเป็นลัษณะทางการค้าที่ปิดบัง Source Code

สิ่งที่เราตรวจสอบได้ก็คือสิ่งที่มีอยู่ในคู่มือของโปรแกรมเท่านั้น เช่น ในคู่มืออาจจะระบุวิธีการคำนวณ (สูตร) เอาไว้ว่าใช้วิธีใดในการคำนวณ

สำหรับโปรแกรมที่เป็น Open Source Software อย่าง R นั้นนอกเหนือจากที่เราสามารถที่จะย้อนกลับไปดู Source Code ของโปรแกรม (หรือคำสั่งที่ใช้ในการคำนวณ) ได้แล้ว เรายังดูวิธีการคำนวณที่ระบุไว้ในคู่มือได้อีกด้วย

ยกเว้นว่าในคู่มือไม่ได้ระบุไว้

สำหรับ R แล้วนั้น ชุดคำสั่งที่ได้รับการเผยแพร่ใน Cran-R นั้นจะต้องผ่านการตรวจสอบจากทีมพัฒนาหลักของ R ก่อน รวมถึงชุดคำสั่งทั้งหมดมีคู่มือการใช้/ รายละเอียดของคำสั่งไว้ด้วย

ข้อเท็จจริงอีกอย่างคือ

R นั้นถูกพัฒนามาจากรากฐานเดียวกันกับ Commercial Software อย่าง S หรือ S-Plus ที่เป็นโปรแกรมคำนวณทางสถิติที่ได้รับความนิยมสูงโปรแกรมหนึ่ง และ core team ของผู้พัฒนา R คือคนเดียวกับที่พัฒนาโปรแกรม S-Plus

ในกลุ่มของผู้ใช้ R เองก็มีการจัดกิจกรรมร่วมกันในนามของ UseR! ซึ่งรวมกันกันจัดกิจกรรมตั้งแต่ปี ค.ศ. ๒๐๐๔ เป็นต้นมา

useR! 2004, Vienna, Austria
useR! 2006, Vienna, Austria
useR! 2007, Ames, Iowa, USA
useR! 2008, Dortmund, Germany
useR! 2009, Rennes, France
useR! 2010, Gaithersburg, Maryland, USA
useR! 2011, Coventry, United Kingdom
useR! 2012, Nashville, Tennessee, USA
useR! 2013, Albacete, Spain

การสัมมนาผู้ใช้ R ประจำปี ๒๕๕๖ นั้นเพิ่งจัดไปเมื่อวันที่ ๑๐ -๑๒ กรกฎาคม ๒๕๕๖ นี้เอง โดยจัดขึ้นที่ University of Castilla-La Mancha ประเทศสเปน

ลองดูหน้าดูตาของผู้เข้าร่วมกิจกรรม useR! 2013 ได้ตามรูปนะครับ เผื่อว่าเจอคนที่รู้จักบ้าง

อิอิอิ

 

เราเอง

 

เพลง: Piper to the End
ศิลปิน: Mark Knopfler

 

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 28 กรกฎาคม 2556 15:37 แก้ไข: 28 กรกฎาคม 2556 15:37 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 DaDa, Ico24 ServiceMan, และ 6 คนอื่น.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ถ้าในทาง lab ISO/IEC 17025 หากมีการใช้โปรแกรมในการคำนวณเช่น Exel จะต้องทวนสอบ ซึ่งส่วนใหญ่ก็จะใช้วิธีการคำนวณด้วยสูตรพื้นฐานด้วยเครื่องคิดเลขครับ ผลที่ได้ต่างกันบ้างตามการปัดเศษ

และแม้แต่ Exel เองการหาค่า SD ของตัวเลขจำนวนเดียวกัน 10 ค่ายังไม่ได้ศูนย์เลยครับ เนื่องจากการปัดเศษและความละเอียดของระบบทศนิยมที่ใช้ :)

ข้อแตกต่างของผลลัพธ์อยู่ที่หลายองค์ประกอบด้วยกัน สูตรที่ใช้คำนวณ วิธีการทางสถิติที่ใช้ในการคำนวณ การปัดทศนิยม ลักษณะของการเก็บค่าของโปรแกรม (เช่น float, integer, double, long, bytes ...) รวมถึงการกำหนดค่าในการแสดงผล

เช่นในโปรแกรม stata ชนิดของข้อมูลตัวเลขที่เป็นค่า default คือ float

float หมายความว่าเป็นตัวเลขที่มีความถูกต้องของค่า ๖ ตำแหน่งเท่านั้น เช่นที่เราเห็น ๑.๐๐๐๐๐ นั้นที่จริงอาจจะเป็นค่า ๐.๙๙๙๙๙๙๙๙๘๗๑๒๓... ก็ได้

อิอิอิ

เราเอง

ร่วมแสดงความเห็นในหน้านี้

ชื่อ:
อีเมล:
IP แอดเดรส: 3.236.204.251
ข้อความ:  
เรียกเครื่องมือจัดการข้อความ
   
ยกเลิก หรือ