ความเห็น: 4
ก้าวย่าง ทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: ทำไม (ต้องเห็น)?
ช่วงประมาณ ๔ โมงเย็นนิดๆ ของวันจันทร์ นักศึกษาแพทย์ชั้นปีที่ ๕ จำนวน ๔ คนมาให้ผมช่วยดูคำสั่งของโปรแกรม R ที่มีคนช่วยเขียนไว้ให้แล้ว
ความต้องการของน้องๆ นักศึกษากลุ่มนี้คือ ทำอย่างไรที่จะให้ข้อมูลที่จัดการด้วยโปรแกรม R กลับมาอยู่ในข้อมูลเดิมที่เป็นแฟ้มข้อมูลของโปรแกรม excel
ผมมีคำถามอยู่ในใจเหมือนกันว่า ทำไม
ทำไมเด็กๆ ถึงต้องกลับมาจัดการข้อมูลด้วยโปรแกรม excel อีกรอบในเมื่อทุกอย่างจัดการเรียบร้อยแล้วจากโปรแกรม R
หรือว่าโปรแกรม R จะยากเกินกว่าที่ใครหลายคน ใครบางคนจะเข้าใจได้ ?
ก่อนหน้านี้ ผมได้รับการบอกเล่าเรื่องที่เกี่ยวกับโปรแกรม R จากเพื่อนคนหนึ่งว่า โดยส่วนตัวแล้วอยากจะให้เด็กๆ เรียนรู้โปรแกรม R แทนที่จะใช้โปรแกรมวิเคราะห์ข้อมูลทางสถิติอื่นๆ เนื่องจากไม่ต้องการติดกรอบของลิขสิทธิ์การใช้งานโปรแกรม แต่ไม่ได้รับการสนับสนุนให้ทำอย่างนั้นจาก (คนใน) หน่วยงาน
ข้อติดขัดในผู้ใช้เองส่วนหนึ่งคือ
เด็กๆ ไม่อยากจะใช้ R เนื่องเพราะมองไม่เห็นข้อมูล !!!
คำถามที่เกิดในใจผมก็คือ
ทำไมต้องมองเห็นข้อมูล (ทุกเวลา) ด้วย?
ถ้ามองเห็นข้อมูล (ทุกเวลา) แล้วจะมีประโยชน์อะไร หรือให้ความรู้สึกอย่างไร ให้ผลดีกับการวิเคราะห์ข้อมูลตรงไหน?
ก็เลยต้องหันกลับไปหาโปรแกรมที่มองเห็นข้อมูลอย่างโปรแกรม excel
หากเรารู้จักและเข้าใจข้อมูลของเราดี รู้ว่าเรากำลังทำอะไรกับข้อมูลของเรา เราจำเป็นต้องนั่งมองตัวเลขเยอะๆ อยู่ตลอดเวลาทำไม? ในเมื่อเราจะเรียกออกมาดูตอนไหนก็ได้อยู่แล้วในทุกโปรแกรมวิเคราะห์ข้อมูลทางสถิติ
โปรแกรม excel เองก็มีฟังก์ชันที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลทางสถิติอยู่บ้างเหมือนกัน แต่ก็ยังทำได้ไม่ดีนักหรือทำเรื่องลึกลับซับซ้อนไม่ได้เหมือนโปรแกรมวิเคราะห์ข้อมูลทางสถิติโดยตรง
ผมจำได้ว่าเมื่อหลายปีก่อนโน้น อาจารย์ดอน (Don McNeil) ได้เขียนมาโครเสริมสำหรับการวิเคราะห์ข้อมูลทางสถิติด้วย excel อยู่เหมือนกัน แต่ทางฝั่งระบาดวิทยาไม่ซื้อฟังก์ชันนี้
ไม่ซื้อคือไม่ใช้นะครับ ไม่ใช่จ่ายตังค์ซื้อ เนื่องเพราะอาจารย์ดอนให้ใช้ฟรี
คนที่ไม่รู้จักอาจารย์ดอน ก็ลองถามคนแถวๆ คณะวิทยาศาสตร์และเทคโนโลยีดูเอาครับ
เนื่องจากข้อจำกัดข้างต้นของโปรแกรม excel จึงทำให้การวิเคราะห์ข้อมูลหลายๆ อย่างทำไม่ได้ใน excel หรือการคำนวณบางอย่างมีความคลาดเคลื่อนไปบ้าง แต่ก็มีผู้ที่เขียน มาโครเสริมเข้ามาช่วยให้การวิเคราะห์ข้อมูลทำได้มากขึ้น มีทั้งที่ให้ใช้ฟรีและต้องจ่ายตังค์
หากต้องซื้อเราก็จะมาติดวังวนเรื่องลิขสิทธิ์โปรแกรมอีกรอบ
แต่ก็มีคนพัฒนาโปรแกรมเสริมที่ให้โปรแกรม R ทำงานร่วมกับโปรแกรม excel อยู่เหมือนกันคือข้อมูลทั้งหมดจะอยู่ในแฟ้มข้อมูลของโปรแกรม excel การคำนวณต่างๆ จะให้โปรแกรม R คำนวณอยู่เบื้องหลัง (Back end) หรือที่มีชื่อเรียกว่า RExcel
ผมเองไม่ได้ลองใช้ RExcel ครับ ถ้าประจวบเหมาะเวลาโอกาสดีๆ จะนำมาเขียนถึงสักครั้งครับ
แต่เท่าที่ผมดูวิดีโอตัวอย่างการใช้งานแล้ว ผมพบว่าน่าจะเป็นเรื่องที่ค่อนข้างเข้าใจยากไม่น้อยไปกว่าการใช้ R โดยตรง เพียงแต่การทำงานต่างๆ เราทำผ่านหน้าต่างของโปรแกรม Excel เท่านั้น การคำนวณโดยโปรแกรม R จะหลบอยู่หลังฉาก หลังจากคำนวณค่าให้แล้ว เราต้องดึงเอาค่าที่คำนวณได้มาใส่ในหน้าต่างของ Excel เอง (ผ่านเมนู)
ผมใช้เวลาไปชั่วโมงกว่าๆ ในการติดตั้ง R และ Tinn-R ในเครื่องของนักศึกษา ติดตั้งและทำให้ใช้งานได้
ปัญหาหลักๆ ของโปแรแกรม R ก็คือการที่โปรแกรม R เป็น Open Source ครับ ไม่ใช่ว่าการเป็น Open Source แล้วจะไม่ดีนะครับ จุดเด่นของ Open Source นอกเหนือจากที่เราทราบว่าเป็นโปรแกรมที่ไม่ต้องจ่ายค่าลิขสิทธิ์การใช้โปรแกรมแล้วนะครับ จุดเด่นคือการอัพเดตที่เร็วครับ
การพัฒนาไปสู่เวอร์ชันใหม่ๆ ทำได้เร็วในระยะเวลาไม่นานนัก อาจจะเรียกว่าเดือนต่อเดือนเลยก็ว่าได้ครับ
จุดเด่นนี่แหละครับที่กลายมาเป็นจุดด้อยเหมือนกัน
ทำไมถึงเป็นจุดด้อยครับ
การพัฒนาไปเป็นเวอร์ชันใหม่นั้น จะมีการใส่ฟังก์ชันใหม่ๆ เข้าไป หรือเปลี่ยนแปลงวิธีการบางอย่าง (ของโปรแกรม) ไปจากเดิม จะมากหรือน้อยขึ้นอยู่กับการปรับเปลี่ยนในแต่ละครั้ง
จุดเด่นอีกประการของการเป็น Open Source คือมีผู้ร่วมพัฒนาโปรแกรมเสริมหลากหลายคน หลากหลายกลุ่ม
สองส่วนนี้ครับที่เป็นทั้งจุดเด่นและจุดด้อย
โปรแกรมเสริมที่เคยใช้ได้กับเวอร์ชันเก่า (อาจจะ) ใช้ไม่ได้ในเวอร์ชันใหม่แม้จะเป็นเวอร์ชันที่ถัดไปเท่านั้นเอง
เนื่องจากโปรแกรมเสริมต้องคอย compile โดยใช้โปรแกรม R รุ่นใหม่อยู่เสมอเพื่อให้ใช้งานได้กับเวอร์ชันใหม่ล่าสุดอย่างไม่มีปัญหา โปรแกรมเสริมบางตัวที่ compile กับเวอร์ชันเก่ากว่าไม่สามารถใช้ได้กับเวอร์ชันใหม่
กว่าจะทำให้ลงตัวใช้งานได้ก็เล่นเอาใช้เวลาไปชั่วโมงกว่าแล้วครับ
ชุดคำสั่งของโปรแกรม R ที่มีคนเขียนมาให้นักศึกษานั้นค่อนข้างซับซ้อนซ่อนเงื่อน เป็นถึงระดับการเขียนโปรแกรมกันเลยครับ
ผมไม่ใช่โปรแกรมเมอร์แต่อย่างใดเป็นแต่โปรแกรมบ้าครับ เจอโค๊ดโปรแกรมเข้าก็บ้าไป เฟือนไปเลยครับ ไม่ก็ทำให้โปรแกรมที่ใช้ได้เป็นใช้ไม่ได้ไปเลยก็มีครับ
หลังจากที่ทำให้โปรแกรม R ใช้งานได้แล้วก็มานั่งแคะๆ ว่าโค๊ดที่มีคนเขียนมาให้นั้นทำอะไรบ้าง ใช้เวลาไปอีกร่วมๆ ๒ ชั่วโมงครับ
หลังจากที่สำเร็จตามที่ตั้งใจไว้ของนักศึกษาแล้วว่าจะดูข้อมูลใน Excel ให้ได้ก็ถึงเวลาแยกย้ายกันไปครับ
มาถึงบรรทัดนี้ผมก็คงต้องแยกย้ายไปแล้วเหมือนกันครับ
เจอกันบันทึกหน้าครับ
เราเอง
บันทึกอื่นๆ
- เก่ากว่า « ก้าวย่าง ทางเดิน ลืมเลือนคืนวัน ...
- ใหม่กว่า » ก้าวย่าง ทางเดิน ลืมเลือนคืนวัน ...
ความเห็น
ของฟรีของดีมีมากหลาย แต่พอไม่ได้ใช้ประจำ เลยต้องสู้ กับมันมากหน่อย
นักศึกษายังไม่ได้ใช้ตัวไหนเป็นประจำจนเชี่ยวชาญ (คิดเอาว่าอย่างนี้) น่าจะศึกษาโปรแกรมใหม่ๆ ที่ไม่เคยใช้ได้ไม่ยาก เพราะยังไม่ยึดติดกับตัวไหน :)
- หนูณิชน์ มีรายละเอียดอื่นอีกไหมครับ ^_^
- ServiceMan เด็กๆ รุ่นใหม่ ส่วนใหญ่จะมีพื้นฐานทางคอมฯ มาบ้างแล้ว การเรียนรู้เรื่องใหม่ๆ น่าจะทำได้ไม่ยาก เรียนรู้ไม่จำกัดอยู่เฉพาะโปรแกรมใดโปรแกรมหนึ่ง จะได้นำไปปรับใช้ให้เหมาะตอนทำงาน
- คนธรรมดา การเห็นข้อมูลแบบนี้ก็ดีเหมือนกันครับ ทุกโปรแกรมสามารถแก้ หรือแสดงข้อมูลได้เหมือนกันครับ แต่ที่เห็นจะๆ แก้ง่ายกว่าครับ แต่ถ้าเป็นเรื่องของแนวคิดการจัดการข้อมูล การที่ให้แผ่นข้อมูล ปนๆ กับผลลัพธ์ หรือหน้าต่างทำงาน จะเกิดความผิดพลาด (โดยบังเอิญ) ได้ง่ายครับ เช่นการแก้ไขข้อมูลโดยไม่ตั้งใจครับ
เราเอง
08 กุมภาพันธ์ 2555 08:31
#74931
เพลงเพราะครับ
สอดคล้องกับเนื้อหาในบันทึกนี้
ทำไม ต้องเห็น?
แต่เวลาผมเห็นกราฟใน excel ผมก็ไปแก้ข้อมูลให้กราฟมันสวยขึ้นได้นะครับ ฮา