Big Data คืออะไร มาทำความรู้จักกับ Big Data ใน 5 นาที
Big Data เกิดขึ้นจากการที่โลกใบนี้มีข้อมูลเกิดขึ้นอย่างมากมายมหาศาล เรียกได้ว่า Data มีการเกิดขึ้นได้ทุกวินาทีบนโลกดิจิตอล โดยตัวช่วยในการเข้าถึงข้อมูลเหล่านี้ได้คืออินเทอร์เน็ตและเทคโนโลยีต่าง ๆ ที่ช่วยให้เราสามารถใช้ประโยชน์จากข้อมูลปริมาณมหาศาลนี้ได้ รวมถึงเป็นเครื่องมือที่ช่วยในการหารูปแบบข้อมูลที่เกิดขึ้น พฤติกรรม หรือการคาดการณ์แนวโน้มหรือเทรนด์ที่จะเกิดขึ้นได้อย่างแม่นยำ
Big Data คือ
Big Data คืออะไร?
Big Data หรือในภาษาไทย แปลไว้ว่า “ข้อมูลมหัต” หมายถึง ข้อมูลปริมาณมหาศาลที่สามารถเก็บและนำมาใช้วิเคราะห์ ประมวลผล และเพื่อประโยชน์ในแง่มุมต่าง ๆ ได้
Big Data คือ ข้อมูลดิจิตอลในรูปแบบต่าง ๆ ที่มีจำนวนมากมายมหาศาล ชอฟต์แวร์หรือฮาร์ดแวร์นั้นไม่สามารถรองรับข้อมูลเหล่านี้ได้เพียงพอ โดยส่วนใหญ่แล้วข้อมูลเหล่านี้มักจะถูกใช้ในเชิงธุรกิจ เช่นการประเมินความต้องการของกลุ่มลูกค้า มักจะเป็นข้อมูลที่ถูกเก็บไว้ในฐานข้อมูลขององค์กรหรือบริษัท
ทำความรู้จักกับ Big Data
Big Data อาจฟังดูเหมือนเป็นเรื่องไกลตัวหากเราไม่ได้อยู่ในสายงาน Data Analysis แต่จริง ๆ แล้วการใช้ Big Data เป็นสิ่งที่ใกล้ตัวมาก ๆ และเราสามารถพบเจอได้ในชีวิตประจำวัน ยกตัวอย่างเช่น การพยากรณ์อากาศที่อัปเดตข้อมูลสภาพอากาศแบบ Real-Time, การใช้งาน GPS และ Mobile Map ที่อัปเดตข้อมูลการจราจรแบบ Real-Time สิ่งเหล่านี้เป็นตัวอย่างของบริการที่น้อง ๆ ใช้ในชีวิตประจำวันที่อาศัยการทำงานและประมวลผลจาก Big Data เช่นเดียวกัน
Big Data เกิดขึ้นได้อย่างไร?
Big Data เป็นคำศัพท์ใหม่ที่เพิ่งเริ่มใช้ในช่วงปี 1990 โดยมี John Mashey ผู้ที่ทำให้คำนี้เป็นที่รู้จักขึ้นมา ซึ่ง Big Data หมายถึงข้อมูลที่มีปริมาณที่ใหญ่มากที่ซอฟท์แวร์รุ่นเก่าไม่สามารถประมวลผลได้ ดังนั้น การทำงานของ Big Data จึงจำเป็นที่จะต้องอาศัยเทคนิคและเทคโนโลยีสมัยใหม่ ที่สามารถรวบรวม จัดเก็บ และวิเคราะห์ข้อมูลที่มีขนาดใหญ่ ซับซ้อน และหลากหลายได้ โดยในปี 2018 ได้มีการนิยาม Big Data ใหม่ว่า “Big Data คือ เครื่องมือที่ใช้ในการจัดการกับข้อมูล”
คุณลักษณะของ Big Data (6V) มีดังต่อไปนี้
Big Data มีความแตกต่างจากข้อมูลธรรมดาทั่วไปด้วยคุณลักษณะต่าง ๆ ที่ไม่ได้มีเพียงเรื่องของปริมาณและขนาดของข้อมูลเพียงเท่านั้น ซึ่งคุณลักษณะของ Big Data นั้นมีดังต่อไปนี้
ข้อมูลเหล่านั้นต้องมีปริมาณมาก (1V-Volume)
คุณลักษณะของ Big Data อย่างแรกเลยคือจะต้องเป็นข้อมูลที่มีปริมาณมหาศาล เป็นข้อมูลที่มนุษย์ไม่สามารถประมวลผลทำความเข้าใจได้ด้วยตัวเอง จำเป็นต้องใช้เครื่องมือหรือเครื่องจักรกลเรียนรู้ (Machine Learning) ในการประมวลผล ซึ่ง Big Data สามารถเป็นได้ทั้งข้อมูลออฟไลน์และข้อมูลออนไลน์ และต้องมีปริมาณมากกว่าหน่วย TB (Terabyte)
ข้อมูลที่มีการเปลี่ยนแปลงอย่างรวดเร็ว (2V-Velocity)
ข้อมูลที่เรียกว่า Big Data จะสามารถเปลี่ยนแปลงได้ตลอดเวลาซึ่งจะต้องติดตามแบบ Real-Time เนื่องจากบนโลกดิจิตอลมีข้อมูลใหม่ ๆ เข้ามาอัปเดตอยู่ตลอด ทำให้การประมวลผลเพื่อหารูปแบบโดยใช้หลักการแบบ Manual ทำได้ยากเพราะปริมาณข้อมูลมีความผันผวนตลอดเวลา
นอกจากนี้ 2V-Velocity ใน Big Data หมายถึง ความเร็วในการประมวลผลและวิเคราะห์ข้อมูลออกมาเพื่อให้ทันกับความต้องการของผู้ใช้งาน เนื่องจาก Big Data คือข้อมูลแบบ Real-Time เป็นส่วนใหญ่จึงทำให้จำเป็นที่จะต้องประมวลผลอยู่ตลอดเวลาทำให้มีความถี่ในการประมวลผล การบันทึกข้อมูล รวมไปถึงการเผยแพร่ข้อมูลที่มากกว่าแตกต่างจาก Small Data ที่ไม่สามารถทำได้
ข้อมูลมีหลากหลายประเภทและมาจากแหล่งที่มาต่างกัน (3V-Variety)
ข้อมูล Big Data จะต้องเป็นข้อมูลที่มาจากหลากหลายแหล่งที่มาและเป็นข้อมูลรวมทุกประเภท เช่น ข้อมูลรูปภาพ ตัวอักษร ตัวเลข เป็นต้น การประมวลผลรวมจะใช้ระบบหรือเครื่องมือ นอกจากนี้ข้อมูล Big Data ยังสามารถเป็นได้ทั้งข้อมูล Real-Time และข้อมูลในอดีต โดยแหล่งข้อมูลเหล่านั้นอาจมีทั้งข้อมูลออฟไลน์และออนไลน์ หรืออาจจะมาจากแหล่งข้อมูลเปิด (Open Data Source)
ข้อมูลที่ยังไม่ผ่านการประมวลผล (4V-Veracity)
อีกหนึ่งคุณลักษณะ Big Data คือ จะต้องเป็นข้อมูลที่ยังไม่ผ่านการประมวลผลอยู่ในรูปแบบของข้อมูลดิบ ซึ่งสามารถนำไปประมวลผลต่อไปได้ และเป็นข้อมูลที่มาจากหลากหลายแหล่ง ทำให้คุณภาพของข้อมูลสามารถนำไปวิเคราะห์ข้อมูลต่อไปได้อีก ซึ่งข้อมูลที่ได้มาเหล่านี้ยากที่จะควบคุมคุณภาพ รวมถึงการคัดกรองข้อมูล และความน่าเชื่อถือของข้อมูล จึงต้องนำข้อมูลเหล่านี้เข้าสู่กระบวนการทำ Data Cleansing
ข้อมูลที่แปรผันได้ (5V-Variability)
ข้อมูล Big Data ที่มีการเปลี่ยนเเปลงอย่างรวดเร็วได้ตลอดเวลาขึ้นอยู่กับการใช้งาน การจัดเก็บข้อมูล และเเหล่งข้อมูลที่เก็บมา เนื่องจากข้อมูลจำนวนมหาศาลเหล่านั้นมาจากหลายแหล่งข้อมูลที่แตกต่างกันและมีการอัปเดตแบบ Real-Time ทำให้รูปแบบของข้อมูลเปลี่ยนแปลงได้ตลอดเวลา
ข้อมูลที่มีมูลค่า (6V-Value)
มูลค่าของ Big Data มาจากการประมวลผลและวิเคราะห์ชุดข้อมูลขนาดใหญ่เพื่อให้ได้ข้อมูลเชิงลึกที่มีคุณค่า ซึ่งข้อมูลเชิงลึกเหล่านั้นมีประโยชน์ในการช่วยประกอบการตัดสินใจในด้านต่าง ๆ เชิงธุรกิจ นอกจากนี้มูลค่าของ Big Data ยังสามารถประเมินได้จากการพิจารณาคุณภาพของข้อมูล ซึ่งสามารถแสดงถึงความสามารถในการทำกำไรของข้อมูลที่ได้จากการประมวลผล
ประโยชน์ของการนำ Big Data มาใช้
การนำ Big Data มาใช้กับภาคธุรกิจโดยการนำข้อมูลเหล่านั้นมาวิเคราะห์ผ่านกระบวนการที่เรียกว่า Data Analysis เพื่อให้ได้ผลลัพธ์เป็นข้อมูลเชิงลึกออกมา มีประโยชน์กับธุรกิจเป็นอย่างมากเนื่องจากข้อมูลเชิงลึกเหล่านั้นจะเป็นส่วนช่วยในการวางแผนกลยุทธ์ทางธุรกิจให้เหนือกว่าคู่แข่ง และช่วยให้เข้าใจความต้องการของผู้บริโภคมากขึ้น และสามารถวิเคราะห์และพยากรณ์ความน่าจะเป็นของกลไกการตลาดในอนาคตได้อีกด้วย ช่วยให้การวางแผนธุรกิจในอนาคตมีประสิทธิภาพมากขึ้น เกิดความเสี่ยงต่ำ นอกจากนี้การนำ Big Data มาใช้ในองค์กรยังสามารถลดต้นทุนการใช้งบประมาณในด้าน IT ได้เป็นอย่างดี เนื่องจากสามารถนำข้อมูลที่ได้มาไปประยุกต์และต่อยอดใช้ประโยชน์ในด้านอื่น ๆ ได้อีก
Big Data เทคโนโลยีที่ช่วยให้การทำงานภายในองค์กรมีประสิทธิภาพด้วยข้อมูล
เนื่องจากประโยชน์ของ Big Data มีมากมายไม่ว่าจะเป็นการวางแผนระดับประเทศ การวางแผนธุรกิจในองค์กร การวางแผนด้านการศึกษา การวางแผนด้านการแพทย์ และในด้านอื่นๆ อีกหลากหลายด้าน ดังนั้นภายในองค์กรจึงต้องมีทุนเพื่อมาสนับสนุน รวมถึงยังต้องใช้บุคลากรที่มีความรู้ความสามารถด้าน IT เป็นอย่างมากในการจัดการข้อมูลเหล่านี้ ซึ่งในอนาคตเทคโนโลยี Big Data จะมีความสำคัญและมีส่วนเกี่ยวข้องในการใช้ชีวิตประจำวันเป็นอย่างมาก เนื่องจากข้อมูลที่มีอยู่ทั้งหมดจะสามารถนำไปวิเคราะห์และประมวลผลได้ด้วยกันทั้งสิ้น ดังนั้นสายงานที่เกี่ยวข้องกับ Big Data จึงมีแนวโน้มที่จะเติบโตได้มากขึ้น
Big Data เหมาะกับใคร?
Big Data ในปัจจุบันนั้นสำคัญเป็นอย่างมากในชีวิตประจำวันเนื่องจากพฤติกรรมของผู้บริโภคหรือกลุ่มเป้าหมายของธุรกิจในปัจจุบันนั้น ได้ใช้ชีวิตบนสื่อออนไลน์และโลกโซเชียลกันมากขึ้น การเสพสื่อ การเสพคอนเทนต์บนโลกออนไลน์ เรียกได้ว่าเป็นส่วนหนึ่งในชีวิตของคนยุคนี้ไปแล้ว ดังนั้น ถ้าหากมองข้ามการเข้าถึงข้อมูลส่วนนี้ก็มีโอกาสที่จะเสียเปรียบให้กับคู่เเข่งและเสียกลุ่มลูกค้าไปเป็นจำนวนมาก
ดังนั้น Big Data จึงเหมาะกับการใช้งานภายในธุรกิจใหญ่ที่ต้องการเข้าถึงข้อมูลความต้องการของกลุ่มลูกค้าได้มากที่สุด เนื่องจากหากมีข้อมูล Big Data เยอะมากเท่าไหร่ ก็จะยิ่งได้เปรียบคู่เเข่งทางการค้ามากเท่านั้น เพราะข้อมูล Big Data นั้นสามารถเป็นตัวช่วยในการเข้าถึงความต้องการของผู้บริโภคผ่านการวิเคราะห์ข้อมูลในด้านธุรกิจ, วิเคราะห์กลุ่มเป้าหมายเพื่อทำการตลาดให้ถูกจุด, ส่งผลให้ธุรกิจของเราเข้าใจผู้บริโภคมากขึ้นและยังช่วยลดระยะเวลาการดำเนินงานในเชิงกลยุทธ์ธุรกิจได้อย่างดี
Big Data มีกระบวนการในทำงานอย่างไร
การจะใช้ประโยชน์จาก Big Data ได้นั้น มีปัจจัยสำคัญ คือ ความเชื่อมโยงกันของข้อมูล หากข้อมูลที่รวบรวมมานั้นเมื่อนำมาวิเคราะห์ประมวลผลแล้วไม่สามารถหาจุดเชื่อมโยงกันได้ ข้อมูลเหล่านั้นก็ไร้ประโยชน์ การเก็บ Data ที่มีประสิทธิภาพจึงต้องคำนึงถึงความสัมพันธ์กันของข้อมูลเป็นหลัก และกระบวนการทำงานของ Big Data ประกอบไปด้วย 3 ขั้นตอนสำคัญดังต่อไปนี้
1.การรวบรวมข้อมูล Big Data ทำหน้าที่ในการรวบรวมข้อมูลที่หลากหลายและข้อมูลที่แตกต่างกันออกไปได้ในปริมาณมหาศาล โดย Big Data สามารถเก็บข้อมูลที่มีขนาดใหญ่และรวบรวมข้อมูลได้มากมายในรูปแบบของเทราไบต์ หรือบางครั้งอาจเก็บข้อมูลในระดับเพธาไบต์ ซึ่งเป็นความก้าวหน้าทางเทคโนโลยีและคอมพิวเตอร์สมัยใหม่ที่ช่วยให้เกืดการจัดเก็บข้อมูลที่ครอบคลุมมากยิ่งขึ้น
2.การจัดการข้อมูล Big Data คือ การจัดเก็บข้อมูลมากมายจากหลากหลายแหล่งที่มาและหลากหลายประเภท จึงต้องทำการจัดเก็บข้อมูลขนาดใหญ่ให้เป็นระเบียบเพื่อง่ายต่อการใช้งาน ในปัจจุบันนิยมจัดเก็บใน on premises หรือ cloud เป็นส่วนใหญ่ แต่ในบางกรณีอาจจะต้องจัดเก็บข้อมูลไว้ใกล้กับแหล่งข้อมูลที่มีความยืดหยุ่นสูงเพื่อง่ายต่อการนำไปประมวลผลในขั้นตอนต่อไป
3.การวิเคราะห์ข้อมูล Big Data คือ การสร้างฐานข้อมูลขนาดใหญ่ที่ต้องใช้เงินลงทุนที่สูง และข้อมูลปริมาณมหาศาลเหล่านั้นจะเกิดประโยชน์ ก็ต่อเมื่อ ข้อมูลเหล่านั้นถูกนำมาใช้วิเคราะห์และประมวลผล เพื่อทำให้เกิดความกระจ่างและชัดเจนของชุดข้อมูลที่มีอยู่ เพื่อนำข้อมูลเหล่านั้นมาหาข้อสรุปและแนวโน้มความน่าจะเป็นในอนาคต จากนั้นจึงนำไปพัฒนาและต่อยอดให้เกิดประโยชน์สูงสุดต่อองค์กร
สรุป Big Data ในความหมายของการนำมาประยุกต์ใช้ในบทเรียน Code Genius
Big Data เกิดขึ้นมาเพราะปริมาณข้อมูลที่เกิดใหม่ในแต่ละวันมีปริมาณมหาศาล หากต้องการนำมาใช้ให้เกิดประโยชน์ก็จำเป็นต้องรวบรวม จัดหมวดหมู่ หาความสัมพันธ์ ความเชื่อมโยง ซึ่งทั้งหมดที่กล่าวมาสามารถนำมาประยุกต์ใช้ในบทเรียน coding ได้ทั้งสิ้น ไม่ว่าจะเป็นเรื่องของการสร้างเงื่อนไขในการตรวจสอบการแก้ปัญหาต่าง ๆ เมื่อข้อมูลนำเข้าเป็นแบบนั้นแบบนี้ การมองหารูปแบบที่เกิดขึ้นซ้ำ ๆ ให้ออกเพื่อคิดวิธีการแก้ปัญหาสำหรับทุก ๆ เคสได้ รวมไปถึงการหาความเชื่อมโยงเพื่อสรุปบทเรียน และสร้างเส้นทางการแก้ไขปัญหาของตนเองได้อย่างยั่งยืน
คอร์สเรียนใน Code Genius ที่มีการประยุกต์ใช้เรื่อง Big Data
คอร์สเรียนที่มีการจับเอาเรื่อง Big Data มาประยุกต์ใช้แบบเต็ม ๆ คือ คอร์ส Data Analysis and Visualization เป็นเนื้อหาที่เกี่ยวกับการนำข้อมูลที่มีปริมาณมาก มามองหาแพตเทิร์น จุดเชื่อมโยง ประมวลผลด้วยวิธีทางสถิติโดยใช้เครื่องมือต่าง ๆ รวมไปถึง Python เพื่อให้น้อง ๆ ได้นำ Python มาต่อยอดในสิ่งที่เป็นจุดเด่นของ Python ได้ความรู้ความเข้าใจที่มากขึ้นเกี่ยวกับการจัดการกับข้อมูล อีกทั้งยังสามารถนำผลที่เกิดจากการประมวลผลมานำเสนอในรูปแบบของกราฟ หรือ Infographic ได้ นำไปสู่อาชีพใหม่ในยุคนี้ที่น่าสนใจมาก ๆ คือ นักวิทยาศาสตร์ข้อมูล ซึ่งเป็นที่ต้องการของตลาด