แน่นอนว่าในปัจจุบันเราไม่ได้เก็บ Log File เพื่อแค่ตอบโจทย์เพื่อป้องกันการ Hack เพียงเท่านั้น แต่เรายังต้องเก็บ Log File เพื่อตอบโจทย์การ Comply พ.ร.บ. คุ้มครองข้อมูลส่วนบุคคล (PDPA) และ พ.ร.บ. คอมพิวเตอร์ (TCCA)
ทำไมต้องจัดเก็บ Log
การที่หลาย ๆ องค์กรต้องจัดเก็บ Log ไม่ใช่เพียงเพราะต้องตอบโจทย์การเป็นบริษัทเลย “จึงต้องมี” เท่านั้น แต่ยังมีเหตุผลบางประการที่ทำให้คุณจำเป็นต้องมี
อย่างแรก ที่เราต้องจัดเก็บ Log เพราะว่ากฎหมายกำหนดไว้ว่าทางบริษัทต้องจัดเก็บ Log ซึ่งกฎหมายนั้นก็คือตัว พ.ร.บ. คอมพิวเตอร์ ซึ่งตัว พ.ร.บ. คอมพิวเตอร์ ออกมาตั้งแต่ปี 2550 จุดประสงค์ของ พ.ร.บ. คอมพิวเตอร์เพื่อที่ต้องการให้ความผิดในโลกดิจิทัลมาเป็นความผิดในโลกของความเป็นจริง ซึ่งหลังจากนั้น ก็มีพัฒนาการของพ.ร.บ. คอมพิวเตอร์มาเรื่อย ๆ ปัจจุบันก็จะเป็นตัวประกาศกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม เรื่องหลักเกณฑ์การจัดเก็บ Log ในเดือนสิงหาคม ปี 2564 อันนี้ก็เป็นเหตุผลหนึ่งที่มีว่าทำไมเราถึงต้องจัดเก็บ Log อีกเหตุผลหนึ่งก็คือเราต้องมีหลักฐานว่าเกิดเหตุการณ์อะไรขึ้นบ้างในโลก Digital ถ้าเป็นในโลกของความเป็นจริง เราจะใช้กล้องวงจรปิดบันทึกภาพเพื่อเป็นหลักฐานในโลกของความจริงแต่ในโลกของดิจิทัล หลักฐานเดียวที่มีนั่นก็คือตัว Log นั่นเอง อันนี้ก็เป็นอีกสาเหตุว่าทำไมเราถึงต้องเก็บ Log
ต่อมา เรามาดูกันว่าจากที่ตัว พ.ร.บ. คอมพิวเตอร์บอกว่าเราจะเราจะต้องจัดเก็บ log เราจะมาดูว่าแล้วเราจะต้องจะจัดเก็บ log อะไรบ้าง ซึ่งจากวัตถุประสงค์ที่บอกว่าเราจะต้องจัดเก็บ log เราจะต้องจัดเก็บ Log เพื่อระบุตัวตนการใช้งานอินเทอร์เน็ตขององค์กรได้ ซึ่งอุปกรณ์ที่ต้องจัดเก็บ มันก็จะเป็นอุปกรณ์ที่สามารถเห็น traffic การใช้งานอินเตอร์เน็ต ยกอย่างเช่น Firewall , ระบบที่ใช้สำหรับระบุตัวตน เช่น Windows AD , Web server Email server ,Web proxy สุดท้ายจะเป็นตัว File sharing และจากตัวประกาศฉบับล่าสุด ยังมีสิ่งที่เพิ่มเติมขึ้นมาจากตัวประกาศ 2550 นั่นก็คือ
- เพิ่มผู้ให้บริการที่จะต้องจัดเก็บ Log
- เพิ่มอุปกรณ์ที่จัดเก็บ Log ตามประเภทของผู้ให้บริการ เช่น ผู้ให้บริการในกลุ่ม Digital Service provider ก็จะต้องเก็บ log ของ application ที่เราให้บริการลูกค้า (end user) อีกด้วย
จากที่กล่าวมาข้างต้น ทำให้สิ่งที่จะตามมานั่นก็คือตัวปริมาณ Log ที่จะมากขึ้นอย่างมหาศาลนั่นเอง นอกเหนือจากปริมาณ Log ที่มากขึ้นแล้ว ก็ยังมีความท้าทายอื่น ๆ ที่เราจะต้องเจอมากขึ้นจนทำให้ปัจจุบันความท้าทายของการจัดเก็บ Log ไม่ใช่ความท้าทายในระดับการจัดเก็บ Log ทั่วไปแล้ว มันจะจัดอยู่ในความท้าทายที่เราเรียกว่า Big Data หรือเรียกว่า 4V of Big Data นั่นเอง
4V of Big Data
คราวนี้เราจะมาดูกันว่า 4V of Big Data มีอะไรบ้าง แล้วส่งผลกระทบอะไรกับเราบ้าง

- Volume : คือ ปริมาณของข้อมูล อย่างที่บอกว่าแต่ก่อนเราเก็บ Log แค่ 6 ประเภท แต่ปัจจุบันเราไม่ได้จัดเก็บแค่ 6 อุปกรณ์ ยังมี Log อื่นที่เราต้องจัดเก็บเพิ่ม ยกตัวอย่างเช่น Cloud Service หรือถ้าใครที่อยู่ในกลุ่มของ Digital Service Provider เนี่ยก็จำเป็นต้องจัดเก็บหรอกตัวแอปพลิเคชันของตัวเองที่ให้บริการกับลูกค้าเพิ่มด้วย ทำให้ปริมาณ Log เพิ่มขึ้นอย่างมหาศาล สมัยก่อนอาจจะประมาณ 5 GB/Day แต่ปัจจุบันอาจจะเพิ่มเป็นสิบเท่าเป็น 50 GB/Day ก็เป็นไปได้ อันนี้คือเป็นความท้าทายแรกในเรื่องของ Volume
- Velocity : หมายถึง ความรวดเร็ว ซึ่งไม่ใช่หมายถึงแต่ความรวดเร็วในด้านของปริมาณข้อมูลที่มันเพิ่มขึ้นอย่างรวดเร็วอย่างเดียว ยังรวมถึงความรวดเร็วในการนำข้อมูลมาใช้งานถ้าเกิดเราไม่สามารถนำข้อมูลมาใช้ได้อย่างรวดเร็วมันก็อาจจะทำให้เราไม่สามารถวิเคราะห์เหตุการณ์ที่มันเกิดขึ้นในปัจจุบันได้ทันท่วงที อาจจะส่งผลกระทบต่อธุรกิจของเราได้ อันนี้ก็เป็นอีกความท้าทายหนึ่งว่าเราจะทำยังไงให้เราสามารถนำ Log ที่เราเก็บอยู่ในปริมาณที่มันมหาศาลมาใช้งานได้เร็วที่สุด
- Variety : หมายถึง ความหลากหลาย ความหลากหลายในที่นี้นั้นก็คือความหลากหลายของอุปกรณ์ที่มันเพิ่มมากขึ้น จากที่ผมกล่าวมาก็คือสมัยก่อนเก็บแค่หกประเภท ปัจจุบันมีอุปกรณ์ที่จะต้องจัดเก็บมากขึ้น ซึ่งนอกเหนือจากอุปกรณ์ที่จัดเก็บมากขึ้น ปัจจุบันหลายองค์กรก็เริ่มเปลี่ยนตัวเองเป็น Cloud Transformation มีการนำ Cloud Service เข้ามาใช้งานในบริษัทมากขึ้น ทำให้เกิดเป็นความท้าทายหนึ่งว่า เมื่ออุปกรณ์มีความหลากหลายมากขึ้น เราจะสามารถจัดเก็บ Log จากอุปกรณ์นั้นได้หรือไม่
- Veracity : แปลว่า ความน่าเชื่อถือ เมื่อเราสามารถที่จะจัดเก็บ Log ที่มีความหลากหลายได้แล้วในส่วน หรืออีกความหมายหนึ่งก็คือคุณภาพ สิ่งที่เราต้องเจอก็คือจาก Log ที่เรามีจัดเก็บ้มากมาย เราสามารถนำ Log นั้นมาใช้ประโยชน์ให้กับองค์กรเราได้หรือไม่ อันนี้คือจะเป็นอีกความท้าทายนึงที่เราต้องเจอ
วิธีแก้ปัญหา Log 4V

คราวนี้เราจะมาดูว่า เราจะสามารถแก้ปัญหาหรือแก้โจทย์ความท้าทายแต่ละด้านของ Big Data ได้ยังไงบ้าง
- Volume : การที่จะปัญหา Volume ของ Log ควรสังเกตว่าตัว Solution การจัดเก็บ Log ขององค์กรคุณมีความสามารถในการ Scale มากน้อยขนาดไหน ที่สำคัญ Log ของเรา ไม่ใช่แค่สามารถ Scale ในด้าน storage อย่างเดียว จะต้องสามารถ Scale ในด้านของ Retention ด้วย ถ้าไปลองมองดูในตัวประกาศเพิ่มเติมจะมีบอกไว้เลยว่า เจ้าหน้าที่สามารถร้องขอให้เราจัดเก็บ Log มากกว่าเก้าสิบวันได้ แต่ไม่เกินสองปี ทำให้ถ้าระบบเก็บ Log ของเราไม่สามารถเพิ่มระยะเวลาการจัดเก็บได้ก็ จะไม่สามารถที่จะแก้โจทย์ตัว Volume นี้ได้
- Velocity : สิ่งที่เราต้องมีนั้นก็คือความรวดเร็วทั้งในด้านของอาการนำ Log ไปใช้ ถ้าเกิดว่าเรามีเหตุการณ์ผิดปกติเกิดขึ้นกับองค์กรเราต้องมีวิธีที่สามารถเข้าถึง Log หรือนำ Log มาอะไรให้เร็วที่สุด ซึ่งสิ่งนี้สามารถแก้ได้ด้วยการมีระบบ Parsing ซึ่งก็คือการทำให้ Log อยู่ในรูปแบบที่สามารถค้นหาข้อมูลได้ง่ายขึ้นนั่นเอง
- Variety : ตัว Log Solution ของเราต้องสามารถรับ Log ได้หลายรูปแบบ เช่น Syslog, UDP, TCP, CSV หรือ Log File เป็นต้น
- Veracity : การนำ Log ไปใช้ให้เกิดประโยชน์สูงสุดควรมี Dashboard สำหรับดูข้อมูล Log ที่เกิดขึ้น ซึ่งแน่นอนว่าปัจจุบันการมี Dashboard อย่างเดียวไม่เพียงพออีกต่อไป แต่ควรมีแพลตฟอร์มที่สามารถ Customize หรือ Filter เพื่อค้นหาข้อมูลที่เฉพาะเจาะจงได้
จากที่กล่าวมาทั้งหมดเราก็จะได้รู้แล้วว่าทำไมเราถึงที่จะต้องจัดเก็บ Log หนึ่งก็เพราะว่ากฎหมายกำหนด นอกเหนือจากนั้น เมื่อเราจะเก็บ Log แล้ว ปัจจุบัน การจัดเก็บ Log ของเราไม่ได้เป็นแค่ Data ทั่วไป แต่เริ่มเข้าสู่คำว่า Big Data ซึ่งก็จะตามมาด้วยความท้าทายระดับของ Big data หรือที่เรียกว่า 4V of Big Data ได้แก่ Volume, Velocity, Variety, Veracity ถือเป็นความท้าทายที่เราจะต้องเจอในการจัดเก็บ Log ในปัจจุบัน
แต่ถ้าคุณมีปัญหา 4V ที่คิดว่ายากเกินไปในการจัดการ หรือยังคงต้องการผู้ช่วยในการจัดเก็บ Log ในรูปแบบ On Cloud ด้วย iLog แพลตฟอร์ม Data Visualization ที่ปรับแต่ง Dashboard ได้ตามความต้องการ ก็สามารถติดต่อเราได้ที่ http://ilog.ai/contact/
หรือศึกษาความรู้เพิ่มเติมจากเราในแพลตฟอร์มอื่นที่
Facebook : https://www.facebook.com/ILog-Log-Management-on-Cloud-100374965807670
Youtube : https://www.youtube.com/user/mindterra