โครงการวิจัยประจำปีงบประมาณ พ.ศ. 2556
เรื่อง: การศึกษาเชิงเปรียบเทียบประสิทธิภาพของเทคนิคการแยกพื้นหลังธรรมชาติโดยใช้ข้อมูลจากภาพหลายมุมมอง
(A Comparative Study on the Performance of the Natural Background Segmentation)
หัวหน้าโครงการวิจัย: รศ. ดร.นพพร โชติกกำธร
แหล่งทุนวิจัย: งบประมาณเงินรายได้คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
บทสรุป (Executive Summary)
เทคนิคการซ้อนภาพ(Image matting) เป็นวิธีการที่ใช้กันอย่างแพร่หลายในการถ่ายทำภาพยนตร์สื่อวีดีโอหรือโทรทัศน์ เพื่อปรับเปลี่ยนพื้นหลัง(Background) ที่ปรากฏในภาพที่ถ่ายทำในครั้งแรกด้วยพื้นหรือฉากหลังใหม่โดยไม่ให้กระทบกับภาพของผู้แสดงหรือวัตถุที่อยู่ด้านหน้า (Foreground) เช่น เพื่อลดค่าใช้จ่ายในการผลิต หรือเพื่อประกอบการสร้างเทคนิคพิเศษด้านภาพ (Visual/special effects) ที่ไม่สามารถหาสร้างหรือจำลองฉากหลังจริงขึ้นมาได้ เทคนิคที่ใช้แพร่หลายในปัจจุบันอาศัยการจัดฉากหลังที่มีสีตามที่กำหนด (เช่น สีน้ำเงินหรือสีเขียว)ประกอบกับการจัดแสงที่เหมาะสม จึงจะได้คุณภาพของภาพที่ต้องการ ทำให้ไม่สะดวกในการถ่ายทำนอกสถานที่ หรือการใช้งานโดยผู้ใช้ทั่วไป ที่ไม่มีอุปกรณ์และเวลาในการจัดองค์ประกอบที่เหมาะสมข้างต้น งานวิจัยนี้ เป็นการศึกษาเทคนิคการซ้อนภาพฉากหลัง โดยไม่ต้องอาศัยฉากหลังที่ออกแบบมาเป็นพิเศษสำหรับการซ้อนภาพ แต่สามารถแยกวัตถุที่อยู่บริเวณด้านหน้าของภาพออกจากวัตถุที่อยู่ด้านหลังใด ๆ ได้ (ซึ่งในงานวิจัยนี้เรียกว่าพื้นหลังที่ปรากฏตามธรรมชาติ หรือย่อ ๆ ว่า พื้นหลังธรรมชาติ)ทำให้สามารถประยุกต์ใช้เทคนิคการซ้อนภาพ กับภาพที่ถ่ายทำนอกสถานที่ ตลอดจนลดความยุ่งยากและเวลาในการจัดเตรียมฉากหลังที่เหมาะสมดังที่ปฏิบัติอยู่สำหรับเทคนิคที่ใช้งานกันโดยแพร่หลายในปัจจุบัน
เทคนิคการแยกพื้นหลังธรรมชาติ ได้ถูกพัฒนามากว่า 10 ปีแล้ว ปัญหาที่สำคัญของเทคนิคในกลุ่มดังกล่าว คือความจำเป็นที่ผู้ใช้จะต้องระบุบริเวณวัตถุที่อยู่ด้านหน้า กับบริเวณที่เป็นพื้นหลังในภาพอย่างคร่าว ๆ อีกทั้งประสิทธิภาพในการทำงานยังขึ้นกับลักษณะของพื้นหลังค่อนข้างมาก ในงานวิจัยนี้ ได้ทำการศึกษาความเป็นได้ในการปรับปรุงประสิทธิภาพของการแยกพื้นหลังธรรมชาติ โดยอาศัยข้อมูลการถ่ายภาพหลายมุมมอง เพื่อให้ได้มาซึ่งข้อมูลระยะลึกของวัตถุต่าง ๆ ในภาพ อันจะเป็นประโยชน์ต่อการแยกพื้นหลังธรรมชาติ ทั้งในแง่ที่ทำให้กระบวนการแยกพื้นหลังลดความจำเป็นที่ผู้ใช้จะต้องช่วยเหลือในการระบุตำแหน่งของพื้นหลังลงได้ และในแง่ที่ทำให้คุณภาพของการแยกพื้นหลังดีขึ้น เมื่อเปรียบเทียบกับวิธีการที่อาศัยข้อมูลภาพสีที่ได้จากกล้องถ่ายภาพปกติแต่เพียงอย่างเดียว ผลจากการศึกษาในงานวิจัยนี้ พบว่าข้อมูลระยะลึกที่ได้จากกล้องถ่ายภาพหลายมุมมอง เมื่อใช้ประกอบกับภาพถ่ายจากกล้องปกติ แล้วสามารถเพิ่มความถูกต้องในการแยกพื้นหลังได้ อย่างไรก็ดี ข้อมูลระยะลึกที่ได้โดยปกติจะไม่สมบูรณ์ กล่าวคือ บริเวณขอบวัตถุ ข้อมูลดังกล่าวมักจะขาดหายหรือไม่สามารถตรวจวัดได้แม่นยำ ทำให้จำเป็นต้องมีการประมาณค่าระยะลึกในจุดที่ข้อมูลขาดหายดังกล่าว เป็นเหตุให้ประสิทธิภาพการทำงาน โดยเฉพาะอย่างยิ่งความแม่นจำในการจำแนกส่วนภาพฉากหลังกับวัตถุบริเวณด้านหน้า ขาดความแม่นยำ แนวทางการพัฒนา คือการปรับปรุงประสิทธิภาพของการคำนวณข้อมูลระยะลึกที่ขาดหายไปดังกล่าวให้มีความแม่นยำสูงขึ้น
แม้ว่าการประยุกต์ใช้ผลจากงานวิจัยนี้ ยังไม่สามารถใช้งานแทนที่เทคนิคที่มีอยู่ในปัจจุบันที่ใช้ในงานการผลิตสื่อโทรทัศน์ ที่ต้องการความถูกต้องแม่นยำสูง หรือการทำงานในลักษณะของการออกอากาศสด (Live) ได้ เนื่องจากต้องการเวลาในการประมวลผลนาน ตลอดจนคุณภาพของข้อมูลระยะลึกที่ได้จากกล้องถ่ายภาพหลายมุมมองราคาถูกที่ใช้ในงานวิจัยนี้ ยังไม่เพียงพอกับการใช้งานในลักษณะดังกล่าว เทคนิคดังกล่าว เมื่อใช้ประกอบกับกล้องถ่ายภาพหลายมุมมองราคาถูกที่เริ่มมีการผลิตออกจำหน่ายในท้องตลาด น่าจะเป็นประโยชน์หรือเหมาะสมสำหรับการใช้งานที่ไม่ต้องการคุณภาพมากนัก เช่น การผลิตสื่อการสอน เพื่อการใช้งานในโรงเรียน หรือสถาบันการศึกษา หากได้มีการพัฒนาเป็นโปรแกรมสำเร็จรูปที่ใช้งานได้ง่าย
โครงการวิจัยประจำปีงบประมาณ พ.ศ. 2555
1. เรื่อง "อัลกอริทึมทางวิวัฒนาการกับการจัดกำหนดการของโครงการที่มีทรัพยากรจำกัด" (Evolutionary Algorithm for Solving the Resource Constrained Project Scheduling Problem)
หัวหน้าโครงการวิจัย: รศ. ดร.อาริต ธรรมโน
สนับสนุนการวิจัยด้วยเงินรายได้คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
บทสรุป (Executive Summary)
การบริหารงานโครงการ(Project Management) เป็นการประยุกต์ใช้ทักษะ องค์ความรู้ประสบการณ์ และทรัพยากรต่างๆ เพื่อดำเนินการให้เป็นไปตามความต้องการ การที่จะดำเนินงานโครงการให้สามารถบรรลุวัตถุประสงค์ที่ได้กำหนดไว้นั้น การเตรียมตารางการทำงานของโครงการ (Project Scheduling) เป็นปัจจัยหนึ่งที่สำคัญและหลีกเลี่ยงไม่ได้ ปัจจุบันจึงได้มีนักวิจัยจำนวนมากที่ให้ความสนใจและพยายามประยุกต์ศาสตร์ทางระบบคอมพิวเตอร์เข้ามาช่วยในการจัดทำตารางการทำงานของโครงการให้มีประสิทธิภาพมากยิ่งขี้น แต่อย่างไรก็ตามการจัดตารางการทำงานในสถานการณ์จริงนั้นมีข้อจำกัดอยู่มากมาย ยกตัวอย่างเช่น จำนวนทรัพยากรคนที่มีความชำนาญในแต่ละสาขามีอยู่อย่างจำกัด อีกทั้งยังมีเงื่อนไขในลำดับของกิจกรรม ซึ่งการที่จะทำกิจกรรมใดกิจกรรมหนึ่งได้นั้น จำเป็นที่จะต้องทำกิจกรรมก่อนหน้าให้เสร็จสิ้นก่อน เป็นต้น โดยงานวิจัยนี้เราจะให้ความสนใจกับการจัดตารางงานโครงการที่มีทรัพยากรจำกัด (Project scheduling under resource constraints) การจัดตารางงานโครงการที่มีทรัพยากรจำกัดเป็นปัญหาการจัดลำดับกิจกรรมในงานโครงการที่มีความซับซ้อน และมีเป้าหมายคือ จะทำการจัดลำดับกิจกรรมในงานโครงการอย่างไรให้ใช้ระยะเวลารวมในการดำเนินงานน้อยที่สุดและเนื่องจากในแต่ละงานโครงการจะประกอบไปด้วยกิจกรรมอยู่มากมาย ดังนั้นรูปแบบการจัดเรียงลำดับของกิจกรรมในงานโครงการจึงสามารถทำได้หลายรูปแบบ โดยแต่ละแบบก็ใช้ระยะเวลาในการดำเนินงานต่างกันแต่ทุกรูปแบบนั้นมีเงื่อนไขที่ต้องพิจารณาเหมือนกันคือ เงื่อนไขของลำดับกิจกรรมที่อยู่ก่อนและหลัง (Precedence Constraints) และจำนวนของทรัพยากรที่มีอยู่จำกัด (Limited Resource Constraints)
ในงานวิจัยนี้ได้ทำการศึกษาและนำหลักการทางปัญญาประดิษฐ์มาใช้แก้ปัญหา โดยจะใช้ Genetic Algorithm (ซึ่งเป็นอัลกอริทึมที่เลียนแบบวิวัฒนาการทางพันธุกรรมของมนุษย์) เป็นโครงสร้างหลักของงานวิจัย ซึ่งในขั้นตอนแรกจะใช้หลักการ Schedule Generation Schema (SGS) ซี่งเป็นหลักการจัดกิจกรรมโดยคำนึงถึงข้อจำกัดของการทำกิจกรรมก่อนหลัง มาใช้ในการจัดลำดับกิจกรรมในโครงการ จากนั้นจะประยุกต์ใช้ Negative Selection Approach (ซึ่งเป็นหลักการของระบบภูมิคุ้มกันของสัตว์มีกระดูกสันหลัง ที่จะทำหน้าที่ในการทำลายเซลล์ที่มีความจำเพาะกับโมเลกุลภายในร่างกายตัวเองทิ้งไป เพื่อที่จะป้องกันไม่ให้เกิดการทำลายเซลล์ในร่างกายของตัวเองและทำการสร้างเซลล์ชนิดเดิมนี้ขึ้นมาแทนที่) Simulated Annealing Algorithm (เป็นเทคนิคการค้นหาคำตอบแบบสุ่ม ซึ่งเลียนแบบกรรมวิธีการควบคุมอุณหภูมิของการอบโลหะให้อยู่ในสภาวะที่มีความเหมาะสมมากที่สุด) และ Tabu Search Algorithm (เป็นอัลกอริทึมการค้นหาเส้นทางแบบต้องห้าม เพื่อที่จะนำไปสู่คำตอบที่เหมาะสมได้เร็วขึ้น) ซึ่งการประยุกต์ผสมผสานหลักการเหล่านี้เข้าด้วยกันก็เพื่อที่จะทำการค้นหาลำดับเส้นทางของกิจกรรมในงานโครงการให้มีความเหมาะสมมากที่สุด สามารถนำมาจัดตารางการทำงานโครงการให้มีประสิทธิภาพและบรรลุวัตถุประสงค์ที่ได้กำหนดไว้ต่อไป
ผลการวัดประสิทธิภาพของงานวิจัยที่นำเสนอกับชุดข้อมูลมาตรฐานในเว็บไซต์ PSPLIB พบว่าผลลัพธ์ของงานวิจัยที่นำเสนอมีความคลาดเคลื่อนจากขอบเขตล่างของเส้นทางวิกฤตน้อยกว่างานวิจัยอื่นๆ ที่นำมาเปรียบเทียบ
2. เรื่อง "การศึกษาและวิเคราะห์ประสิทธิภาพและความปลอดภัยและพัฒนาการใช้งานฟังก์ชันทางเดียวหรือข้อผูกมัดแบบคลุมเครือที่รับความคลาดเคลื่อนได้เป็นค่า" (The Study and Analysis of The Efficiency and Security of The Fuzzy Commitment with Value-Oriented Deviation)
หัวหน้าโครงการวิจัย: ดร.นล เปรมัษเฐียร
สนับสนุนการวิจัยด้วยเงินรายได้คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
บทสรุป (Executive Summary)
การผูกมัดแบบคลุมเครือเป็นโปรโตคอลที่สร้างข้อผูกมัดขึ้นและในภายหลังจะยอมรับค่าข้อมูลเข้าที่มีความคลาดเคลื่อนเกิดได้ในระดับที่ไม่เกินจำนวนบิตที่กำหนดไว้ การผูกมัดแบบคลุมเครือที่สามารถตรวจสอบและแก้ไขความคลาดเคลื่อนตามค่าได้เป็นโปรโตคอลในลักษณะคล้ายกันแต่ความคลาดเคลื่อนที่อนุญาตให้มีได้นั้นเป็นคลามคลาดเคลื่อนของค่า ไม่ใช่ความคลาดเคลื่อนเป็นจำนวนบิตดังเช่นกรณีแรก วิธีการผูกมัดแบบคลุมเครือที่สามารถตรวจสอบและแก้ไขความคลาดเคลื่อนตามค่าได้ที่ศึกษาใช้วิธีการแปลงค่าตัวเลขเป็นเลขฐานหนึ่ง และแยกค่าตัวเลขออกเป็นส่วนๆ ที่สามารถนำมาประกอบกันกลับมาเหมือนเดิมด้วยวิธีทฤษฎีบทเศษเหลือแบบจีน ซึ่งการทำเช่นนี้หากไม่ต้องการให้เกิดความผิดพลาดเกิดขึ้นก็จะต้องลดโดเมนของค่าที่นำมาสร้างเป็นข้อผูกมัดลง หรือหากไม่ลดโดเมนลงก็จะต้องยอมให้มีความผิดพลาดเกิดขึ้นได้บ้าง โครงการวิจัยนี้ศึกษาผลของการเลือกใช้วิธีการผูกมัดแบบคลุมเครือที่สามารถตรวจสอบและแก้ไขความคลาดเคลื่อนตามค่าได้ในสองรูปแบบดังกล่าว โดยมีวัตถุประสงค์เพื่อศึกษาและวิเคราะห์ประสิทธิภาพและความปลอดภัยของการใช้งานวิธีการผูกมัดแบบคลุมเครือที่สามารถตรวจสอบและแก้ไขความคลาดเคลื่อนตามค่าได้ และค้นหารูปแบบการใช้งานวิธีการดังกล่าวที่เหมาะสมที่สุดสำหรับสถานการณ์ต่างๆ รวมทั้งการวิเคราะห์วิธีการเข้ารหัสเพื่อแก้ไขความคลาดเคลื่อนที่เหมาะสมต่อการประยุกต์ใช้วิธีการดังกล่าว
ผลการวิจัย: โครงการวิจัยได้ทำการทดลองเพื่อหาอัตราการลดลงของโดเมนของค่าที่เป็นไปได้ทั้งหมดของข้อผูกมัดในวิธีการใช้งานแบบแรก และพบว่าโดเมนจะมีขนาดลดลงเมื่อมีการอนุญาตให้มีข้อผิดพลาดได้มากขึ้น โดยการลดลงของโดเมนขึ้นกับปัจจัยต่าง ได้แก่ ขนาดของความลับ ขนาดของความผิดพลาดที่ยอมให้เกิดขึ้นได้ และจำนวนของการแบ่งตัวประกอบ ซึ่งผู้ที่จะนำไปใช้งานจะต้องเลือกปัจจัยต่างๆ ให้เหมาะสมกับข้อจำกัดของระบบที่จะนำไปใช้ สำหรับวิธีการใช้งานแบบที่สอง โครงการวิจัยได้ทำการทดลองเพื่อหาความผิดพลาดที่เกิดขึ้นจากการใช้งาน และพบว่าความผิดพลาดเกิดขึ้นจากปัจจัยต่างๆ เหมือนกับวิธีการแรก ได้แก่ ขนาดของความลับ ขนาดของความผิดพลาดที่ยอมให้เกิดขึ้นได้ และจำนวนของการแบ่งตัวประกอบ การเลือกใช้งานฟังก์ชันนี้ในแต่ละวิธีการต้องคำนึงถึงข้อจำกัดของระบบในแต่ละด้านที่เกี่ยวข้อง
ผลกระทบที่อาจเกิดขึ้น: ผู้ที่สนใจอาจนำผลของโครงการวิจัยนี้มาประยุกต์ใช้ในงานเชิงพาณิชย์หรือเชิงสาธารณะประโยชน์ ในลักษณะงานที่ต้องการการสร้างข้อผูกมัดแบบคลุมเครือ
โครงการวิจัยประจำปีงบประมาณ พ.ศ. 2554
1. “การกำหนดหัวข้อข่าว โดยใช้ค่า TFIDF และ Zipf’s Law ในการเรียนรู้แบบมีการสอน” (News Topic Identification using TFIDF and Zipf’s Law in Supervised Learning)
หัวหน้าโครงการวิจัย: ผู้ช่วยศาสตราจารย์ ดร. พรฤดี เนติโสภากุล
สนับสนุนการวิจัยด้วยเงินรายได้คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
บทสรุป (Executive Summary)
ด้วยจำนวนเว็บเอกสารที่มีปริมาณเพิ่มมากขึ้นอย่างรวดเร็ว ทำให้งานด้านการวิเคราะห์ความหมายของเว็บเอกสารจึงมีความยากเพิ่มมากขึ้นตามไปด้วย โดยเว็บเอกสารแต่ละประเภทก็มีเนื้อหารายละเอียดที่แตกต่างกันไป เช่น เอกสารการประเภทพยากรณ์อากาศ สิ่งที่ต้องการวิเคราะห์คือ เกิดสภาพอากาศอะไร ที่ไหน เมื่อไหร่ มีผลกระทบต่อใครบ้างและทำให้เกิดผลอะไร ส่วนเอกสารประเภทกีฬา สิ่งที่ต้องการวิเคราะห์คือ ใครแข่งกับใคร ผลการแข่งขันเป็นอย่างไร รายละเอียดของการแข่งขันเป็นอย่างไร และมีเหตุการณ์อะไรเกิดขึ้นบ้างในระหว่างการแข่งขัน การกำหนดหัวข้อให้กับเว็บเอกสารเป็นขั้นตอนที่สำคัญก่อนการวิเคราะห์ความหมายเอกสาร โดยเมื่อมีการระบุหัวข้อเว็บเอกสารแล้วก็จะทำให้ทราบว่าข้อมูลที่ต้องการวิเคราะห์คืออะไร ทำให้สามารถวิเคราะห์ความหมายได้สอดคล้องกับเนื้อความในเว็บเอกสาร
งานวิจัยนี้ต้องการศึกษาว่าปัจจัยใดบ้างที่ส่งผลกระทบต่อการกำหนดหัวข้อข่าวเอกสารออนไลน์ โดยศึกษาปัจจัยต่างๆ ต่อไปนี้ คือ (1) วิธีการคำนวณค่าน้ำหนักให้กับกลุ่มคำสำคัญ เพื่อใช้ในการกำหนดหัวข้อข่าว โดยได้ศึกษาเปรียบเทียบการคำนวณค่าน้ำหนักด้วยวิธี TFIDF,TFICF, Chi-square และ Information Gain (2) จำนวนคำที่กำหนดเป็นคำสำคัญ เพื่อใช้ในการเรียนรู้สำหรับกำหนดหัวข้อข่าว และ (3) จำนวนเอกสารที่ใช้ในการเรียนรู้ นอกจากนี้ มีการประยุกต์ใช้การวิเคราะห์ Zipf’s Law ร่วมกับเทคนิค TFIDF ในการกำหนดกลุ่มตัวแทนของหัวข้อ เปรียบเทียบกับเทคนิควิธีข้างต้น โดยในการเรียนรู้นั้นใช้โปรแกรม LIBSVM และได้ออกแบบการทดลองเพื่อเปรียบเทียบค่าความถูกต้องในการกำหนดหัวข้อข่าวให้กับเว็บเอกสาร ซึ่งประเภทเอกสารที่ใช้ในการทดลองได้แก่ กีฬา สภาพอากาศ ธุรกิจ การเมือง สุขภาพ และบันเทิง จำนวน 6,000 เอกสารแบ่งเป็นประเภทเอกสารละ 1,000 เอกสาร รวบรวมจากเว็บไซต์ข่าวออนไลน์
จากการทดลองพบว่า เมื่อให้ค่า Threshold มากกว่าหรือเท่ากับ 5 ค่าน้ำหนักที่คำนวณได้จากเทคนิค TFIDF ให้ค่าความถูกต้องในกำหนดหัวข้อข่าวมากที่สุด ตามมาด้วยด้วยเทคนิค Chi-Square, TFICF, และ Information Gain โดยค่าความถูกต้องเฉลี่ยในทุกชุดเอกสารทดสอบคือ 92.93%, 85.41%, 84.56%, และ 82.52% ตามลำดับ ส่วนผลกระทบของจำนวนของกลุ่มคำสำคัญที่ใช้ในการกำหนดหัวข้อข่าวเมื่อเพิ่มมากขึ้น ก็จะส่งผลให้ประสิทธิภาพความถูกต้องของการกำหนดหัวข้อข่าวมีเพิ่มมากขึ้นด้วยเช่นกัน โดยเมื่อเพิ่มจำนวนกลุ่มคำสำคัญครั้งละ 500 คำ พบว่าประสิทธิภาพเพิ่มขึ้นโดยเฉลี่ย 2.41% นอกจากนี้ เมื่อจำนวนเว็บเอกสารที่ใช้ในการเรียนรู้มากขึ้น จะทำให้ประสิทธิภาพความถูกต้องของการกำหนดหัวข้อข่าวมีมากขึ้นตามไปด้วย โดยเมื่อทดลองกับเอกสารชุดที่ 3 จำนวน 6,000 เอกสาร จะให้ค่าประสิทธิภาพสูงสุดเท่ากับ 93.05%
-------------------------------------------------------------------------------------------------------------------------------------------------------------
2. “การคัดแยกตัวอักษรลายมือเขียนภาษาล้านนาที่สัมผัสกัน” (Segmentation of Touching Lanna Characters)
หัวหน้าโครงการวิจัย: รองศาสตราจารย์ ดร. อาริต ธรรมโน
สนับสนุนการวิจัยด้วยเงินรายได้คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
บทสรุป (Executive Summary)
ภาษาล้านนาเป็นภาษาที่ใช้กันในอาณาจักรล้านนาในศตวรรษที่ 13-18 แต่หลังจากที่อาณาจักรล้านนาถูกยึดครองโดยอาณาจักรสยามในปี ค.ศ. 1774 ตัวอักษรล้านนาได้ถูกละเลยและถูกแทนที่ด้วยตัวอักษรไทยจนในปัจจุบันมีเพียง ไม่กี่คนเท่านั้นที่รู้วิธีอ่านและเขียนภาษานี้ จากการสืบค้นข้อมูลทางประวัติศาสตร์พบว่าคนล้านนาจะใช้ใบลาน พับสาหรือศิลาจารึกในการจารึกอักษรล้านนาเพื่อบันทึกเกี่ยวกับวิถีชีวิต ความเชื่อ กฏหมาย เรื่องเล่า สูตรยาสมุนไพร ประวัติศาสตร์ โหราศาสตร์ และความรู้ทั่วไปอื่นๆ เมื่อกาลเวลาผ่านไป เอกสารโบราณเหล่านี้ได้ผุพัง เสียหาย ถูกทำลาย หรือสูญหายไป ดังนั้นเพื่อที่จะอนุรักษ์ข้อมูลทางประวัติศาสตร์อันล้ำค่าที่เอกสารเหล่า นี้ได้บันทึกไว้ จึงควรมีการนำเอาระบบคอมพิวเตอร์มาใช้เพื่อแปลตัวอักษรเหล่านี้ให้เป็นตัว อักษรไทยที่ใช้กันในปัจจุบัน
จากการศึกษางานวิจัยต่างๆ ที่ผ่านมาพบว่าการที่จะรู้จำตัวอักษรให้ได้มีประสิทธิภาพที่ดีนั้น จะต้องมีการประมวลผลภาพเบื้องต้นที่ดีเสียก่อน ในการประมวลผลภาพเบื้องต้นจะทำการปรับปรุงคุณภาพของรูปภาพตัวอักษรให้ดีขึ้น และทำการตัดตัวอักษรให้เป็นตัวอักษรเดี่ยว ก่อนที่จะส่งเข้าสู่ขั้นตอนการดึงคุณสมบัติและขั้นตอนการเรียนรู้จำตัวอักษร ต่อไป ในการตัดตัวอักษรนั้นปัญหาแรกที่มักจะพบคือปัญหาตัวอักษรสัมผัสกันโดยเฉพาะ ตัวเขียน ตัวอักษรล้านนาก็พบปัญหานี้เช่นกัน ดังนั้นการที่จะทำให้การรู้จำตัวอักษรมีประสิทธิภาพที่ดีจึงจำเป็นที่จะต้อง แก้ไขปัญหาตัวอักษรติดกันเสียก่อน ในการศึกษาและการวิจัยในครั้งนี้ได้มุ่งเน้นการแยกตัวอักษรสัมผัสกันโดยได้ มีการนำเอาศาสตร์ทางด้านปัญญาประดิษฐ์มาทำการพัฒนาในการแยกตัวอักษรที่ สัมผัสกัน โดยขั้นตอนในการแยกตัวอักษรที่สัมผัสกันในงานวิจัยนี้เป็นดังต่อไปนี้
ขั้นแรกจะทำการแปลงภาพเอกสารอักษรล้านนาจากภาพสีให้อยู่ในภาพขาวดำ จากนั้นใช้ Bounding Box Analysis มาเป็นตัวช่วยในการตัดแยกตัวอักษรล้านนาจากเอกสารออกเป็นภาพของตัวอักษร เดี่ยวและตัวอักษรติดกัน จากนั้นใช้อัตราส่วนของตัวอักษรเดี่ยวมาเป็นเกณฑ์ในการแยกเอาตัวอักษรที่ติด กันออกมา จากนั้นนำเอาตัวอักษรที่ติดกันมาทำการหาโครงกระดูกของตัวอักษรและทำการหาจุด ปลายและจุดทางแยกของตัวอักษรและทำการแบ่งตัวอักษรที่ติดกันให้อยู่ในภาพย่อย เมื่อได้ภาพย่อยของตัวอักษรแล้วก็ทำการหาขนาดของกิ่งภาพย่อยที่จะนำไปสร้าง เวกเตอร์ โดยการสร้างเวกเตอร์หนึ่งหน่วยมายังเวกเตอร์อ้างอิง จากนั้นทำการหามุมของเส้นโครงกระดูกโดยการสร้างเวกเตอร์จากพิกเซลที่ติดกับ จุดแยกย้อนขึ้นไปเรื่อยๆ ตามลำดับ และจะทำการหยุดก็ต่อเมื่อมีมุมซ้ำกันสามครั้ง เมื่อได้ขนาดของกิ่งครบทุกภาพย่อยแล้วก็นำไปเข้าสู่สมการถดถอยเพื่อทำการ ปรับให้กิ่งของภาพย่อยๆ ให้อยู่ในรูปของเส้นตรงจากนั้นก็ทำการหามุมระหว่างเวกเตอร์ของกิ่งกับเวก เตอร์ของจุดแยกและนำมุมที่ได้มาเปรียบเทียบกันซึ่งตัวอักษรล้านนาที่เป็นตัว เดี่ยวกันจะมีขนาดของมุมเท่ากับหรือใกล้เคียงกันจากนั้นก็นำเอาภาพย่อยที่ ถูกแบ่งเข้ามาประกอบเป็นตัวอักษร ในการศึกษาวิจัยครั้งนี้ได้มีการนำเอาเอกสารล้านนาโบราณที่มีลักษณการเขียน ตัวอักษรที่แตกต่างกันอยู่จำนวน 6 รูปแบบมาเป็นข้อมูลในการทดลอง โดยจากการทดลองมีความถูกต้อง 73.5 เปอร์เซ็นต์
--------------------------------------------------------------------------------------------------------------------------------------------------------------