License plate recognition using optical character recognition with k-nearest neighbor algorithm and speech generating
โดย อนุรักษ์ พรหมโคตร
ปี 2561
บทคัดย่อ
ปัจจุบันการเพิ่มประสิทธิภาพระบบการรู้จำป้ายทะเบียนรถยนต์ได้รับความสนใจมากขึ้นเนื่องจากความสมดุลของแสง ภาพถ่ายที่เอียงและระยะในการถ่ายภาพยังคงเป็นสาเหตุหลักในการทำให้เกิดความผิดพลาด ดังนั้นวิทยานิพนธ์ฉบับนี้จึงนำเสนอการรู้จำตัวอักษรแผ่นป้ายทะเบียนด้วยเทคนิคการรู้จำตัวอักษรด้วยแสงร่วมกับเทคนิคการหาค่าที่ใกล้เคียงโดยแสดงผลเป็นเสียงพูดโดยมุ่งเน้นในการลดค่าความผิดพลาดและเพิ่มประสิทธิภาพของระบบ
ในการทดลองใช้ภาพถ่ายป้ายทะเบียนรถยนต์จำนวน 465 ภาพ ซึ่งมีมุมการถ่ายภาพแตกต่างกัน ทั้งหมด 7 มุม คือ -45°, -30°, -15°, 0°, 15°, 30°, 45° ตามลำดับ ในขั้นตอนการประมวลผลภาพแบ่งออกเป็น 3 ขั้นตอนดังนี้ ขั้นตอนแรกเป็นการค้นหาตำแหน่งแผ่นป้ายโดยใช้เทคนิคการแปลงภาพสัมพรรค เทคนิคมอร์โฟโลยี การค้นหาขอบภาพโซเบล และการวิเคราะห์ไบนารี่ ขั้นตอนต่อมาใช้เทคนิคการรู้จาตัวอักษรด้วยแสงร่วมกับเทคนิคการหาค่าที่ใกล้เคียงเพื่อการรู้จำตัวอักษรบนแผ่นป้าย ขั้นตอนสุดท้ายเป็นการเปรียบเทียบตัวอักษรแล้วแสดงผลเป็นเสียง
ผลการทดลองพบว่าโดยเฉลี่ยระบบสามารถให้ความถูกต้องในการค้นหาตำแหน่งแผ่นป้ายร้อยละ 93.12 การรู้จำตัวอักษรร้อยละ 90.10 และสามารถแสดงความถูกต้องของเสียงพูดโดยเฉลี่ยร้อยละ 90.10 ทั้งนี้การใช้เทคนิคข้างต้นสามารถเปลี่ยนแปลงค่าน้ำหนักและปรับปรุงแก้ไขคุณสมบัติของตัวอักษรที่ใช้ในการรู้จำได้ ส่งผลให้สามารถลดระยะเวลาในการคำนวณและลดพื้นที่ในการเก็บข้อมูลของแผ่นป้ายทะเบียนในหน่วยความจำ
Abstract
Researchers recently became more interested in license plate recognition systems. Factors such as different lighting conditions, various tilt angles, and varied distances were the main causes of system errors. This research aimed to present the license plate recognition system using Optical Character Recognition (OCR) program with K-Nearest Neighbor (K-NN) algorithm and speech generating program to reduce system errors and increase the efficiency of the system.
The license plate image of 465 pictures were included in the experiment taken in -45°, -30°, -15°, 0°, 15°, 30°, and 45° angles. The system consisted of three steps. First, the affine transformations, morphological operations, Sobel operators, and blob analysis were employed to locate the license plates. Then, The Optical Character Recognition program with K-Nearest Neighbor algorithm were used to recognize the characters in the images. Finally, the matching characters were converted into speech.
The research revealed that the system could yield an average of 93.12% accuracy for license plate identification, 90.10% accuracy for character recognition, and 90.10% accuracy for speech generating. The techniques used in this experiment changed the properties of the characters into editable data that could reduce computation time and memory storage of the license plate recognition system.