DEVELOPMENT SPEECH RECOGNITION TECHNIQUE USING DTW WITH LPC AND LSP

โดย เกรียงไกร เหลืองอำพล

ปี     2552

บทคัดย่อ
วิทยานิพนธ์ฉบับนี้นำเสนอการพัฒนาเทคนิคการรู้จำเสียงพูดด้วย Dynamic Time Warping (DTW) กับวิธีของการวิเคราะห์สัมประสิทธิ์การประมาณพันธะเชิงเส้น (Linear Predictive Coefficients :LPC) และ สัมประสิทธิ์แถบความถี่เส้นคู่ (Line Spectral Pairs Coefficients :LSP) เทคนิคการรู้จำเสียงพูดได้มีการวิจัยและพัฒนากันมาอย่างต่อเนื่องในงานวิจัยทางด้านการประมวลผลสัญญาณเสียง โดยมุ่งเน้นที่จะพัฒนาเทคนิคในการเรียนรู้จำเสียงพูดให้มีประสิทธิภาพมากยิ่งขึ้น ใน
งานวิจัยนี้ได้นำเสนอการใช้ประโยชน์ของเทคนิควิธี DTW กับ LPC และ LSP เพื่อพัฒนาระบบการรู้จำเสียงพูด

ในการทดลองตัวอย่างเสียงพูด บุคคลชาย 50 คน บุคคลหญิง 50 คน โดยแต่ละคนพูด คนละ 3 ครั้ง การบันทึกสัญญาณกระทำโดยพูดผ่านไมโครโฟน และบันทึกเสียงพูดในห้องทำงานปกติ ด้วยอัตราการสุ่มตัวอย่าง 8000 Hz เสียงพูดที่ใช้ทดลองได้แก่ เสียงพูดช่วงเวลา 2 พยางค์ 3 พยางค์ และ 4พยางค์

ผลการทดสอบได้ค่าความแม่นยำในการจำแนกอัตราการรู้จำเสียงพูดสูงสุด เท่ากับ 98%และความแม่นยำในการจำแนกอัตราการรู้จำเสียงพูดต่ำสุดคือ 38%

DOWNLOAD : DEVELOPMENT SPEECH RECOGNITION TECHNIQUE USING DTW WITH LPC AND LSP