دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشکده تحصیلات تکمیلی
“M.Sc” پایان نامه برای دریافت درجه کارشناسی ارشد
مهندسی برق- الکترونیک
عنوان :
تشخیص حروف صدا دار از روی تصاویر لب

برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :
(ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل می باشد)
 
چکیده
از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین بشر ها از اهمیت بسیاری
برخوردار بوده می باشد. تاکنون تکنیکهای بازشناسی صحبت با بهره گیری از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بکار گرفته شدهاند. اما وجود نویز در بعضی شرایط، عامل اصلی بروز اشتباهات اساسی در تشخیص بوده
می باشد که در این گونه موردها بهره گیری از پردازش تصویر و به ویژه مطالعه شکل لبها و حرکت آنها میتواند ب رای
ارتقاء نتایج مورد بهره گیری قرار گیرد. فرآیند لبخوانی و به بیانی دیگر تشخیص دیداری گفتار دو مرحله اصلی
قابل مطالعه دارد. مرحله اول جداسازی ناحیه دهان و بطور کلی استخراج مشخصه های دیداری و مرحله دوم
دستهبندی و تشخیص کلمات میباشد. در این پروژه برای استخراج مشخصه های دیداری دو روش بهره گیری
و در روش دوم از روش مبتنی بر تبدیل موجک بهره جسته ایم . در SFCM نمودهایم. در روش اول از الگوریتم
مرحله بعد توسط پارامترهای تعریف شده، یکسری ویژگی مربوط به تصاویر لب را استخراج می نماییم . در انتها
توسط شبکه عصبی به دستهبندی ویژگیها و تشخیص واکهها میپردازیم.
مقدمه
کارایی ضعیف سیستمهای تشخیص صوت و سیستمهای تصدیق گوینده در محیطهای نویزی سبب گردید تا
محققان به فکر بهره گیری از اطلاعات دیداری در این سیستمها باشند به همین دلیل واکاوی تصاویر لب، توجه
زیادی را به خود جلب نمود. اولین گام در واکاوی تصاویر لب، استخراج 1 ناحیه مربوط به لب در تصاویر می باشد .
افزایش علاقه در استخراج این اطلاعات توسط بخشبندی تصاویر لب سبب به وجودآمدن روش های گوناگون و
بهبود عملکرد سیستمهای صوتی – تصویری در تشخیص صوت گردید . بزرگترین مشکل در سیستم ه ای
لبخوانی 2 توصیف کمی لب میباشد. معمولاً روشهای توصیف لب را به دو دسته، یکی روشهای سطح پایین
(روشهای مبتنی بر تصویر) و دیگری روشهای سطح بالا (روشهای مبتنی بر مدل) تقسیم مینمایند . دقت و
مقاوم بودن در این فرآیند، مهمترین کلید برای پردازشهای مراحل بعدی میباشد زیرا هر چه این مرحله با
دقت بیشتری انجام گردد و بخشبندی ناحیه لب در تصاویر بهتر صورت گیرد مدل کردن لب راحت تر خواهد
بود و با سهولت بیشتری میتوان ویژگیهای لب را استخراج نمود. گام بعدی بعد از استخراج ویژگی های لب،
دسته بندی و تشخیص ویژگی ها میباشد. در پروژه جاری ما نیز به مطالعه تک تک این مراحل و ارائه راهکار
برای بهبود این مراحل میپردازیم.
فصل اول
مروری بر روش ها
 مقدمه
از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین بشر ها از اهمیت بسیاری
برخوردار بوده می باشد. تاکنون تکنیکهای بازشناسی صحبت با بهره گیری از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بکار گرفته شدهاند. اما وجود نویز در بعضی شرایط عامل اصلی بروز اشتباهات اساسی در تشخیص
بوده می باشد که در این گونه موردها بهره گیری از پردازش تصویر و به ویژه مطالعه شکل لبها و حرکت آنها می تواند
برای ارتقاء نتایج مورد بهره گیری قرار گیرد. استخراج اطلاعات دیداری از تصاویر لب کمک شایانی به تشخیص
صوت و تصدیق گوینده بویژه در محیطهای نویزی را فراهم آورده می باشد به همین دلیل توجه زیادی را به خود
جلب نموده می باشد در این فصل یک مرورکلی بر روی روشهای انجام شده تا به حال صورت خواهیم داد و در
مورد دستهبندیهای موجود برای روشها صحبت خواهیم نمود.
1- مروری بر تحقیقات انجام شده
فرآیند لبخوانی و به بیانی دیگر تشخیص دیداری گفتار دو مرحله اصلی ق اب ل مطالعه دارد . مرحله اول
جداسازی ناحیه دهان و بطور کلی استخراج مشخصههای دیداری و مرحله دوم دستهبندی و تشخیص کلمات
میباشد. پس محققین زیادی نیز در سالهای متمادی و در مراحل مختلف تحقیقات خود به این دو مرحله توجه
داشته و به صورت مستقل و یا همزمان به مطالعه در زمینه استخراج مشخصه های دیداری و یا دسته بندی
کلمات پرداختهاند. در این فصل ما به مطالعه تحقیقات انجام شده در زمینه لبخوانی میپردازیم.
تعداد صفحات: 132
قیمت : 14700 تومان

این مطلب رو هم توصیه می کنم بخونین:   پایان نامه برق (مخابرات): تحلیل و شبیه سازی تقویت امواج عبوری از نانولوله های کربنی فلزی با بایاس DC

***

—-

دسته‌ها: مهندسی برق

دیدگاهتان را بنویسید