غنی سازی سیگنال گفتار مبتنی بر روش تفریق طیفی و تجزیه مقادیر منفرد

استاد راهنما:

دکتر محمدرضا کرمی

اساتید مشاور:

دکتر رضا قادری

دکتر حسین میارنعیمی

تکه هایی از متن به عنوان نمونه :

چکیده
در این پایان‌نامه آغاز به مطالعه اختصار ای از چگونگی تولید گفتار در بشر پرداخته و سپس به مطالعه اجمالی روش های عمده بهسازی گفتار و مسائل و موضوعات موجود در این روش ها پرداخته شده می باشد. در مطالعه این روش ها کوشش شده می باشد تا ضمن اظهار اصول و مبانی هر روش، نقاط اشکال و قوت آنها را ذکر گردد. سپس در فصل دوم، روش معروف تفریق طیفی معرفی و مطالعه شده می باشد. در این فصل همچنین به روش های بهینه شده تفریق طیفی مثل تفریق طیفی تعمیم یافته، اصلاح مقادیر منفی، تفریق طیفی چند بانده و … پرداخته شده می باشد. در روش های مبتنی بر تفریق طیفی، روش پایه تفریق طیفی، تفریق طیفی تعمیم یافته، تفریق طیفی چند باند، پیاده­سازی و تحلیل و ارزیابی شدند. از معضلات عمده در روش های مبتنی بر تفریق طیفی تولید نویز موزیکال می باشد که کوشش گردید تا اندازه تولید نویز موزیکال در روش بهبودیافته تفریق طیفی چند باند، کاهش یابد.
در فصل سوم به معرفی تجزیه مقادیر منفرد پرداخته می گردد و تبیین کاملی در زمینه ریاضیات تجزیه مقادیر منفرد و خواص و قضایای مربوط به این تجزیه آورده شده می باشد. همچنین روش های بدست آوردن مقادیر منفرد و بردارهای ویژه در این فصل تبیین داده شده می باشد. سپس مروری بر کاربردهای این تجزیه به خصوص در پردازش سیگنال آورده شده می باشد. در انتهای فصل نیز روش های تشخیص نواحی سکوت یا الگوریتم های VAD اظهار شده می باشد.
در فصل چهارم، روش های پیشنهادی بهسازی گفتار بر اساس روش تفریق طیفی و تجزیه مقادیر منفرد ارایه شده اند. در این فصل آغاز طریقه محاسبه نویز تخمینی با بهره گیری از تجزیه مقادیر منفرد تبیین داده شده می باشد و سپس روش بهینه کردن نویز تخمینی با بهره گیری از الگوریتم های VAD و عیان ساز حروف بی صدا و صدا دار اظهار شده می باشد. در تمامی روش های پیشنهادی حذف نویز مبتنی بر تفریق طیفی از تجزیه مقادیر منفرد به مقصود تخمین نویز بهره گیری شده می باشد. در روش های پیشنهادی کوشش بر آن بوده می باشد که حالت بهینه را با تغییر پارامتر ها بدست آوریم. در فصل پنجم نتایج حاصله از شبیه سازی روش های پیشنهادی آورده شده و با کارهای قبلی مقایسه و ارزیابی می شوند. در پایان، در فصل ششم به جمع بندی مطالب و موضوعات مورد بحث پرداخته شده می باشد.

واژه های کلیدی:
غنی سازی سیگنال گفتار، تفریق طیفی، تجزیه مقادیر منفرد، عیان ساز گفتار ، تبدیل موجک، طیف نگاره (اسپکتروگرام)، تست شنوائی.
فهرست مطالب
عنوان    صفحه
مقدمه    1
فصل اول- مروری بر روش های عمده بهسازی گفتار
1-1-    مبانی تولید سیگنال گفتار……………………………………………………………………………..    3
1-2-    مفاهیم بهسازی گفتار…………………………………………………………………………………..    7
1-3-    کاربردهای عمده بهسازی گفتار…………………………………………………………………….    8
1-4-    طبقه بندی روش های بهسازی گفتار……………………………………………………………..    9
1-4-1-   کاهش نویز با بهره گیری از خاصیت تناوبی گفتار……………………………………………..    11
1-4-2-   بهسازی گفتار بر اساس مدل………………………… ………………………………………….    12
1-4-3-   تکنیک های مبتنی بر دامنه طیفی زمان-کوتاه……………………………………………….    13
1-4-4-   روش های مبتنی بر آستانه گذاری روی ضرایب موجک……………………………….    15
1-4-5-   حذف وفقی نویز……………………………………………………………………………………..    16
فصل دوم- مروری بر روش های تفریق طیفی
2-1-    تفریق طیفی……………………………………………………………………………………………….    19
تعمیم روش های تفریق طیفی………………………………………………………………………    21
مقادیر طیفی منفی……………………………………………………………………………………….    23
اطلاحات روی تفریق طیفی………………………………………………………………………….    24
2-4-1-    متوسط گیری اندازه…………………………………………………………………………………    24
2-4-2-    تعمیم تفریق طیفی…………………………………………………………………………………..    25
2-4-3-    تفریق طیفی با بهره گیری از کف طیفی و تفریق بیش از حد……………………………..    25
2-4-4-    تفریق طیفی با تخمین گر MMSE STSA………………………………………………….    27
2-4-5-    تفریق طیفی بر مبنای ویژگی های ادراکی…………………………………………………..    28
2-4-6-    روش های تفریق طیفی وابسته به فرکانس………………………………………………….    29
2-4-7-    تفریق طیفی چند باند………………………………………………………………………………    30
2-4-7-1-    پیش پردازش……………………………………………………………………………………..    32
2-4-7-2-    تبیین تفریق طیفی چند باند…………………………………………………………………..    34
فصل سوم- آشنائی با تجزیه مقادیر منفرد و الگوریتم های VAD
3-1-    تجزیه مقادیر منفرد……………………………………………………………………………………..    38
ارتباط بین تجزیه مقادیر منفرد و تجزیه مقادیر ویژه………………………………………….    39
مقادیر ویژه و بردارهای ویژه………………………………………………………………………..    40
3-3-1-    روش یافتن مقادیر ویژه……………………………………………. ……………………………    40
3-3-2-    مقادیر ویژه مختلط………………………………………………………………………………….    42
3-3-3-    مقادیر ویژه ماتریس های مثلثی و قطری…………………………………………………….    43
3-3-4-    مقادیر ویژه ماتریس های هم خانواده با A ………………………………………………..    44
3-3-5-    ارتباط بین مقادیر ویژه ماتریس های AB و BA…………………………………………    45
3-3-6-    تعیین چند جمله ای مشخصه یک ماتریس…………………………………………………    47
3-3-6-1-    روش کریلف    …………………………………………………………………………………    47
3-3-6-2-    روش لورییر……………………………………………………………………………………….    49
3-3-6-3-    روش ضرایب نامعین…………………………………………………………………………..    50
3-3-7-    روش های تبدیلی در یافتن مقادیر ویژه……………………………………………………..    52
3-3-7-1-    روش ژاکوبی……………………………………………………………………………………..    52
3-3-7-2-    روش گیونز………………………………………………………………………………………..    54
3-3-7-3-    روش هاوس هلدر………………………………………………………………………………    55
3-3-8-    روش های مبتنی بر تجزیه ماتریس برای یافتن مقادیر ویژه…………………………..    57
3-3-8-1-    روش LR برای یافتن مقادیر ویژه………………………………………………………..    57
3-3-8-2-    روش QR برای یافتن مقادیر ویژه………………………………………………………..    60
کاربرد های تجزیه مقادیر منفرد…………………………………………………………………….    62
3-4-1-    کاربرد تجزیه مقادیر منفرد در پردازش سیگنال……………………………………………    63
الگوریتم های تشخیص نواحی سکوت و صدادار و بی صدا…………………………….    64
3-5-1-    تشخیص قسمت های سکوت با بهره گیری از قدرمطلق اندازه…………………………..    65
3-5-2-    روش نرخ عبور از صفر…………………………………………………………………………..    66
3-5-3-    روش های حوزه ی فرکانس…………………………………………………………………….    67
3-5-4-    روش کدینگ پیشگویی خطی(LPC)………………………………………………………..    68
3-5-5-    بهره گیری از تبدیل بسته موجک باز در تشخیص فریم های سکوت………………….    70
فصل چهارم- بهره گیری از تجزیه مقادیر منفرد در روش تفریق طیفی
4-1-    بهره گیری از تجزیه مقادیر منفرد در روش تفریق طیفی (روش SVSS)………………..    74
4-1-1-    قسمت تخمین نویز…………………………………………………………………………………    75
4-1-2-    فیلتر کردن مقادیر منفرد……………………………………………………………………………    76
4-1-2-1-    تعیین آستانه در فریم سکوت………………………………………………………………..     80
4-1-2-2-    تعیین آستانه در فریم بی صدا و صدا دار………………………………………………..     80
4-1-3-    قسمت تفریق طیفی…………………………………………………………………………………    85
تفریق طیفی با بهره گیری از SVD و الگوریتم های VADو V/UV detector…..    85
تفریق طیفی چند بانده با بهره گیری از SVD و الگوریتم هایVADوV/UV detector (SVMBSS)……………………………………………………………………………………    86
فصل پنجم- نتایج پیاده سازی و ارزیابی
5-1-    معیار های سنجش………………………………………………………………………………………    89
5-1-1-    نسبت سیگنال به نویز………………………………………………………………………………    89
5-1-2-    اسپکتروگرام (طیف نگاره)……………………………………………………………………….    89
5-1-2-1-    طراحی اسپکتروگرام……………………………………………………………………………     92
5-1-2-2-    چگونگی توزیع مقادیر در اسپکتروگرام……………………………………………………….     95
5-1-3-    تست شنوائی………………………………………………………………………………………….    97
مطالعه و مقایسه نتایج حاصله………………………………………………………………………    97
5-2-1-    تست شنوائی………………………………………………………………………………………….    104
فصل ششم- جمع­بندی و نتیجه­گیری
6-1-    جمع­بندی و نتیجه­گیری ……………………………………………………………………………..    108
فهرست جداول
عنوان    صفحه
جدول 1-1- تکنیک های مختلف غنی سازی گفتار……………………………………………………………    10
جدول 4-1- مقادیر بهینه درصد انرژی  ………………………………………………………………………..    83
جدول 5-1- نتایج غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط روش های PSS، ‍SVPSS، MBSS  وSVMBSS …………………………………………………………………………..
103
جدول 5-2- نمره کیفیت شنیدن نویز……………………………………………………………………………….    105
جدول 5-3- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
107
فهرست اشکال
عنوان    صفحه
شکل 1-1- برش عرضی سیستم صوتی بشر……………………………………………………………………    4
شکل 1-2- مدل زمان گسسته عمومی برای تولید سیگنال گفتار…………………………………………..    5
شکل 1-3- حرف بی صدا s……………………………………………………………………………………………    6
شکل 1-4- حروف صدادار e………………………………………………………………………………………….    6
شکل 1-5- تبدیل فوریه حرف بی صدای s………………………………………………………………………    6
شکل 1-6- تبدیل فوریه حرف صدا دار e…………………………………………………………………………    7
شکل 1-7- بلوک دیاگرام یک سیستم بهسازی مبتنی بر خاصیت تناوبی گفتار………………………..    11
شکل 1-8- بلوک دیاگرام یک سیستم غنی ساز مبتنی بر دامنه طیفی زمان – کوتاه…………………..    13
شکل 1-9- بلوک دیاگرام الگوریتم حذف نویز در حوزه موجک………………………………………….    15
شکل 1-10- دیاگرام کلی سیستم حذف کننده وفقی نویز……………………………………………………    17
شکل 2-1- بلوک دیاگرام تفریق طیفی توان (PSS)……………………………………………………………    23
شکل 2-2- بلوک دیاگرام تفریق طیفی تعمیم یافته (GSS)………………………………………………….    23
شکل 2-3- نمودار تعیین   از روی SNR (با فرض  )…………………………………………    26
شکل 2-4- SNR های مقطعی برای 4 باند فرکانسی گفتار نویزی………………………………………..    32
شکل 3-1- نمودار اندازه یک سیگنال صوتی بر حسب زمان……………………………………………….    66
شکل 3-2- بلوک دیاگرام واکاوی کپسترال……………………………………………………………………………    68
شکل 3-3- اندازه خطای خروجی فیلتر معکوسLPC  به ازای حروف صدا دار و بی صدا……..    69
شکل 3-4- مرز تصمیم برای جداسازی قسمت های صدادار سیگنال……………………………………    72
شکل 4-1- بلوک دیاگرام کلی روش ارائه شده  SVD-Spectral Subtraction (SVSS)…….    75
شکل 4-2- فریم بی صدا در حوزه زمان……………………………………………………………………………    77
شکل 4-3- فریم صدا دار در حوزه زمان…………………………………………………………………………..    78
شکل 4-4- خود همبستگی در فریم سکوت آغشته به  نویز………………………………………………..    78
شکل 4-5- خود همبستگی در فریم بی صدا……………………………………………………………………..    79
شکل 4-6- خود همبستگی در فریم صدا دار…………………………………………………………………….    79
شکل 4-7- مقایسه مقادیر منفرد فریم های بی صدا و صدا دار ……………………………………………    79
شکل 4-8- مقادیر منفرد فریم سکوت نویزی…………………………………………………………………….    81
شکل 4-9- مقادیر منفرد فریم صدا دار  (الف) تمیز   (ب) نویزی با  SNR=10 db……………..    82
شکل 4-10- مقادیر منفرد فریم بی صدا  (الف) تمیز   (ب) نویزی با SNR=10 db……………..    82
شکل 4-11- بلوک دیاگرام روش بدست آوردن مقادیر بهینه آستانه………………………………………    83
شکل 5-1- هیستوگرام مقادیر فرکانسی…………………………………………………………………………….    96
شکل 5-2- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    99
شکل 5-3- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    100
شکل 5-4- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    101
شکل 5-5- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    102
شکل 5-6- متوسط غنی سازی ده سیگنال گفتار مختلف آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………………..
104
شکل 5-7- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
106
مقدمه:
با رشد روز افزون بهره گیری از سیستم های گفتاری در کاربردهای عملی روزمره، نیاز به حفظ کیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح شده می باشد. شرایط ایده آل و عاری از نویز که در کارها و شبیه سازی های آزمایشگاهی در نظر گرفته می گردد، در بسیاری از کاربردهای واقعی به گونه جدی نقض گردیده و برقراری آنها زیر سئوال رفته می باشد. به عنوان مثال بهره گیری از تلفن همراه، سمعک، سیستم بازشناسی گفتار و یا هر وسیله ارتباط گفتاری در یک محیط نویزی ، همگی از مورد هایی می باشد که در آن حفظ کیفیت گفتار و بالا نگه داشتن کارایی سیستم، از اهمیت خاصی برخوردار می باشد. بدون بهره گیری از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا که غیر قابل قبول می گردد. از این رو، مبحث بهسازی گفتار به عنوان یکی از ضرورت های کاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده می باشد.
فرضیات پایان نامه:
کلیه روش های تبیین داده شده در پایان‌نامه و نیز کلیه روابط حاکم بر آنها، برمبنای سه فرض اساسی ذیل استوار می‌باشند.
–    نویز به سیگنال اضافه می گردد.
–    فقط یک کانال در دسترس می باشد.
–    سیگنال گفتار و نویز ناهمبسته هستند.
به این ترتیب آغشتگی سیگنال گفتار به نویز را می توان به شکل زیر مدل نمود:
که s(n) بیانگر سیگنال اصلی و تمیز صوت ، d(n) نویز آلوده کننده و G ضریب کنترل کننده انرژی نویز (و پس کنترل کننده SNR) می باشد. در این پایان‌نامه، این ضریب با   ادغام شده و یک سیگنال نویزی بصورت ذیل نمایش داده شده می باشد:
فصل اول
مروری بر روش های عمده بهسازی گفتار
در این فصل آغاز به مطالعه اختصار ای از چگونگی تولید گفتار در بشر پرداخته و سپس به مطالعه اجمالی روش های عمده بهسازی گفتار و مسائل و موضوعات موجود در این روش ها می پردازیم. در مطالعه این روش ها کوشش شده می باشد تا ضمن اظهار اصول و مبانی هر روش، نقاط اشکال و قوت آنها را ذکر کنیم.
1-1- مبانی تولید سیگنال گفتار
سیگنال گفتار جهت برقراری ارتباط بین گوینده و شنونده مورد بهره گیری قرار می گیرد. گوینده ازطریق یکسری فرآیندهای عصبی و حرکات ماهیچه ای موج سیگنال گفتار را تولید می کند و شنونده از طریق سیستم  شنیداری آن را دریافت کرده و سپس از پردازش آن را به سیگنال های عصبی بر می گرداند شکل (1-1) برش عرضی از سیستم تولید سیگنال گفتار را نشان می دهد. همانطورکه در شکل دیده می گردد اجزای اصلی سیستم شامل شش ها، نای ( لوله هوا)، حنجره (که رکن اصلی در تولید صوت می باشد.)، حفره حلقی (گلو)، حفره دهانی (دهان) و حفره دماغی (بینی) می باشد.
***ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود می باشد***

متن کامل را می توانید دانلود نمائید

این مطلب رو هم توصیه می کنم بخونین:   سمینار کارشناسی ارشد رشته برق - الکترونیک :روش های طراحی شبکه روی تراشه و کاربرد آن ها

زیرا فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به گونه نمونه)

اما در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود می باشد

تعداد صفحه :165

قیمت : 14700 تومان

***

—-

پشتیبانی سایت :       (فقط پیامک)       serderehi@gmail.com

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

دسته‌ها: مهندسی برق