در ادامه مطلب می توانید تکه هایی از ابتدای این پایان نامه را بخوانید

دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشکده تحصیلات تکمیلی
“M.Sc” سمینار برای دریافت درجه کارشناسی ارشد
مهندسی برق- الکترونیک
عنوان :
مطالعه چندین روش بازشناسی حالت گفتار

برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :
(ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل می باشد)
چکیده
در سالهای اخیر، شناخت حالات گفتار انسانی بعلت تنوع کاربردهای آن، موجب افزایش بهره گیری از
چنین تکنولوژی شده می باشد. در این پژوهش آغاز تعریفی از حالت ارائه شده، سپس به بعضی معضلات
موجود در این کار که تشخیص را سختتر می ‌کند پرداخته و راهحلهای متفاوت ارائه شده در این زمینه
معرفی میشود. بعد از آن به الگوریتمها و روشهای ارائه شده در زمینه بازشناسی حالت در گفتار
پرداخته و چند نمونه از تحقیقاتی که در این زمینه صورت گرفته ارائه شده می باشد. همچنین به بعضی مزایا
و معایب هر روش و اینکه هر کدام از این روشها برای چه شرایطی مفیدترند نیز، تصریح خواهد گردید. در
نهایت بعضی کاربردهای آن نیز مورد مطالعه قرار میگیرد. نتایج نشان میدهد که شبکههای عصبی می-
توانند بهعنوان یک دستهبندی کننده خوب برای شناسایی حالت گفتار بهره گیری شوند. نتایج این روشها
زمانی بهتر خواهد بود که حالت گفتار ذکر گردیده دارای تفاوتهای قابل توجهی نسبت به سایر حالات باشد.
مقدمه
چارلز داروین نخستین کتاب درمورد اظهار احساسات بشر و حیوان را در قرن نوزدهم نگاشت. پس از این
اثر مهم روانشناسان و متخصصان هوش مصنوعی به تدریج به جمع آوری دانش و اطلاعات در این زمینه
پرداختند. اخیراً نیز موج جدیدی از توجه روانشناسان و متخصصان هوش مصنوعی را بر انگیخته می باشد.
بعضی از علت های این رنسانس عبارتند از :
پیشرفت فناوری در ثبت, ذخیره و تحلیل اطلاعات صوتی و تصویری, پیشرفت در فناوری حسگر
و کامپیوتر های فرسایش پذیر , بالا رفتن سطح فناوری ارتباط بشر و رایانه از نقطه none intrusive های
و کلیک به حس و عاطفه و نرم افزار های زنده وار مخصوص کمک به بشر و رباتهای حیوان شکل
های شرکت سونی که قادر به درک و اظهار احساسات می Aibo , های شرکت تایگر Furbi خانگی از قبیل
تحت عنوان محاسبه عاطفی ایجاد (AI) باشد. به تازگی زمینه های تحقیقاتی جدیدی در هوش مصنوعی
شده می باشد. در حوزه رمز گشایی و توصیف و به تصویر کشیدن حالات در گفتار، تا کنون روانشناسان به
آزمایشات تجربی بسیاری دست زده اند و فرضیه هایی ارائه داده اند و از طرف دیگر محققان هوش
مصنوعی نیز در شاخه های زیر تحقیقات ارزنده ای انجام داده اند:
ساخت و ترکیب حالات گفتار, باز شناسایی حالات گفتار و بهره گیری از نرم افزار هایی برای رمز گشایی و
اظهار حالات. انگیزه ما پژوهش و کاوش در راههای بهره گیری از بازشناسی حالات گفتار می باشد که می تواند
در تجارت (به خصوص کاربرد آن در یک مرکز تلفن), یک کاربرد بالقوه آن تشخیص حالت گفتاری در
یک مکالمه تلفنی و ایجاد فیدبک به یک اپراتور یا سرپرست به مقصود نمایش باشد. کاربرد دیگر آن
ذخیره پیامهای صوتی طبق حالت اظهار شده توسط تماس گیرنده می باشد. و کاربرد دیگر آن بهره گیری از
محتوای حالت احساسی مکالمات جهت ارزیابی عملکرد اپراتور می باشد.
شناسایی خودکار حالت گفتار با توجه با حالات صورت، حرکات بدن و یا ویژگی های گفتار از
امیدبخش ترین روش های بازشناسی حالت گفتار ثابت شده می باشد. بخصوص در زمینه سیستم های
امنیتی در سالهای اخیر علاقه مندی های بسیاری نظاره شده می باشد.
حال می خواهیم بدانیم که مقصود از حالت در گفتار چیست؟ اگر تا کنون در چند سخنرانی شرکت کرده
باشید خواهید دید که بعضی از سخنرانی ها جذاب و بعضی خسته کننده می باشند. این موضوع علاوه بر
موضوع سخنرانی به چگونگی اظهار سخنران نیز بستگی دارد. اگر سخنران گفتاری یکنواخت داشته باشد
همانند یک ربات خواهد بود، که باعث خواب آلودگی شنونده می گردد. پس سخنرانان حرفه ای با تغییر آهنگ گفتار خویش و با حرکات به موقع دست، سر و بدن خویش، با تاکید روی بعضی کلمات،
اظهار بعضی جملات با تعجب بعضی با افسوس و… حال و هوای سخنرانی را تغییر می دهند. این تغییرات
در چگونگی اظهار جملات و کلمات را “حالت در گفتار” گویند. بعبارت دیگر ادای جملات به هر شکلی غیر
از حالت عادی و یکنواخت بعنوان یک حالت شناخته می گردد. حالات مختلف ممکن از قبیل: خشم،
تنفر، ترس، شادی، غم، هیجان، آرامش، کسالت، افسردگی و … می باشند. حتی در بعضی از مواقع در
مورد اندازه یک حالت بحث می گردد، مثلا شاد با خیلی شاد را در نظر می گیرند. اضافه کردن حالت
طبیعی به این حالت ها معقول بنظر می رسد تا هر کدام از این حالت ها درک شوند. یعنی برای در نظر
گرفتن یک حالت جدید یک سری تغییرات بایستی نسبت به یک مبدا وجود داشته باشد و در اینگونه کار ها
مبنا حالت طبیعی و بدون حالت می باشد. این طبقه بندی بعنوان اساس مقایسه بهره گیری می گردد. امروزه
آمار عمومی از یک عبارت بعنوان اساس کار می باشد، اگر چه کوشش در بهره گیری از ویژگیهای ذاتی موجود را
دارند.
اغلب برای تشخیص مثلا: دروغ، بازی های ویدیویی و کمک روانپزشکی از بازشناسی حالت گفتار
بهره گیری شده می باشد. برای اطمینان از تشخیص صحیح معقول می باشد که تعداد و نوع حالت های قابل
تشخیص محدود و متناسب با نیاز در آن کاربرد خاص باشد(برای طبقه بندی مناسب). هنوز بصورت فنی
هیچ استاندارد مشخصی برای تشخیص و طبقه بندی حالت های گفتار نداریم. اغلب یک روش تمیز
دادن، میان یک مجموعه تعریف شده از حالت های گفتار مجزا می باشد و عقیده مشترکی(واحدی)برای
نام شش حالت : 1- خشم 2- تنفر Mpeg تعداد و اسامی آنها موجود نیست. این موضوع در استاندارد 4
-3 ترس 4- شادی 5- غم 6- هیجان را در بر دارد. از طرفی این تحقیقات در هر زبان و لهجه ای خاص
خود می باشد و چنانچه از مبنا دور گردیم دقت بازشناسی کاهش می یابد. مثلا نمی توان سیستمی که
برای زبان انگلیسی طراحی شده می باشد را برای زبان فارسی بکار برد. زیرا پایگاه داده ای که برای زبان
انگلیسی طراحی شده ویژگی های خاص خود را دارد که برای زبان فارسی متفاوت می باشد و کاربردی
ندارد. البته ممکن می باشد الگوریتم کاری آنها مشابه باشد.
اطلاعات غیر کلامی که در حالات، حرکات و ادای چهره بشر پدیدار می گردد، تأثیر مهمی درارتباطات
بشری دارد. به ویژه افراد با بهره گیری از اطلاعات حالت یا عاطفی راحتتر با یکدیگر ارتباط مستقر می کنند.
بعنوان مثال: در موقعیتهای تجاری علایق مشتری که ناشی از حالات وی حدس زده می گردد ممکن می باشد
گاهی پیشنهادات سودمندی را برای طرح ریزی استراتژی های بعدی به طرف معامله بدهد. واضح می باشد که تبادل اطلاعات غیر کلامی همانند حالات و عواطف در تمامی اشکال ارتباطات مهم می باشد و اهمیت
آن در بعضی مواقع بیش از اطلاعات کلامی می باشد. به این معنا که ارتباطات غیر کلامی بنیان ارتباط
بشری می باشد. علاوه بر ارتباطات بشر با بشر، ارتباطات بشری از طریق کامپیوتر و ارتباط میان بشر و
ماشین نیز بیش از پیش رواج یافته می باشد. برای دستیابی به ارتباط نزدیکتر و بشر گونه میان بشر و
ماشین، کاربرد اطلاعات کلامی ونیز غیر کلامی ضروری می باشد. تا کنون حالات و یا عواطف در حوزه
های روانشناسی و یا فلسفه مورد مطالعه قرار گرفته اند. اگر چه با افزایش اهمیت اطلاعات غیر کلامی در
زمینه ارتباط بشر با ماشین، مدتی می باشد که این امر بعنوان موضوع تحقیقی در حوزه مهندسی نیز مورد
بحث و مطالعه قرار گرفته می باشد.
تعداد صفحه : 163
قیمت : 14700 تومان

 
***

این مطلب رو هم توصیه می کنم بخونین:   دانلود سمینار کارشناسی ارشد رشته برق الکترونیک: جداسازی کور منابع صوتی
دسته‌ها: مهندسی برق

دیدگاهتان را بنویسید