خوشه‌بندی را می‌توان به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت. خوشه‌بندی در واقع یافتن یک ساختار درون یک مجموعه از داده‌های بدون برچسب می­باشد. خوشه‌ به مجموعه‌ای از داده‌ها گفته می گردد که به هم شباهت داشته باشند. در خوشه‌بندی کوشش می گردد تا داده­ها به خوشه‌هایی تقسیم شوند که شباهت بین داده‌های درون هر خوشه حداکثر و شباهت بین داده‌های درون خوشه‌های متفاوت حداقل گردد. در شکل 4-1 این اصل نشان داده شده می باشد. در این شکل نمونه‌ای از اعمال خوشه‌بندی روی یک مجموعه از داده‌ها مشخص شده می باشد که از معیار فاصله[1] به عنوان عدم شباهت[2] بین داده‌ها بهره گیری شده می باشد. همچنین در این شکل هر یک از نمونه­های ورودی به یکی از خوشه­ها تعلق دارد و نمونه­ای وجود ندارد که متعلق به بیش از یک خوشه باشد.

 

شکل 4-1- اساس خوشه­بندی

پس خوشه مجموعه­ای از اشیاء می­باشد که با یکدیگر مشابه بوده و با اشیاء موجود در خوشه­های دیگر غیر مشابه می­باشند. برای مشابه بودن می­توان معیارهای مختلفی را در نظر گرفت؛ مثلا می­توان معیار فاصله را برای خوشه­بندی مورد بهره گیری قرار داد و اشیائی را که به یکدیگر نزدیکتر هستند بعنوان یک خوشه در نظر گرفت که به این نوع خوشه بندی، خوشه بندی مبتنی بر فاصله  نیز گفته می­گردد.

[1] Distance

[2] Dissimilarity

 متن فوق بخش هایی از این پایان نامه بود

برای دیدن جزئیات بیشتر ، خرید و دانلود آنی فایل متن کامل با فرمت ورد

می توانید به لینک زیر مراجعه نمایید:

این مطلب رو هم توصیه می کنم بخونین:   پایان نامه ارشد شبیه سازی عددی سلول خورشیدی مبتنی بر نانو نوار گرافن با استفاده از روش تابع گرین غیرتعادلی
دسته‌ها: دسته‌بندی نشده