عنوان
|
ارائه ی یک رویکرد خوشه بندی طیفی بر اساس اتوانکودرها و نشانه ها
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
خوشه بندی طیفی، اتوانکودر، نشانه، داده کاوی، شبکه های عصبی، یادگیری بدون نظارت
|
چکیده
|
خوشه بندی یکی از پرکاربردترین تکنیک ها برای تجزیه و تحلیل داده های اکتشافی بوده و یکی از کارهای اصلی در یادگیری ماشین بدون نظارت است. داده ها توسط یک الگوریتم خوشه بندی بر اساس معیارهایی به دسته های مختلفی تقسیم می شوند که به این دسته ها، خوشه گفته می شود. هدف، تقسیم نقاط داده ای به چند گروه است، طوری که نقاط یک گروه مشابه بوده و نقاط گروه های مختلف با یکدیگر فرق داشته باشند. روش های مختلفی برای خوشه بندی ارائه شده است که هر یک سعی دارند بهترین گروه بندی را برای مجموعه ای از داده های مد نظر ارائه دهند. با این حال، زمانی که داده ها دارای یک ساختار غیرخطی و نامحدب باشند، روش های معمول خوشه بندی، قادر به خوشه بندی صحیح داده ها نمی باشند. خوشه بندی طیفی، یک راه حل مناسب برای چنین مسائلی می باشد که یکی از قدرتمندترین و محبوب ترین روش هاست. این الگوریتم وابسته به تجزیه ی ویژه ی ماتریس همبستگی است که نمونه ها را به خوشه های مجزایی تقسیم می کند. ماتریس همبستگی، شباهت بین داده ها را معین می کند. از مزایای مهم این روش، کاهش ابعاد داده هاست که منجر به بهبود و افزایش سرعت همگرایی می شود. خوشه بندی طیفی برای افراز گراف نیز بسیار پرکاربرد است که از همین تکنیک در شبکه های اجتماعی نیز استفاده می شود. الگوریتم خوشه بندی طیفی به دلیل تجزیه ی ویژه ی ماتریس لاپلاسین و ماتریس شباهت در مجموعه ی داده های مقیاس بزرگ، از پیچیدگی محاسباتی بالایی رنج می برد. برای یک مجموعه ی داده در مقیاس بزرگ با n نقطه ی داده، پیچیدگی حافظه و پیچیدگی زمانی آن ها به ترتیب O(n2) و O(n3) است. به این دلیل، برای کاربردهای بزرگ مناسب نیستند که روش های دیگری در جهت رفع مشکلات این الگوریتم معرفی شده اند.
|
پژوهشگران
|
طاهر حسینی نسب (دانشجو)، علیرضا روحی (استاد راهنما)، عسگر علی بویر (استاد مشاور)
|