Research Specifications

Home \ارائه ی یک رویکرد خوشه بندی ...
Title ارائه ی یک رویکرد خوشه بندی طیفی بر اساس اتوانکودرها و نشانه ها
Type of Research Thesis
Keywords خوشه بندی طیفی، اتوانکودر، نشانه، داده کاوی، شبکه های عصبی، یادگیری بدون نظارت
Abstract خوشه بندی یکی از پرکاربردترین تکنیک ها برای تجزیه و تحلیل داده های اکتشافی بوده و یکی از کارهای اصلی در یادگیری ماشین بدون نظارت است. داده ها توسط یک الگوریتم خوشه بندی بر اساس معیارهایی به دسته های مختلفی تقسیم می شوند که به این دسته ها، خوشه گفته می شود. هدف، تقسیم نقاط داده ای به چند گروه است، طوری که نقاط یک گروه مشابه بوده و نقاط گروه های مختلف با یکدیگر فرق داشته باشند. روش های مختلفی برای خوشه بندی ارائه شده است که هر یک سعی دارند بهترین گروه بندی را برای مجموعه ای از داده های مد نظر ارائه دهند. با این حال، زمانی که داده ها دارای یک ساختار غیرخطی و نامحدب باشند، روش های معمول خوشه بندی، قادر به خوشه بندی صحیح داده ها نمی باشند. خوشه بندی طیفی، یک راه حل مناسب برای چنین مسائلی می باشد که یکی از قدرتمندترین و محبوب ترین روش هاست. این الگوریتم وابسته به تجزیه ی ویژه ی ماتریس همبستگی است که نمونه ها را به خوشه های مجزایی تقسیم می کند. ماتریس همبستگی، شباهت بین داده ها را معین می کند. از مزایای مهم این روش، کاهش ابعاد داده هاست که منجر به بهبود و افزایش سرعت همگرایی می شود. خوشه بندی طیفی برای افراز گراف نیز بسیار پرکاربرد است که از همین تکنیک در شبکه های اجتماعی نیز استفاده می شود. الگوریتم خوشه بندی طیفی به دلیل تجزیه ی ویژه ی ماتریس لاپلاسین و ماتریس شباهت در مجموعه ی داده های مقیاس بزرگ، از پیچیدگی محاسباتی بالایی رنج می برد. برای یک مجموعه ی داده در مقیاس بزرگ با n نقطه ی داده، پیچیدگی حافظه و پیچیدگی زمانی آن ها به ترتیب O(n2) و O(n3) است. به این دلیل، برای کاربردهای بزرگ مناسب نیستند که روش های دیگری در جهت رفع مشکلات این الگوریتم معرفی شده اند.
Researchers (Student)، Alireza Rouhi (Primary Advisor)، Asgarali Bouyer (Advisor)