عنوان
|
الگوریتم کلاس بندی بیزین بهینه شده بر اساس الگوریتم کلونی زنبور عسل مصنوعی
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
کلاس بندی کننده بیز ساده، الگوریتم کلونی زنبور عسل مصنوعی، خوشه بندی.
|
چکیده
|
کلاسبندی از مهمترین تکنیکهای داده کاوی و یک روش یادگیری بانظارت محسوب میگردد. یک گروه از تکنیکهای مهم در کلاسبندی، متدهای کلاسبندی بیزین هستند که از روشهای کلاسبندی کننده آماری محسوب می-شود و میتوانند احتمالات عضویت یک نمونه در یک کلاس را پیشبینی کنند. کلاسبندی بیزین مبنی بر تئوری بیز است. مقایسه الگوریتمهای کلاسبندی نشان داده است که یک کلاسبندی کننده بیز ساده از نظر کارایی قابل مقایسه با کلاسبندیهای درخت تصمیم و شبکههای عصبی میباشد و در برخی موارد بهتر از آنها عمل میکند. همچنین کلاس-بندی کننده بیزین میزان دقت و سرعت بالایی را هنگامی که در دیتاستهای بزرگ به کار برده میشوند، ارائه میدهند. یکی از مشکلات مهم در کلاسبندی بیزین، مشکل مقادیر صفر (zero-frequency) میباشد که برای اجتناب از آن از متد M-estimate استفاده میشود. البته مشکلات دیگری نظیر قدرت پایین در برخی موارد دیده می شود. در این پایاننامه دو روش مبتنی بر تخمین پارامترهای متد M-estimate و روش دیگر مبتنی بر وزندهی ویژگیها و رویکردهایی برای افزایش دقت (Accuracy) کلاسبندی کننده بیز ساده ارائه شده است. در این رویکردها از الگوریتمهای فرااکتشافی برای تخمین پارامترها بصورت اتوماتیک استفاده شده تا زمان انتخاب مقادیر m و p بهینه کاهش یابد. در رویکرد اول کلاسبندی نمونههای جدید براساس پارامترهای بهینهی بدست آمده توسط الگوریتم ABC صورت میگیرد و در رویکرد دوم بعد از خوشهبندی مجموعه داده آموزشی توسط الگوریتم K-means، کلاسبندی نمونههای جدید براساس پارامترهای بهینه انجام میگیرد. در شرایطی که احتمال posteriorها به هم نزدیک باشند، کلاسبندی براساس دادههای متعلق به خوشهای که به نمونه تخصیص داده شده صورت میگیرد و در نهایت کلاس مناسب برای نمونه انتخاب میشود. در رویکرد سوم تغییر ویژگی برای نمونههایی که بدرستی به کلاس متناظرشان تخصیص داده نمیشوند براساس پارامترهای بهینه بدست آمده، توسط الگوریتم ABC انجام میگیرد. کلاسبندی نمونههای جدید براساس پارامترهای بهینه انجام میگیرد. در شرایطی که احتمال posteriorها به هم نزدیک باشند، کلاسبندی براساس دادههای تغییر یافته صورت میگیرد و در نهایت کلاس مناسب برای نمونه انتخاب میشود. رویکرد چهارم از الگوریتم ترکیبی ABC با عملگرهای ادغام و جهش الگوریتم ژنتیک برای بدست آوردن پارامترهای بهینه استفاده کرده و
|
پژوهشگران
|
ام گلثوم داداشی شاهگلی (دانشجو)، عسگر علی بویر (استاد راهنما)، مهدی هاشم زاده (استاد مشاور)
|