Research Specifications

Home \الگوریتم کلاس بندی بیزین ...
Title الگوریتم کلاس بندی بیزین بهینه شده بر اساس الگوریتم کلونی زنبور عسل مصنوعی
Type of Research Thesis
Keywords کلاس بندی کننده بیز ساده، الگوریتم کلونی زنبور عسل مصنوعی، خوشه بندی.
Abstract کلاسبندی از مهمترین تکنیکهای داده کاوی و یک روش یادگیری بانظارت محسوب میگردد. یک گروه از تکنیکهای مهم در کلاسبندی، متدهای کلاسبندی بیزین هستند که از روشهای کلاسبندی کننده آماری محسوب می-شود و میتوانند احتمالات عضویت یک نمونه در یک کلاس را پیشبینی کنند. کلاسبندی بیزین مبنی بر تئوری بیز است. مقایسه الگوریتمهای کلاسبندی نشان داده است که یک کلاسبندی کننده بیز ساده از نظر کارایی قابل مقایسه با کلاسبندیهای درخت تصمیم و شبکههای عصبی میباشد و در برخی موارد بهتر از آنها عمل میکند. همچنین کلاس-بندی کننده بیزین میزان دقت و سرعت بالایی را هنگامی که در دیتاستهای بزرگ به کار برده میشوند، ارائه میدهند. یکی از مشکلات مهم در کلاسبندی بیزین، مشکل مقادیر صفر (zero-frequency) میباشد که برای اجتناب از آن از متد M-estimate استفاده میشود. البته مشکلات دیگری نظیر قدرت پایین در برخی موارد دیده می شود. در این پایاننامه دو روش مبتنی بر تخمین پارامترهای متد M-estimate و روش دیگر مبتنی بر وزندهی ویژگیها و رویکردهایی برای افزایش دقت (Accuracy) کلاسبندی کننده بیز ساده ارائه شده است. در این رویکردها از الگوریتمهای فرااکتشافی برای تخمین پارامترها بصورت اتوماتیک استفاده شده تا زمان انتخاب مقادیر m و p بهینه کاهش یابد. در رویکرد اول کلاسبندی نمونههای جدید براساس پارامترهای بهینهی بدست آمده توسط الگوریتم ABC صورت میگیرد و در رویکرد دوم بعد از خوشهبندی مجموعه داده آموزشی توسط الگوریتم K-means، کلاسبندی نمونههای جدید براساس پارامترهای بهینه انجام میگیرد. در شرایطی که احتمال posteriorها به هم نزدیک باشند، کلاسبندی براساس دادههای متعلق به خوشهای که به نمونه تخصیص داده شده صورت میگیرد و در نهایت کلاس مناسب برای نمونه انتخاب میشود. در رویکرد سوم تغییر ویژگی برای نمونههایی که بدرستی به کلاس متناظرشان تخصیص داده نمیشوند براساس پارامترهای بهینه بدست آمده، توسط الگوریتم ABC انجام میگیرد. کلاسبندی نمونههای جدید براساس پارامترهای بهینه انجام میگیرد. در شرایطی که احتمال posteriorها به هم نزدیک باشند، کلاسبندی براساس دادههای تغییر یافته صورت میگیرد و در نهایت کلاس مناسب برای نمونه انتخاب میشود. رویکرد چهارم از الگوریتم ترکیبی ABC با عملگرهای ادغام و جهش الگوریتم ژنتیک برای بدست آوردن پارامترهای بهینه استفاده کرده و
Researchers Omm Golsoom Dadashi Shahgoli (Student)، Asgarali Bouyer (Primary Advisor)، Mahdi Hashemzadeh (Advisor)