عنوان
|
ارائه یک روش کارآمد برای فیلترینگ اسپم در ایمیل های با محتوای فارسی-انگلیسی با استفاده از یادگیری فعال آنلاین
|
نوع پژوهش
|
مقاله ارائه شده
|
کلیدواژهها
|
اسپم فیلترینگ، یادگیری فعال، بهینه سازی آموزش یادگیری، اسپم فیلترینگ برای زبان های فارسی-انگلیسی
|
چکیده
|
فیلترینگ اسپم در زبان انگلیسی بعنوان یک چالش مهم بسیار مورد توجه هست ولی متاسفانه این مسئله در ایمیلهای فارسی و یا فارسی-انگلیسی یک چالش کمرنگ است. رویکردهای مبتنی بر لیست سیاه و سفید، درخت تصمیم، یادگیری ماشین و یادگیری عمیق برای حل این چالش ارائه شده اند. با این حال، پایگاه داده های برچسب خورده برای آموزش الگوریتم های یادگیری ماشین در مقیاس بزرگ، زمان بر و هزینه بر هستند. در این پژوهش، با استفاده از روش یادگیری فعال و الگوریتم بهینه سازی آموزش-یادگیری، کارایی الگوریتم ماشین بردار پشتیبان در تشخیص اسپم در ایمیل های ترکیبی فارسی-انگلیسی بهبود یافته است. این پژوهش برخلاف تحقیقات قبلی، بر روی ایمیل های ترکیبی فارسی-انگلیسی انجام شده است و نتایج آزمایشات نشان داده اند که با استفاده از مجموعه داده آموزشی کوچکتر، نرخ صحت نسبتاً خوبی در تشخیص اسپم حاصل شده است.
|
پژوهشگران
|
عسگر علی بویر (نفر اول)، مریم صباوندمنفرد (نفر دوم)، سمیه عبدل زاده مقدم طیول (نفر سوم)
|