سامانه پژوهشی دانشگاه شهید مدنی آذربایجان

عنوان	مروری بر روشهای تشابه متن
نوع پژوهش	مقاله ارائه شده
کلیدواژه‌ها	شباهت جمله، شباهت متن، شباهت معنایی، شبکه ی عصبی، اطلاعات معنایی، اطلاعات نحوی، شباهت مبتنی بر رشته
چکیده	با توجه به تولید روزافزون داده های متنی، پردازش آنها اهمیت زیادی در بسیاری از کاربردها دارد. یکی از زمینه های مهم در پردازش متن اندازه گیری شباهت متن که در کاربردهای مختلف متن کاوی نظیر دسته بندی متن، خلاصه سازی، سیستم های پرسش و پاسخ، و غیره نقش مهمی در عملکرد مدل ها دارد. با توجه به اهمیت موضوع، در این مقاله مروری بر روش های محاسبه شباهت متن انجام می شود. این روش ها به طور کلی به دو دسته روش های سنتی که مبتنی بر کلمات عمل می کنند که خود به گروه کلی روشهای مبتنی بر شباهت لغوی و شباهت معنایی تقسیم می شوند. همچنین روش های جدیدی مبتنی بر شبکه های عصبی و یادگیری عمیق برای اندازه گیری تشابه متن در سطح کلمه و جمله در سال های اخیر ارائه شده است.
پژوهشگران	فریبا خلج (نفر اول)، حسین عباسی مهر (نفر دوم)

مشخصات پژوهش