مشخصات پژوهش

صفحه نخست /دسته بندی سوالات Stack ...
عنوان دسته بندی سوالات Stack Overflowبا استفاده از بازنمایی های سنتی و جدید
نوع پژوهش مقاله ارائه شده
کلیدواژه‌ها دسته بندی سوالات، یادگیری ماشین، بازنمایی مبتنی بر مدل n-grams، بازنمایی مبتنی بر یادگیری عمیق
چکیده برچسب گذاری خودکار سوالات زبانهای برنامه نویسی نقش مهمی در مرتبط کردن سوالات با پاسخ دهندگان در یک پلتفرم پرسش و پاسخ دارد. دسته بندی سوالات با استفاده از متن سوال و با بکارگیری روشهای یادگیری ماشین یکی از روشهای مورد استفاده در این زمینه است. با توجه به اینکه در دسته بندی سوالات بازنمایی متن نقش ویژه ای در عملکرد دسته بند دارد، در این مقاله بازنمایی سنتی مبتنی بر مدل n-gramsبه همراه فرکانس کلمه -معکوس فرکانس سند با بازنمایی جدید مبتنی بر روشهای یادگیری عمیق مورد مقایسه قرار گرفت. پس از انجام پیش پردازش و ساخت بردارهای ورودی، دسته بندهای بیز ساده، رگراسیون لجستیک، ماشین بردار پشتیبان و Kنزدیکترین همسایه روی مجموعه ای از سوالات سایت Stack Overflowاعمال گردید. همچنین یک تکنیک مبتنی بر حافظه طولانی کوتاه-مدت پیاده سازی گردید. نتایج روی داده های مورد استفاده در این مقاله نشان می دهد که مدلهای مبتنی بر بازنمایی سنتی دقت بهتری نسبت به بازنمایی مبتنی بر یادگیری عمیق دارند
پژوهشگران حسین پاکروح (نفر اول)، حسین عباسی مهر (نفر دوم)