مشخصات پژوهش

صفحه نخست /روشی نوین برای تشخیص شباهت ...
عنوان روشی نوین برای تشخیص شباهت سوال با استفاده از جداساز اختصاصی و مدل های یادگیری عمیق
نوع پژوهش پایان نامه
کلیدواژه‌ها متن کاوی، سوالات تکراری، جداساز کلمات، تعبیه کلمه، طبقه بندی، یادگیری عمیق
چکیده وب سایت های پرسش و پاسخ برنامه نویسی به عنوان یک بستر مناسب طرح سوالات و خطاها و سایر مشکلات مربوط به برنامه نویسی زبان های مختلف، مورد استقبال کاربران واقع شده اند. وب سایت Stack Overflow یکی از محبوب ترین وب سایت های پرسش و پاسخ در حوزه برنامه نویسی است که در آن کاربران می توانند سؤالات مربوط به مشکلات برنامه را بپرسند و پاسخ دهند و دانش کسب کنند. بررسی سوالات مطرح شده توسط صاحبان این وب سایت نشان می دهد که در بسیاری از سوالات به لحاظ محتوایی تکراری هستند و ارتباط معنایی بین سوالات وجود دارد. وجود سوالات تکراری باعث اتلاف وقت و انرژی کاربران پاسخ دهنده می شود و همچنین کاربرانی که سؤالات تکراری می پرسند مدت زیادی باید منتظر بمانند تا به سؤال آن ها پاسخ داده شود در حالی که پاسخ های آماده از قبل موجود است. بنابراین، شناسایی سؤالات مرتبط با سؤالات جدید می تواند دوباره کاری ها در این زمینه را کاهش دهد. در وب سایت های پرسش و پاسخ، شناسایی سوالات تکراری اغلب به طور دستی توسط کاربران انجام می شود. برای مثال کاربران خبره اقدام به شناسایی و برچسب زنی سؤالات تکراری می کند و به سؤالات تکراری از طریق نمایش و اشتراک گذاری URL سوال قدیمی تر پاسخ داده می دهند. با توجه به تعداد زیاد سوالات در وب سایت های پرسش و پاسخ، و با در نظر گرفتن این موضوع که می توان یک سوال را به روش های مختلف بیان کرد، ساخت یک مدل تشخیص سوالات تکراری از روی متن سوالات امری ضروری است. در این راستا ارائه یک روش مبتنی بر یادگیری عمیق می تواند منجر به بازنمایی بهتر از سوالات شده و در نتیجه ایجاد یک مدل تشخیص سوالات تکراری با دقت بالا شود.
پژوهشگران حسین پاکروح (دانشجو)، حسین عباسی مهر (استاد راهنما)، محمد خودی زاده نهاری (استاد مشاور)