عنوان
|
ارائه مدلی جهت پیش بینی ارتباط بین واحدهای دانشی در وب سایت های پرسش و پاسخ برنامه نویسی با استفاده از تکنیک های یادگیری عمیق: مطالعه موردی Stack Overflow
|
نوع پژوهش
|
مقاله چاپ شده
|
کلیدواژهها
|
تشخیص ارتباط، دسته بندی چند کلاسه، روش BiLSTM، مکانیزم توجه، معیارهای شباهت متن.
|
چکیده
|
وب سایت Stack Overflow یکی از محبوب ترین جوامعی است که میلیون ها برنامه نویس از آن استفاده می کنند. اگر یک سوال و پاسخ های متناظر با آن را یک واحد دانشی در نظر بگیریم، آنگاه بین واحدهای دانشی ارتباط مختلف معنایی وجود دارد که این ارتباط شامل ارتباط تکراری، ارتباط مستقیم، ارتباط غیرمستقیم با سوال طرح شده است. تشخیص دسته های مختلف ارتباط معنایی بین واحدهای دانشی در Stack Overflow می تواند اثربخشی و کارایی جستجوی اطلاعات را به طور چشمگیری بهبود بخشد. در این مطالعه، یک رویکرد ترکیبی مبتنی بر روش های یادگیری عمیق و معیارهای تشابه سنتی جهت تشخیص ارتباط بین سوالات ارائه می شود. به طور خاص دو معماری شبکه عمیق ارائه می شود که معماری اول از شبکه حافظه کوتاه مدت طولانی دوطرفه و همچنین لایه محاسبه کننده شباهت کسینوسی تشکیل شده است. معماری دوم گسترش یافته ی معماری اول با اضافه کردن مکانیزم توجه است. رویکرد پیشنهادی روی یک مجموعه داده سوالات زبان برنامه نویسی جاوا شامل 40000 مورد ارزیابی قرار گرفت. نتایج به دست آمده نشان می دهد که در معیار های F1، Recall و Precision مدل پیشنهادی عملکرد بهتری نسبت به مدل های موجود از خود نشان می دهد. به طور خاص مدل پیشنهادی در این مقاله در معیار F1 بهبود 17.3 درصدی نسبت به برترین مدل فعلی دارد. همچنین نتایج آزمایش ها نشان می دهد که استفاده از مدل تعبیه کلمات از پیش آموزش دیده به طور قابل ملاحظه ای عملکرد مدل های ارائه شده را بهبود می بخشد.
|
پژوهشگران
|
حسین عباسی مهر (نفر اول)، محمد خودی زاده نهاری (نفر دوم)
|