مهدی زینالی تازه کندی؛ محسن نوکاریزی
چکیده
داده کاوی به مفهوم آشکارسازی الگوهای موجود در حجم انبوه داده هاست که در بسیاری از رشته ها به کار گرفته شده است. در رشته علم اطلاعات و دانش شناسی بهویژه در بازیابی اطلاعات نیز میتوان از آن بهره برد. در بازیابی اطلاعات ابتدا پارادایم نظام گرا و سپس پارادایم کاربرگرا مطرح شده است که در پارادایم دوم به نیاز اطلاعاتی توجه ...
بیشتر
داده کاوی به مفهوم آشکارسازی الگوهای موجود در حجم انبوه داده هاست که در بسیاری از رشته ها به کار گرفته شده است. در رشته علم اطلاعات و دانش شناسی بهویژه در بازیابی اطلاعات نیز میتوان از آن بهره برد. در بازیابی اطلاعات ابتدا پارادایم نظام گرا و سپس پارادایم کاربرگرا مطرح شده است که در پارادایم دوم به نیاز اطلاعاتی توجه شده است. در پارادایم دوم، ورود پرسش های نامناسب از سوی کاربران، دلیل اصلی عدم بازیابی مدارک مرتبط تلقی می شود. ازاین رو، یکی از مباحث اصلی این پارادایم، پیشنهاد و بسط پرسش مناسب در نظام بازیابی اطلاعات است که میتوان از روش های داده کاوی برای آن استفاده کرد. چهار روش مهم برای پیشنهاد پرسش جهت تقویت نظام توصیه گر وجود دارد. قاعده سری زمانی یکی از این روش هاست که به فراوانی پرسش در واحد زمانی خاص می پردازد. یکی دیگر از روش ها، قانون همایندی است که به وابستگی و تداعی پرسش ها توجه دارد. در روش قانون هم ایندی همراه با فاصله لون اشتاین، افزون بر توجه به وابستگی و تداعی پرسش ها به ترتیب واژه های پرسش نیز توجه می شود. به هرحال، در هر سه روش یادشده، از فایل ثبت رخداد استفاده می شود؛ درحالیکه در نظریه احتمالاتی از واژه های مدارک جهت ترمیم شکاف واژگانی بین پرسش و مدارک استفاده می شود. درنهایت به نظر می رسد، به کارگیری روش های یادشده به ویژه روش احتمالی در پیشنهاد پرسش منجر به نتایج مناسب تری شود.