رضا دهخدایی؛ عاطفه شریف
چکیده
منابع با سرعت بسیار زیادی در حال رشد و انتشار هستند و در این میان سهم منابع دیجیتال و وبی بسیار مشهود است. به منظور سازماندهی این منابع، تلاشهایی برای ردهبندی خودکار صورت گرفته که غالبا از الگوریتمهای آماری و یادگیری ماشینی استفاده میکنند. همچنین در برخی منابع، استفاده از ردهبندیهای کتابخانهای نیز توصیه شده است. اصلیترین ...
بیشتر
منابع با سرعت بسیار زیادی در حال رشد و انتشار هستند و در این میان سهم منابع دیجیتال و وبی بسیار مشهود است. به منظور سازماندهی این منابع، تلاشهایی برای ردهبندی خودکار صورت گرفته که غالبا از الگوریتمهای آماری و یادگیری ماشینی استفاده میکنند. همچنین در برخی منابع، استفاده از ردهبندیهای کتابخانهای نیز توصیه شده است. اصلیترین چالشی که در این زمینه وجود دارد آن است که ردهبندی، فرآیندی انتزاعی و نیازمند تفکر است و تکنیکهای ماشینی و هوش مصنوعی هنوز نتوانستهاند به طور کامل جایگزین ذهن انسان شوند. در این مقاله ضمن بیان اهمیت ردهبندی خودکار به مفاهیم یادگیری ماشینی و تکنیکها و الگوریتمهای پرکاربرد در خوشهبندی و ردهبندی مانند کا- نزدیکترین همسایه، مدل بیز، شبکههای عصبی مصنوعی، یادگیری عمیق، و طبقهبندیهای ترکیبی پرداخته شد. همچنین مراحل ردهبندی خودکار صفحات وب و تکنیکهای مورد استفاده در هر مرحله مورد اشاره قرار گرفت. رسیدن به درک روشنتری از موضوع ردهبندی خودکار، امکان همزبانی با متخصصان حوزه هوش مصنوعی و کامپیوتر را فراهم آورده و زمینهساز پژوهشهای میانرشتهای خواهد بود.