بررسی تأثیر بستر نحوی بر نمایه‌سازی و رتبه‌بندی پیشینه‌های فراداده‌ای توسط موتورهای کاوش وب: مقایسه پیشینه‌های فراداده‌ای مارک 21 و هسته دوبلین

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران

2 استادیار گروه علم اطلاعات و دانش‌شناسی دانشگاه علامه طباطبائی

3 کارشناس ارشد علوم کتابداری و اطلاع‌رسانی دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران

چکیده

هدف: پژوهش حاضر با هدف تبیین وضعیت نمایه‌سازی و رتبه­بندی پیشینه‌های فرا­داده­ای هسته دوبلین و مارک 21 در بستر نحوی زبان نشانه‌گذاری گسترش­پذیر (ایکس. ام. آل.) مبتنی بر رویکرد پیوند توسط موتورهای کاوش وب انجام شد. روش: روش پژوهش، رویکرد تحلیلی-مقایسه‌ای بود. جامعه پژوهش را یک‌صد پیشینه فراداده‌ای مبتنی بر ایکس.­ام.آل. در قالب دو گروه تشکیل می‌دادند. گروه نخست، دارای عناصر فرا­داده­ای هسته دوبلین و گروه دیگر، دارای عناصر فرا‌داده­ای مارک 21 بودند که بر روی وب‌سایت http://www.aghaabedi.com انتشار یافتند. وب‌سایت یادشده به‌صورت مستقیم به موتورهای کاوش انتخابی (گوگل و یاهو) معرفی شدند. ابزار گردآوری داده­ها سیاهه وارسی بود. یافته‌ها: یافته‌ها حاکی از آن است که تمامی ارزش‌های عناصر پیشینه‌های فراداده‌ای هسته دوبلین و مارک 21 در بستر ایکس. ام.آل. توسط موتورهای کاوش گوگل و یاهو نمایه شدند و امکان بازیابی هر یک از پیشینه‌ها بر اساس ارزش عناصر آن‌ها در محیط موتورهای کاوش فراهم است. بر اساس نتایج آزمون آماری تفاوت معناداری میان نمایه‌سازی و رتبه‌بندی پیشینه‌های فراداده‌ای هسته دوبلین و مارک 21 مبتنی بر ایکس. ام.آل. توسط موتورهای کاوش گوگل و یاهو مشاهده نشد. نتیجه‌ گیری: بستر نحوی پیشینه‌های فراداده‌ای موردمطالعه موجب افزایش دسترس‌پذیری آن‌ها از طریق موتورهای کاوش وب گردید. این امکان برای 

کلیدواژه‌ها


عنوان مقاله [English]

The Effect of syntax on the indexing & ranking of Metadata Records by the Web Search Engine: a Comparative Study on MARCXML and DCXML Metadata Records

نویسندگان [English]

  • Fahimeh Babalhavaeji 1
  • Seyed Mahdi Taheri 2
  • Zahra Agha Abedi 3
1 . Associate Professor of Knowledge and Information Science, Islamic Azad University,
2 Assistant Professor of Knowledge and Information Science, Allameh Tabataba'i University
3 M.A. in Knowledge and Information
چکیده [English]

Purpose: The aim of this research was to find out the status of indexing and ranking MARCXML and DCXML metadata records based on the linking approach by Web search engines. Methodology: 100 XML-based metadata records in two groups (50 DCXML metadata records in the first group and 50 MARCXML metadata records in the second group were analyzed through a comparative-analytical approach. The records were published on an independent website (http://www.aghaabedi.com), and were introduced to Google and Yahoo! search engines directly. Then using search strategies, the indexability and ranking of the published metadata records were examined. Findings: findings show all the metadata element values were indexed by Google and Yahoo!, and all the metadata records were ranked in the search results. Based on the research, all the metadata records are retrievable in Web search engines environment by the element values. There was no significant difference between two groups’ indexing and ranking. Conclusion: Implementing metadata records in XML syntax improves the indexability of them. This feature helps users to retrieve the content objects by Web search engines, but does not affect the ranking of the metadata records and the DCXML and MARCXML records were ranked equally.

کلیدواژه‌ها [English]

  • DCMI
  • indexing and ranking
  • MARC21
  • XML
  • Web search engines

حریری، نجلا؛ طاهری، سید مهدی؛ فتاحی، سید رحمت‌الله؛ نوشین فرد، فاطمه (1392). میانکنش‌پذیری نظام­های فراداده‌ای و موتورهای کاوش وب: چالش‌ها و رویکردهای جاری. پژوهشنامه کتابداری و اطلاع‌رسانی، 3 (2)، 233-252.

شریف، عاطفه (1386). بررسی میزان اثر­بخشی عناصر ابر داده‌ای بر رتبه­بندی صفحات وب توسّط موتور­های کاوش. فصلنامه کتابداری و اطلاع‌رسانی، 10 (2)، 241-258.

طاهری، مهدی؛حریری، نجلا؛ فتاحی، رحمت­الله (1388). بررسی تطبیقی کیفیت نمایه‌سازی و رتبه‌بندی اشیای محتوایی حاوی عناصر فراداده‌ای هسته دوبلین و مارک 21 توسط موتورهای کاوش عمومی. فصلنامه کتابداری و اطلاع‌رسانی، 12(4)، 141-162.

طباطبایی امیری، فائزه السادات؛ طاهری، سید مهدی؛ فرج پهلو، حسین؛ عصاره، فریده؛ معرف زاده، عبدالحمید (1391). موتورهای کاوش وب، و نمایه‌سازی و رتبه‌بندی اشیای محتوایی حاوی عناصر فراداده‌ای در محیط‌های پویا. فصلنامه مدیریت و پردازش اطلاعات، 27، شماره 4،907-920.

فتاحی، رحمت‌الله؛ طاهری، سید مهدی (1388). فهرست‌نویسی رایانه‌ای:مفاهیم، شیوه‌ها، و کاربرد نرم‌افزارهای رایانه‌ای در سازمان‌دهی اطلاعات. تهران: کتابدار.

Berners-Lee, T (2006). Linked Data. Retrieved 05 Feb. 2015 from http://www.w3.org/DesignIssues/LinkedData.html.

Bifet, A., Castillo, C., Chirita, P. A., & Weber, I. (2005, April). An Analysis of Factors Used in Search Engine Ranking. In AIRWeb (pp. 48-57). Retrieved 14 June 2015 from http://airweb.cse.lehigh.edu/2005/bifet.pdf

Henshaw, R., & Valauskas, E. J. (2001). Metadata as a catalyst: experiments with metadata and search engines in the Internet journal, First monday. Libri, 51(2), 86-101.

Mohamed, K. A. (2006). The impact of metadata in web resources discovering. Online Information Review, 30(2), 155-167.

Quevedo-Torrero, J. U. (2004). Improving web retrieval by mining the HTML tags for keywords and exploring the hyperlink structures of web pages. Unpublished doctoral Dissertation, University of Houston. Retrieved March 25, 2009 from http://dl.acm.org/citation.cfm?id=1087297

Safari, M. (2005). Search Engines and Resource Discovery on the Web: Is Dublin Core an Impact Factor?. Webology. 2(2), 80-94.

Sokvitne, L. (2000). An evaluation of the effectiveness of current Dublin Core metadata for retrieval. In VALA Conference. Retrieved March 29, 2009 from www.vala.org.au/vala2000/2000pdf/Sokvitne.PDF.

Taheri, S.M., Hariri, N., & Fattahi, S.R. (2014). Using data island method for creating metadata records with indexability and visibility of tag names in web search engines. Library Hi Tech, 32(1), 83-97.

Turner, T. P., & Brackbill, L. (2011). Rising to the top: evaluating the use of the HTML meta tag to improve retrieval of World Wide Web documents through Internet search engines. Library resources & technical services, 42(4), 258-271.

Zhang, J., & Dimitroff, A. (2004). Internet search engines’ response to metadata Dublin Core implementation. Journal of Information Science, 30(4), 310-320.

Zhang, J., & Dimitroff, A. (2005a). The impact of webpage content characteristics on webpage visibility in search engine results (Part I). Information Processing & Management, 41(3), 665-690

Zhang, J., & Dimitroff, A. (2005b). The impact of metadata implementation on webpage visibility in search engine results (Part II). Information processing & management, 41(3), 691-715.