نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار، گروه علم اطلاعات و دانش شناسی، دانشگاه شهید بهشتی، تهران، ایران

2 پژوهشگاه بین المللی زلزله شناسی و مهندسی زلزله، تهران، ایران

3 کارشناس ارشد علم اطلاعات و دانش شناسی، دانشگاه شهید بهشتی، تهران،ایران

چکیده

این پژوهش با هـدف اصلـی ارائۀ الگـــوی پیشنهـــادی برای نرم‌افزار استخـــــراج و آرشیــو داده از رسانه‌هـای‌اجتماعـی تدوین شد. در پژوهش حاضر ضمن مطالعۀ کتابخانه‌ای درخصوص استخراج داده و آرشیوسازی رسانه‌های اجتماعی به بررسی نرم‌افزارهای تولید شده در این زمینه پرداخته شده است؛ در نهایت براساس سیاهه‌وارسی تهیه شده، یک الگوی پیشنهادی از این نوع نرم‌افزارها ارائه گردید. این روند با همراهی متخصصان رسانه‌های‌های اجتماعی در علم اطلاعات و دانش‌شناسی انجام گرفت. در این پژوهش، گردآوری اطلاعات، به روش مطالعة اسنادی و پیمایشی تحلیلی انجام شد. ابزار گردآوری اطلاعات پرسشنامه بود. با نمونه‌گیری هدفمند و رصد افراد مطلع، تعداد ۳۱ نفر از متخصصان رسانه‌های‌های ‌اجتماعی در علم اطلاعات و دانش‌شناسی انتخاب شدند. قابلیت‌های به‌دست آمده از نرم‌افزارها در قالب طیف لیکرت در اختیار متخصصان قرار گرفت و از آن‌ها خواسته شد که میزان موافقت خود را با ضرورت وجود هر یک از این قابلیت‌ها مشخص نمایند. برای بررسی بودن یا نبودن هر یک از قابلیت‌های نرم‌افزارها از روش سی‌وی‌آر[1]، بار عاملی اکتشافی و بار عاملی تأییدی استفاده شد. میزان پذیرش هریک از قابلیت‌ها، با میانه ارزیابی(معیار سنجش میانة 3) شد. سپس، هریک از گویه‌ها بر اساس میانگین موجود در آزمون فریدمن رتبه‌بندی شدند. در مرحلۀ دوم سی‌وی‌آر هر یک از قابلیت‌ها، و در مرحلۀ آخر بار عاملی تأییدی و بار عاملی اکتشافی بررسی شد. پرسش‌های پژوهش با استفاده از آزمون تی‌تک نمونه‌ای بررسی شدند. قابلیت‌های «امکان جستجوی پیشرفتۀ آرشیو»، «دسته‌بندی آرشیو‌ها(مرورآسان)» و «ارائۀگزارش‌های بصری» نمرۀ بالاتر از 50 و معیارهای «بازنشانی رکوردهای حذف شده»، «امکان ایجاد آرشیو باز برای دسترسی عام»، «اخذ گواهی‌های اعتباری از نهادهای دولتی و خصوصی»، «دریافت نسخۀ کامل پس از پرداخت هزینه» و «نسخۀ دمو» نمرۀ کمتر از 50 را در سی‌وی‌آر به‌دست آوردند. تمامی قابلیت‌ها بار عاملی تأییدی و اکتشافی بیشتر از 3/0 داشتند؛ بنابراین، در نظر گرفته شدند. اما با مقایسۀ بار عاملی قابلیت‌ها با سی‌وی‌آر امکان حذف قابلیت‌هایی با سی‌وی‌آر کمتر از 50 وجود دارد. تمامی قابلیت‌های تخصصی نرم‌افزارهای فعلی از دیدگاه متخصصان ضروری هستند. قابلیت‌های «امکان جستجوی پیشرفتۀ آرشیو»، «دسته‌بندی آرشیو‌ها (مرورآسان)» و «ارائۀگزارش‌های بصری» مهم‌ترین الزامات نرم‌افزارها ازدیدگاه متخصصان هستند. قابلیت «اخذ گواهی‌های اعتباری از نهادهای دولتی و خصوصی» کمترین اهمیت را از دید متخصصان دارد. معیارهای «حذف خودکار آرشیوها در زمان ‌تعریف شده»، «بازنشانی رکوردهای حذف شده»، «امکان ایجاد آرشیو باز برای دسترسی عام»، «اخذ گواهی‌های اعتباری از نهادهای دولتی و خصوصی»، «حذف خودکار آرشیوها در زمان ‌تعریف شده»، «دریافت نسخۀ کامل پس از پرداخت هزینه» و «نسخۀ دمو» می‌توانند از قابلیت‌های نرم‌افزار حذف شوند. البته در بررسی نرم‌افزارهای فعلی استخراج داده از رسانه‌های اجتماعی، مشاهده شد که برخی از این قابلیت‌ها دارای اهمیت بالایی است. قابلیت «امکان ذخیره سازی محلی» توسط متخصصان به سیاهه‌وارسی نهایی اضافه گردید.
 
[1] CVR

کلیدواژه‌ها

عنوان مقاله [English]

Suggested Prototype Software to Extract Data from Social Media

نویسندگان [English]

  • Amirreza Asnafi 1
  • Maryam Pakdaman Naeini 2
  • Samaneh Borji 3

1 Assistant Professor, Knowledge and Information Science Department, Shahid Beheshti University, Tehran, Iran

2 International Institute of Earthquake Engineering and Seismology, Tehran, Iran

3 M.A. of Knowledge and Information Science, Shahid Beheshti University, Tehran, Iran

چکیده [English]

In present paper social media archiving software were studied.  In this study, data gathering was done through documentary study and analytical survey.  To evaluate whether or not each software capability was used, the CIR method, the exploratory factor load, and the confirmatory factor load were used; the acceptance of each capability was assessed by a median (mid-range criterion 3). Then, each item was ranked based on the mean of the Friedman test. In the second stage, the CIR of each capability, and in the last stage, the confirmatory factor and the exploratory factor load. Research questions were analyzed using one-sample t-test. Advanced archive search capabilities, "archive categorization (easy browsing)" and "visual reporting" are the most important software requirements for experts. T Advanced archive search, archive categorization (easy browsing), and visual reporting capabilities are the most important software requirements for experts. The ability to "obtain credit certificates from public and private institutions" is of the least importance to experts. Criteria "Automatically delete archives at specified time", "Reset deleted records", "Open archive for public access", "Obtain credentials from public and private entities", "Automatically delete archives at defined time", "Get Version" Complete After Payments "and" Demo Version "can be removed from software capabilities. However, when looking at current data mining software from social networks, some of these capabilities are of great importance. Experts" local storage capability" was added to the final checklist.

کلیدواژه‌ها [English]

  • Data Extraction
  • Social Media
  • Social Media Archive
اصنافی، امیررضا .(1395). تأملی بر آرشیوسازی رسانه‌های اجتماعی. گنجینه اسناد، 102، 113.
ایروانچی، عارفه .(1394). روشی مستقل از معنا برای استخراج کلمه کلیدی داده‌های متنی کاربران در یک شبکه‌ اجتماعی. پایان‌نامه کارشناسی ارشد مهندسی کامپیوترگرایش نرم‌افزار. دانشکده فنی و مهندسی، دانشگاه علم و فرهنگ.
حبیب‌پورگتابی، کرم و صفری‌شالی، رضا. (۱۳۸۸). ‏‫راهنمای جامع کاربرد SPSS در تحقیقات پیمایشی: (تحلیل داده‌های کمی). تهران: لویه.
 
Allen, Dana. (2018). Collecting and using social media. IFLA WLIC 2018, august 26, 2018.
Archive Social Sofware. Accessed Jun/Jul 2019. From Archive Social website: http://www.ArchiveSocial.com
Archived White House Websites and Social Media. Accessed Jun/Jul 2019. From: https://www.obamalibrary.gov/research/archived-white-house-websites-and-social-media.
Banks, Marcus. (2009). Blog posts and tweets: the next frontier for grey literature. In: Farace, Dominic & Schopfel, Joachim, editors. Grey Literature in Library and Information Studies. Berlin: De Gruyter, :217-226.
Boyd ,danah m. Ellison, Nicole B. (2007). Social Network Sites: Definition, History, and Scholarship. Journal of Computer-Mediated Communication, 13)1( :210–230.
Brent, Lewers. (2013). Senior Policy Analyst Inland Revenue ,New Zealand Government Controller and AuditorGeneral, Learning from public entities’ use of social media, June 2013.
Butterfield, Andrew. Ngondi, Gerard Ekembe. Kerr ,Anne. (2016). Dictionary of Computer Science (7 ed.). Oxford University Press.
Castells, Manuel. (2007). Communication, Power and Counter-power in the Network Society. International Journal of Communication,1: 238-266.
Castells, Manuel. (2009). Communication Power. Oxford University Press.
Chen, Hsinchun. H. L. Chiang ,Roger. C. Storey ,Veda. (2012). Business intelligence and analytics: from big data to big impact. MIS Quarterly, 36(4), 1165-1188.
Diga, M., & Kelleher, T. (2009). Social media use, perceptions of decision-making power, and public relations roles. Public Relations Review, 35, 440–442.
digitalinformationworld. Accessed Jun/Jul 2019. From: https://www.digitalinformationworld.com/2019/01/most-popular-global-social-networks-apps-infographic.html.
Doane, David P.; & Seward, Lori E. (2011). Measuring Skewness: A Forgotten Statistic? Journal of Statistics Education, 19(2), 1-18.
DOMO(2018), Data Never Sleeps 5.0, from: https://www.domo.com/learn/data-never-sleeps-5.
Gripenberg, Pernilla. (2005). ICT and the shaping of society: Exploring human-ICT relationships in everyday life. (Ph.D. thesis) Helsinki: Edita Prima Ltd.
Harrower, N.; Heravi, B. R. (2015). How to Archive an Event: Reflections on the Social Repository of Ireland. New Review of Information Networking, 20(1-2), 104-116.
Hemphill, Libby. Leonard, Susan.H. Hedstrom, Margaret. (2018) Developinga Social Media ArchiveatI CPSR. WADL’18, June 2018, Fort Worth, Texas USA.
Huang, Z., & Benyoucef, M. (2013). User-centered investigation of social commerce design. Paper presented at the International Conference on Online Communities and Social Computing.
Kaplan, A. M., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities of Social Media. Business Horizons, 53(1), 59-68.
Kelly, B.; Hawksey, M.; O’Brien, J.; Guy, M.;Rowe, M. (2010). Twitter archiving using Twapper Keeper: technical and policy challenges. In 7th International Conference on Preservation of Digital Objects (iPRES 2010). University of Bath.
Kietzmann, J. H., Hermkens, K., McCarthy, I. P., & Silvestre, B. S. (2011). Social media? Get serious! Understanding the functional building blocks of social media. Business Horizons, 54(3), 241-251.
Latham, Ross. (2014). Information Management Advice 57 Managing Social Media Records Part 4: How to Capture Social Media Records, Tasmanian Archive+ Heritage Office, Issued: June 2014. From: https://www.informationstrategy.tas.gov.au.
LIU, Yili. YING, Xiangxiang. (2014). A Review of Social Network Sites: Definition, Experience and Applications. The Conference on Web Based Business Management.
Lyman, Peter. (2002). Archiving the World Wide Web. In Preserving Our Digital Heritage: Plan for the National Digital Information Infrastructure and Preservation Program. Washington, DC: Library of Congress.  Retrieved Dec 25, 2011. From: http://www.digitalpreservation.gov/about/ndiipp_appendix.pdf.
Mangus, Que. (2014). Why do I need to archive social media? Here are 4 good reasons! From: https://blog.microfocus.com/author/qmangus
Marr, Bernard. (2018). How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read.
Musser, L. (2016). Preserving the Digital Record of Science and Engineering: the Challenge of New Forms of Grey Literature. Issues in Science and Technology Librarianship. Retrieved From: http://istl.org/16-winter/short.html.
NARA (2010). A report on federal web 2.0 use and record value. Retrieved July 07, 2015, from NARA website: http://www.archives.gov/recordsmgmt/resources/web2.0-use.pdf
NARA. (2013). National Archives and Records Administration, White Paper on Best Practices for the Capture of Social Media Records. From NARA website: https://www.archives.gov/files/records-mgmt/resources/socialmediacapture.pdf
Page freezer Sofware. Accessed Jun/Jul 2019. From Page freezer website: https://www.pagefreezer.com/
Ringham, Larissa; Roman Amigo, Carolina. (2016). UBC Library Web Archiving 2016: Digital Projects Librarian at University of British Columbia Library. Retrieved From: http://www.slideshare.net/LarissaRingham/ubc-library-web-archiving2016?qid=2da7072b-2939-499d-bdf1-5c7d2f51a370&v=&b=&from_search=1.
Roy, Rishiraj Saha . Padmakumar, Aishwarya. Prasaad Jeganathan ,Guna. Kumaraguru ,Ponnurangam. (2015). Automated Linguistic Personalization of Targeted Marketing Messages Mining User-Generated Text on Social Media. Springer International Publishing Switzerland, CICLing 2015, Part II, LNCS 9042, 203-224.
Smarsh Sofware. Accessed Jun/Jul 2019. From Smarsh website: http://www.smarsh.com/
TAHO. (2014). Information Management Advice 57 Managing Social Media Records. Part 4: How to Capture Social Media Records ,Tasmanian Archive+ Heritage Office. From: https://www.informationstrategy.tas.gov.au.
The British Library. (2010). The British Library Collection Development Policy for Websites. Accessed 9 June 2016. From: http://www.bl.uk/reshelp/pdfs/modbritcdpwebsites.pdf.
Thompson, Dave. (2008). Archiving Web Resources. DCC | Digital Curation Manual, December 2008, Version 1.0.
Thomson, S. D.; Kilbride, W.(2015). Preserving Social Media: The Problem of Access. New Review of Information Networking. 20(1-2), 261-275.
‏‫Asnafi, Amirreza. (2015). A reflection on social media archiving. Ganjine-ye Asnad, 102, 113. [In Persian].
Habibpourgatabi, Karam and Safarishali, Reza. (2008). A comprehensive guide to the use of SPSS in survey research: (quantitative data analysis). Tehran: Looyeh. [In Persian].
Irvanchi, Arefeh. (2014). A semantic-independent method for keyword extraction of users' textual data in a social network. Thesis of master's degree in software engineering. Faculty of Technology and Engineering, University of Science and Culture. [In Persian].