سال 17، شماره 2 - ( فروردین - اردیبهشت 1402 )                   جلد 17 شماره 2 صفحات 160-150 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Danesh F, Rahimi F. Mining of Emerging trends of Covid-19 thematic areas in National and International publications. Iran J Med Microbiol 2023; 17 (2) :150-160
URL: http://ijmm.ir/article-1-1988-fa.html
دانش فرشید، رحیمی فروغ. داده کاوی متنی انتشارات کووید-19 به منظور کشف و استخراج روندهای نوظهور. مجله میکروب شناسی پزشکی ایران. 1402; 17 (2) :150-160

URL: http://ijmm.ir/article-1-1988-fa.html


1- استادیار علم اطلاعات، گروه مدیریت اطلاعات، مرکز منطقه ای اطلاع رسانی علوم و فناوری، شیراز، ایران
2- استادیار علم اطلاعات، گروه مدیریت اطلاعات، مرکز منطقه ای اطلاع رسانی علوم و فناوری، شیراز، ایران ، frahimi@ricest.ac.ir
متن کامل [PDF 2059 kb]   (555 دریافت)     |   چکیده (HTML)  (2240 مشاهده)
متن کامل:   (609 مشاهده)
مقدمه

باهمه گیر شدن ویروس کرونا در دسامبر 2019، دولت ها و نهادهای ملی و بین المللی در جهت پاسداشت رفاه حال مردم و به منظور مقابله با این ویروس خطرناک، ضمن اتخاذ خط مشی های درست، سرمایه گذاری دولتی، اعمال سیاستهای تشویقی و جهت گیری سیاسی مطلوب از تحقیقات مختلف در زمینه کرونا و پژوهش در زمینه کرونا به شدت حمایت کردند. اهمیت و ضرورت پرداختن به موضوعCOVID-19 پژوهشگران حوزه‌های موضوعی گوناگون علوم پزشکی را بر آن داشت که در زمینه ‏های گوناگون پژوهش‏ هایی را به‌منظور حل مسئله و ارائه راه‌کار در سراسر جهان اجرا کنند. برخی از پژوهش‏ ها به دنبال دستیابی به روش ‏های درمانی جدید بوده و بعضی دیگر در راستای کشف واکسن یا داروهای جدیدی که بتواند در درمانCOVID-19 به بیماران و مبتلایان جدید یاری رساند، انجام می شود (1 و 2).
افزون بر کمیت بالا و سرعت انتشارات حوزه موضوعی COVID-19، انتشارات علمی مذکور در برگیرنده‌ یافته ‏های مهم و کاربردی بوده که می‌تواند در حل مسئله COVID-19 در سطح ملی و بین ‏المللی نقش بسزایی ایفاء کند (3). اثر بخشی قابل‌ توجه انتشارات علمی مذکور، ضرورت تحلیل انتشارات و موضوعات علمی COVID-19 را بیش‌ از پیش آشکار می ‏سازد (4).
اکنون‌که جامعه بشری در پایان سومین سال از آغاز این پاندمی خطرناک که رو به افول نهاده، به سر می ‏برد؛ با مراجعه به معتبرترین پایگاه اطلاعاتی علوم پزشکیPubMed Central® (PMC)  (5) بیش از هزاران پژوهش در حوزه موضوعی COVID-19 نمایه شده در این پایگاه اطلاعاتی علوم پزشکی مشاهده می‏ شود. حجم بسیار بالای انتشارات معتبر COVID-19 در سراسر جهان علیرغم سیر نزولی مبتلایان و متوفیان کرونا، ضرورت پایش و تحلیل متون علمی COVID-19 را برای پژوهشگران در سطح خرد و برای سیاست‌گذاران و برنامه ‏ریزان در سطح کلان‌، بیش‌ از پیش آشکار می ‏سازد. به‌ بیان‌ دیگر، نتایج منتج از تحلیل مدارک منتشرشده COVID-19 با روش‏ ها و تکنیک‌های متن‏کاوی از جایگاه و اهمیت ویژه‏ای برای پژوهشگران، سیاست‌گذاران و برنامه ‏ریزان علوم پزشکی در سطح ملی و بین‏ المللی برخوردار است و ضرورت انجام چنین پژوهشی را بیش‌ از پیش آشکار می‌سازد.
نتایج این پژوهش برای پژوهشگران این حوزه در جهت انتخاب موضوعات پژوهش و انجام پژوهش‌های آتی بر اساس اولویت بسیار مفید است و می‌تواند از انتخاب پژوهش‌های موازی و اتلاف زمان و بودجه جلوگیری نماید. افزون بر این، سیاست‌گذاران این حوزه می‏توانند با کمک گرفتن از نتایج به‌دست‌آمده از پژوهش حاضر، اولویت‌های پژوهشی مفید و کارآمدی را بر اساس روند تغییرات واژگانی و موضوعات نوظهور، تعیین نمایند (3 و 6-9).
علاوه بر ضرورت ‏های مطرح‌ شده، مسئولان پژوهشی وزارت بهداشت درمان و آموزش پزشکی و ستاد ملی کرونا می ‏توانند ترندهای جهانی و ملی انتشارات بین ‏المللی را با موضوعات، محورها و ترندهای پژوهش‏ های ملی تطبیق داده و پاسخ این پرسش جدی به دست می ‏آید که آیا انتشارات و پژوهش‌های انجام‌شده توسط دانشمندان ایران COVID-19 هم‌جهت و هم‏راستا با پژوهش‌ها و انتشارات بین ‏المللی است؟

Research Questions

  1. مهم‌ترین کلیدواژه ‏های مورد استفاده در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟

  2. روند تغییرات واژگان بکار گرفته‌شده در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) چگونه است؟

  3. موضوعات نوظهور در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟

Literature Review
در پاندمی کووید19 مطالعات مختلفی با استفاده از فنون متن کاوی و الگوریتم های کلاسیفیکشن و کلاسترینگ جهت تحلیل متون منتشر شده مربوط به کووید-19 در انواع مختلف مدارک از جمله متون کاربران در شبکه های اجتماعی و یا متون انتشارات نمایه شده در پایگاه های اطلاعاتی پرداخته اند، از جمله ترن[1] و همکاران که در پژوهش خود با عنوان «مطالعات پاندمی کرونا ویروس جدید (COVID-19): تحلیل پیشینه‏ های جهانی» تعداد 5780 مورد از انتشارات COVID-19 تا اواسط سال 2020 را با روش متن‌کاوی، علم سنجی (هم‏ واژگانی) و تحلیل رگرسیون مورد بررسی قرار دادند. در این مقاله کشورها براساس میزان تولید ناخالص ملی[2] و گزارش بانک جهانی طبقه‌بندی شدند و 10 مدرک پراستناد هر کشور برای تحلیل شد. نتایج نشان داد که کشورهای آمریکا، چین و اتحادیه اروپا بیشترین تولید علم را دارند. مهم‌ترین موضوعات پژوهش‏ های بررسی شده عبارت بودند از: "Guidelines for emergency care and surgical"، "viral pathogenesis"، "global responses in the COVID-19 pandemic". تفاوت‏ های اساسی این مقاله با پژوهش حاضر در تفاوت در بازه زمانی، تعداد مدارک مورد بررسی، روش­شناسی و در نوع مدارک مورد بررسی و جامعیت در یافته ها است (11).
در مقاله‏ای دیگر، چنگ، کائو و لیائو[3] انتشارات کروناویروس را در سه بخش SARS، MERS و COVID-19 به کمک پایگاه COVID-19[4]، متن‌کاوی کردند. راهبرد جستجوی مورد استفاده در این پژوهش صرفاً با استفاده از چهار کلیدواژه طراحی شده بود که در مجموع 3440 مدرک را بازیابی نمود. نگاهی به یافته‏ های این مقاله حاکی از آن است که "infection"، "patient" و "case" بیشترین فراوانی را بین تمامی اصطلاحات در مدارک مورد بررسی به خود اختصاص داده‏ اند (12).
دوانوو و همکاران ویژگی‌های گسترش COVID-19 را در مجموعه داده‌های تحقیقاتی باز Covid-19 مطالعه و با استفاده از مدل‌سازی موضوعی آن‌ها را تجزیه و تحلیل کردند. نتایج مطالعه آنها هشت موضوع اصلی را برای ادبیات COVID-19 شناسایی کرد و نشان داد که محققان باید تحقیقات بیشتری در زمینه تشخیص، درمان، واکسن‌ها، ژنومیک ویروسی و پاتوژنز انجام دهند (13).
در پژوهش هان و همکاران، از روش‌ متن‌کاوی جهت تجزیه‌ و‌ تحلیل افکار و احساسات عمومی مردم چین درخصوص COVID-19 که در رسانه‌های اجتماعی و از جمله [5]Sina-Weibo منعکس شده بود، استفاده نمودند. براساس مدل تخصیص نهفته دیریکله و الگوریتم جنگل تصادفی[6]، یک مدل استخراج و طبقه‌بندی موضوع برای شناسایی سلسله مراتبی هفت موضوع مرتبط با COVID-19 و 13 موضوع فرعی[7] از متون Weibo شناسایی شد. توزیع فضایی Weibo مربوط به COVID-19 عمدتا در ووهان[8]، پکن-تیانجین-هبی[9]، دلتای رودخانه یانگ تسه[10]، دلتای رودخانه مروارید[11] و مجموعه شهری چنگدو-چونگکینگ[12] متمرکز بود. بیشترین موضوعات بیان شده مربوط به "opinion and sentiments" با نسبت 42/34 بود (14).
در پژوهشی دیگر، چایرسایر و پیندا-بریزائو[13] با تکنیک‌های متن‌کاوی و تحلیل شبکه‌های اجتماعی موضوع COVID-19 را در آمریکای لاتین مورد بررسی قرار دادند. پژوهش آنان در بازه زمانی ژانویه تا جولای در پایگاه‌هایی چون Scopus، ACM، Springer، IEEE Xplorer، MedrXiv، ArXiv و PubMed که بر موضوعات علوم رایانه و سلامت متمرکز هستند را، شامل می‌شد. نتایج همچنین نشان داد، جامعه علمی آمریکای جنوبی علاقه بیشتری به استفاده از هوش مصنوعی برای نظارت بر توسعه همه‌گیری COVID-19 در آمریکای جنوبی نسبت به آمریکای مرکزی و شمالی است (15).
آبدین، حامد و وو[14] در پژوهش خود با عنوان «برخورد با اینفودمیک COVID-19 در مقالات خبری و انتشارات دروغین...» به مانیتورینگ اطلاعات و پالایش و بهبود دانش با استفاده از الگوریتم NeoNet که الگوریتم یادگیری ماشین با نظارت جدیدی است پرداختند. آنان مقالات جدید خبری و مقالات جدید پزشکی مستخرج از پاب‌مد (انتشارات علمی، اخبار فیک و پست‌های رسانه‌های اجتماعی) را مورد بررسی و تجزیه‌ و‌ تحلیل قرار داده و به کلمات آنان برچسب اختصاص دادند. ویژگی‌های استخراج‌شده با استفاده از الگوریتم TF-IDF در پژوهش فوق عبارت بودند از "COVID-19"، "public health"، " world health"، " new coronavirus" و غیره. نتایج پژوهش آنان همچنین گسترش اطلاعات نادرست در سازمان خبری مهمی همچون "Daily Mail" را مشخص ساخت (16).
جعفری باقی آبادی و فرشید در پژوهشی به آشکارسازی موضوعات پژوهشی کووید 19 در پنج قاره بر اساس آثار نمایه شده در وب آو ساینس پرداخته و دریافتند که کشورهای آسیایی، اروپایی، آمریکایی، آفریقایی، استرالیا و اقیانوسیه به ترتیب در 608، 391، 301، 66 و 43 اثر مشارکت داشته اند. پس از کلیدواژه کووید 19، کلیدواژه های سارس، مرس و خورشید کلیدواژه ­های مشترک در پنج قاره هستند. پژوهشگران آسیایی بر مباحث اپیدمیولوژیک، پژوهشگران اروپایی بر مباحث بیولوژیکی و پژوهشگران آمریکایی بر مباحث اپیدمیولوژیک و ژنتیک متمرکز هستند. در مطالعات آسیایی "ذات الریه، میدان الکتریکی و ذات الریه"، در مطالعات اروپایی "خورشید، اشعه ایکس و سارس"، در مطالعات کشورهای آمریکایی "مرس، کهکشان ها و بیماری جانورآورد"، در مطالعات آفریقایی "حفاظت رعد و برق، مرس و مرس" و در مطالعات اقیانوسیه "مرس، مدیریت خطر و مرس" به ترتیب دارای بیشترین مرکزیت های رتبه، نزدیکی و بینابینی هستند (17).
دانش، داستانی و قربانی به مدل سازی مقالات جهانی کرونا در 50 سال گذشته پرداختند. یافته‌ها حاکی از آن است که مهم‌ترین کلیدواژه‌های مقالات جهانی ویروس کرونا عبارتند از SARS، علم، پروتئین، MERS، دامپزشکی، سلول، انسان، RNA، پزشکی و ویروس‌شناسی. همچنین هشت موضوع مهم در مقالات جهانی کرونا شناسایی شد (18).
مطالعات گذشته بر اهمیت بکارگیری فنون متن کاوی در تحلیل و دسته­بندی حجم عظیمی از متون تاکید دارند و به طور خاص مطالعه ای که به مقایسه و تحلیل واژگان مدارک مرتبط با کرونا در دنیا و ایران پرداخته باشد، مشاهده نشد. بنابراین با توجه به اهمیت مسئله پژوهش و نیز عدم مشاهده مطالعه مشابه ضرورت نگارش و انتشار این مقاله بیش از پیش احساس شد.


[1] Tran

[2] Gross domestic product

[3] Cheng, Cao & Liao

[4] https://cord19.aws/

[5] سیستم میکروبلاگینگ شبیه توئیتر در چین Twitter-like microblogging system

[6] Random Forests

[7] sub-topics

[8] Wuhan

[9] Beijing-Tianjin-Hebei

[10] Yangtze River Delta

[11] Pearl River Delta

[12] Chengdu-Chongqing urban agglomeration

[13] Chire Saire & Pineda-Briseño

[14] Abdeen, Hamed & Wu


 

مواد و روش ها

پژوهش حاضر از نوع کاربردی است و با استفاده از تکنیک های متن کاوی با رویکرد تحلیلی انجام شده است. جامعه پژوهش حاضر شامل کلیه انتشارات COVID-19 نمایه شده در پایگاه PubMed Central® (PMC) از نوامبر 2019 تا جولای 2021 است. این پایگاه از نظر پوشش یکی از گسترده ‏ترین و از نظر اعتبار یکی از معتبرترین پایگاه اطلاعاتی علوم پزشکی جهان است (5). PubMed Central® (PMC)، در June 10, 2021 به منظور استخراج داده های داده ‏های انتشارات بین المللی و ایرانی COVID-19 جستجو گردید. داده های انتشارات بین المللی و ایرانی کووید19 به طور جداگانه استخراج گردید. داده ها در قالب فایل مدلاین استخراج شد و در ادامه با استفاده از Science Space[1] جهت انجام تجزیه و تحلیل ‏های متن‌کاوی به CSV تبدیل گردید. 157719 رکورد داده‏ های انتشارات بین المللی  COVID-19 و 3143 رکورد داده‏ های انتشارات ایرانی کووید-19 استخراج شد. برای هر کدام از رکوردهای انتشارات COVID-19 فیلدهای عنوان و چکیده جهت انجام فرآیند متن‏کاوی مورد استفاده قرار گرفتند. به منظور تحلیل داده های این مطالعه از فنون متن کاوی استفاده گردید، عملیات متن کاوی مورد استفاده در سه مرحله "پیش پردازش متن"، "تجزیه و تحلیل متن" و "تفسیر نتایج" انجام شده است (19).
در ابتدا برای انجام فرایند متن کاوی عنوان، چکیده و کلیدواژه های هر کدام از انتشارات بازیابی شده، با همدیگر ادغام شدند. سپس عملیات پیش پردازش و پاکسازی داده‌ها در جهت افزایش کیفیت داده‌ها، اعتبار الگوها و روابط استخراج شده بر روی داده های مطالعه اعمال گردید (20).

 

شکل 1- فرآیند متن‏کاوی در قالب یک مدل مفهومی کلی (21)


جهت انجام عملیات پیش پردازش مراحل زیر انجام شد:
حذف نویسه های غیر مهم مانند فضاهای خالی اضافی، تگ های قالب بندی متن، حذف نویسه های غیر الفبایی شامل حذف علائم نگارشی یا اعداد از متن؛ شکستن اجزای متن به کلمات و واژه‌ها؛ تبدیل حروف بزرگ به کوچک جهت یکدست سازی متن؛ یکدست سازی واژگان های مترادف و هم معنی به واژه ارجح؛ یکدست سازی اشکال مختلف واژگان نیز از روش lemmatization که شامل جایگزینی کلمات یا شکل پایه یا فرهنگ لغتی  آن به‌جای فرم های صرف شده کلمات است (22) و حذف stop words و کلماتی که برای بازیابی یا تجزیه‌ و تحلیل اسناد ارزشی ندارند، مانند حروف ربط و حروف اضافه (and، the، of، for) که محتوای اطلاعاتی کم ارزشی دارند.
 با توجه به مدل‏سازی موضوعی انجام گرفته روی داده ها (18)، با توجه به وزن اختصاص یافته به هر موضوع، نوظهور بودن هر کدام از موضوعات به تفکیک انتشارات ملی و بین ‏المللی در بازه زمانی مورد مطالعه، بررسی و مشخص گردید. در نهایت موضوعاتی که روند رشد بیشتری داشته اند به عنوان موضوعات نوظهور انتخاب گردیدند.
جهت مشخص نمودن موضوعات نوظهور براساس موضوعات بدست آمده از مدل سازی موضوعی، میانگین وزنی موضوعات در هر کدام از موضوعات بدست‌آمد[2]و در طول دوره مورد بررسی از نوامبر 2019 تا ژوئن 2021 (20 ماه) در نمودارهای جداگانه براساس موضوع‏ های هفتگانه در سطح بین‏ المللی و ملی برای انتشارات COVID-19 ترسیم شد و موضوعات نوظهور بر اساس تغییر میانگین وزنی موضوعات در طول زمان مقایسه و مشخص گردید. لازم به ذکر است که در الگوریتم مدل‌سازی موضوعی برای هر سند مورد بررسی (در این پژوهش انتشارات علمی ملی و بین ‏المللی COVID-19) در هر کدام از موضوعات، وزنی تعلق می‌گیرد و اسناد در موضوع ‏هایی دسته‌بندی می‌گردد که دارای بیشترین وزن باشد (23).


[1] http://medialab.github.io/sciencescape/medline_utils

[2] . در مدلسازی موضوعی LDA به هر سند در هر کدام از موضوعات براساس میزان شباهت به هر موضوع ضریبی اختصاص داده می شود.  سپس این سند در هر کدام از موضوعاتی که بیشترین ضریب را داشته باشد به همان موضوع تخصیص داده می شود. بر همین اساس تمامی اسناد در داخل موضوعات دارای ضریب وزنی هستند. در این پژوهش میانگین ضرایب اسنادی که در هر موضوع و در هر سال وجود دارد، بدست آمده است. سپس روند سالیانه ضرایب هر موضوع در سالهای متوالی نشان داده شده است.


 

یافته ها

روند انتشارات بین‏ المللی کروناویروس‌
 داده‏ های مندرج در شکل 1روند تولید علم جهانی کروناویروس‌ در بازۀ زمانی 1970 تا 2019 در پایگاهWOS  را نشان می‏ دهد.

 

مهم‌ترین واژه ‏های مورد‌ استفاده در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID 19 در پایگاه PubMed Central® (PMC)
در جدول 1، ده واژه مهم و پرکاربرد براساس وزن‏دهی TF-IDF در انتشارات علمی ملی و جهانی COVID-19 نشان داده شده است. داده ها حاکی از آن است که covid با وزن 132.45، “infect” با وزن 94.81 و cell با وزن 89.50 از مهم‌ترین واژگان بکار رفته در انتشارات بین‌المللی COVID-19 هستند. تحلیل داده‏های مربوط به مهم‌ترین کلیدواژه‏های مورد استفاده در انتشارات علمی ملی قلمرو موضوعی COVID-19 نشان داد که patient با وزن 31.77، SARS-Cov با وزن 22.52 و covid با وزن 19.36 مهم‌ترین واژگان بکار رفته در انتشارات ملی COVID-19 هستند.

جدول 1. مهم‌ترین واژه‏ های مورد استفاده در انتشارات ملی و بین ‏المللی COVID-19

TF-IDF

Keywords of international publications

TF-IDF

Keywords of national publications

رتبه

132.45

Covid

31.77

Patient

1

94.81

Infect

22.52

SARS-Cov

2

89.50

Cell

19.36

Covid

3

85.65

Immune

17.75

Infect

4

84.22

Response

16.77

Case

5

82.21

Express

16.21

Model

6

81.00

Lung

16.06

Pandemic

7

75.29

Disease

15.87

Disease

8

74.98

Active

15.83

Virus

9

73.04

Protein

15.21

Treatment


در شکل 2 نیز مهم‌ترین واژگان بکار رفته در متون مرتبط با کرونا در انتشارات ملی و بین المللی، در قالب ابر واژگان نشان داده است.

Figure 2.Word cloud of the most significant words used in international (left) and national (right) COVID-19 articles Figure 2.Word cloud of the most significant words used in international (left) and national (right) COVID-19 articles

شکل 2: ابر واژگان مهم‌ترین واژگان بکاررفته در انتشارات ملی (چپ) و بین‌المللی (راست) COVID-19


روند تغییرات واژه‌های بکار گرفته‌ شده در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) طی سالهای 2019 تا 2021
با توجه به تک رقمی بودن تعداد انتشارات ملی در ماه ‏های نوامبر و دسامبر 2019 ، امکان وزن دهی براساس TF-IDF و بررسی روند تغییرات واژگان وجود نداشت؛ بنابراین برای سال 2019، مهمترین واژگان انتشارات بین ‏المللی در ماه ‏های مذکور بررسی شده است. در ادامه برای سال 2020  و شش ماهه نخست 2021 انتشارات ملی و بین‏ المللی COVID-19 تحلیل شده و روند تغییرات واژه ‏های مورد استفاده بهصورت ماهانه استخراج و پس از تجمیع به صورت سالانه گزارش شده است.

روند تغییرات واژگان بکار رفته در انتشارات بین ‏المللی COVID-19 در نوامبر و دسامبر 2019

 

Figure 3.Most significant words used in international COVID-19 articles in November (left) and December (right) 2019 Figure 3.Most significant words used in international COVID-19 articles in November (left) and December (right) 2019

شکل 3: مهم‌ترین واژگان بکار رفته در انتشارات بین ‏المللی COVID-19 در نوامبر (چپ) و دسامبر (راست) 2019


بررسی شکل 3 حاکی از آن است “mers-cov” و “infect” با وزن 0.63، “Viru” با وزن 0.54 و “active” با وزن 0.52 مهم‌ترین واژگان مورد استفاده در انتشارات بین‏المللی COVID-19 در نوامبر 2019 و “viru” با وزن 0.54، “respons” با وزن 0.50 و “sadscov” و “noise” مشترکاً با وزن 0.49 مهم‌ترین واژگان مورد استفاده در انتشارات بین‏المللی COVID-19 در دسامبر 2019 محسوب می‏شوند (شکل 3).

Figure 4. Word cloud of international COVID-19 articles in November (left) and December (right) 2019. Figure 4. Word cloud of international COVID-19 articles in November (left) and December (right) 2019.

شکل 4. ابر واژگان انتشارات بین‏ المللی COVID-19 در نوامبر و دسامبر 2019


واژگان بکار رفته در انتشارات بین‏المللی و ملی COVID-19 در 2020

به‌منظور بررسی و مقایسه منطقی ‏تر روند تغییرات مهم‌ترین واژگان استفاده شده در انتشارات بین ‏المللی و ملی COVID-19 در سال 2020، نتایج تحلیل داده‏ ها در این سال، در قالب نمودار و ابر واژگان در کنار یکدیگر قرار گرفته است. به بیان دیگر، نمودار و ابر واژگان مربوط به انتشارات بین‏ المللی در سمت راست قرار گرفته و با نمودار با رنگ قهوه ‏ای نشان داده‏ شده است. در مقابل به‌منظور نشان دادن انتشارات در سطح ملی نمودار رنگ آبی و ابر واژگان سمت چپ ترسیم گردیده که نشان دهنده مهمترین واژه ‏های به کار رفته در انتشارات بین ‏المللی و ملی در سال 2020 است.
 

Figure 5. Most significant words employed in international (right) and national (left) COVID-19 articles in 2020 Figure 5. Most significant words employed in international (right) and national (left) COVID-19 articles in 2020

شکل 5. مهم‌ترین واژگان بکار رفته در انتشارات بین ‏المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2020


داده ‏های‏ شکل 5 مهم‌ترین واژه ‏های به کار رفته در انتشارات بین ‏المللی و ملی COVID-19 در سال 2020 براساس وزن‏دهی TF-IDF را نشان می ‏دهد. Covid با وزن 7.32، “sarscov” با وزن 6.33 و “infection” با وزن 5.3 مهم‌ترین واژه ‏های مورد استفاده در انتشارات بین ‏المللی COVID-19 در سال 2020 هستند. واژگان “Patient” با وزن 1.99، “sarscov” با وزن 1.42 و “infection” با وزن 1.02 مهم‌ترین واژه ‏های به کار رفته در انتشارات ملی COVID-19 در سال 2020 به شمار می‏ آید.

Figure 6. Words used in international (right) and national (left) COVID-19 articles in 2020. Figure 6. Words used in international (right) and national (left) COVID-19 articles in 2020.

شکل 6. واژگان بکار رفته در انتشارات بین‏ المللی و ملی COVID-19 در 2020


روند تغییرات مهم‌ترین واژگان استفاده شده در انتشارات بین‏المللی و ملی COVID-19 در سال 2021، در قالب نمودار و ابر واژگان در ادامه آمده است.

Figure 7. Most significant words used in international (right) and national (left) COVID-19 articles in 2021. Figure 7. Most significant words used in international (right) and national (left) COVID-19 articles in 2021.

شکل 7. مهم‌ترین واژگان بکار رفته در انتشارات بین ‏المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2021


داده ‏های‏ شکل 7 مهم‌ترین واژه‏ های به کار رفته در انتشارات بین ‏المللی و ملی COVID-19 در سال 2021 بر اساس وزن‏ دهی TF-IDF را نشان می‏ دهد. Covid با وزن 8.85، “Sarscov” با وزن 7.23 و “Patient” با وزن 6.35 مهم‌ترین واژه ‏های مورد استفاده در انتشارات بین‏ المللی COVID-19 در شش ماهه اول سال 2021 هستند. افزون بر این، “Patient” با وزن 2.99، “Covid” با وزن 1.87 و “Sarscov” با وزن 1.72 مهم‌ترین واژه ‏های به کار رفته در انتشارات ملی COVID-19 در سال 2021 به شمار می ‏آید.

Figure. 8. Word cloud of international (right) and national (left) COVID-19 articles in 2021. Figure. 8. Word cloud of international (right) and national (left) COVID-19 articles in 2021.

شکل 8. ابر واژگان انتشارات بین‏ المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2021


موضوعات نوظهور در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟
به‌منظور پاسخ به این پرسش و تعیین موضوعات نوظهور، روند انتشارات بین ‏المللی و ملی در موضوع ‏های هفت گانه به دست آمده از اجرای الگوریتم مدل‌سازی موضوعی LDA (مقاله در دست چاپ) مورد مطالعه بیشتر قرار گرفت. در جدول 3، نوظهور بودن یا نبودن هر یک از موضوعات هفتگانه مشخص شده است.

 

جدول 3. موضوعات نوظهور در انتشارات علمی بین ‏المللی و ملی حوزه موضوعی

Row

International Subject

Emerging Subject

Row

National (Iran) Subject

Emerging Subject

1

Diagnostic Tests

No

1

COVID-19 and molecular structure

No

2

COVID Proteins: Vaccine and Antibody Response

No

2

Social and Mental Status

Yes

3

Vaccine Immunogenicity

Yes

3

Treatment

No

4

Other

No

4

Other

No

5

Social and technology in COVID-19

Yes

5

Application of artificial intelligence

No

6

Covid Complication

No

6

Clinical features

No

7

Covid & immune system

No

7

Vaccine

No


بررسی تغییرات میانگین وزنی انتشارات بین‏المللی COVID-19 در هر یک از قلمروهای موضوعی هفتگانه که در جدول بالا آمده است، بیانگر این امر است که برخی از موضوعات دارای روند افزایشی بوده و برخی روند کاهشی داشته اند که در این میان دو موضوع Vaccine Immunogenicity و  Social and technology in COVID-19 در زمره موضوعات نوظهور انتشارات علمی بین‏المللی COVID-19 قرار گرفتند.

 

Figure 9. Change trend of the average weight (%) of the emerging topics of Figure 9. Change trend of the average weight (%) of the emerging topics of

شکل 9. روند تغییر میانگین وزنی (بر حسب درصد) موضوعات نوظهور Vaccine Immunogenicity و Social and technology in COVID-19 در انتشارات بین المللی


در سطح انتشارات کشور ایران، یافته ها نشان داد که صرفا موضوع Social and mental status in COVID-19 در زمره موضوعات نوظهور مقالات محققان ایرانی است.

Figure. 10. Change trend of the monthly average weight (%) of the national articles on COVID-19 related to  
شکل 10. روند تغییر میانگین وزنی (بر حسب درصد) ماهیانه انتشارات ملی COVID-19 با موضوع Social and Mental Status


 

بحث

نتایج این پژوهش مهم‌ترین واژگان بکار رفته در انتشارات علمی COVID-19 بین‌المللی و ملی بر اساس وزن TF-IDF تا ژوئن 2021، را نشان داده است. نتایج نشان داد که "respons"، "immune"، "cell"، "infect" و "Covid" مهم‌ترین و پرکاربردترین واژگان در انتشارات علمی بین‌المللی COVID-19 بوده است. واژگان "case" و"infect", "Covid", "sarscov","Patient" مهم‌ترین و پرکاربردترین واژگان در انتشارات علمی ایران در زمینه COVID-19 بوده است. نگاهی به وجه اشتراک نتایج بدست آمده، نشان می دهد که واژه‏ های "infect" و "Covid" در انتشارات بین ‏المللی و ایران مشترک هستند. افزون براین، تنوع موضوعی واژه‏ های پرتکرار نشان از دامنه وسیع تاثیرات این ایپدمی خطرناک و تحت تأثیر قرار گرفتن رشته ‏ها و زیر‏شاخه ‏های مختلف علوم پزشکی مانند ایمونولوژی و میکروبیولوژی در راستای رفع معضل COVID-19 است.
درنیک[1] و همکاران (2021)، واژگان "patient"، "infect"، "disease"، "case"و "pandem"، حقانی و همکاران (2020) واژگان "human*"، "Coronavirus infection*"، "viral pneumonia"، دناوو[2] و همکاران (2020) نیز واژگان "case"، "coronavirus"، "pandemic"، "patient" و "Covid"، چنگ[3] و همکاران (2020) واژگان "study"، "infection"، "number"، "case" و "patient" را به عنوان واژگان مهم و متداول در ادبیات حوزه کروناویروس معرفی نمودند. این در حالی است که گوپتا و همکاران (2021) ضمن شناسایی مهم‌ترین کلیدواژه ‏های انتشارات علمی COVID-19، انتظار داشتند «ماسک» و «تجهیزات حفاظت شخصی» کلیدواژه‌های پرتکرار باشند؛ اما نتایج این موضوع را تأیید نکرد. واژگان و کلمات کلیدی بکار رفته در انتشارات حوزه COVID-19، بیانگر پیچیدگی و گستردگی این حوزه علمی است و نشان‌دهنده شمول رشته‌های مختلف در انتشارات COVID-19 است (حسین[4] و همکاران، 2020).
روند تغییرات مهمترین واژگان حوزه COVID-19، در انتشارات ملی و بین ‏المللی هم‏راستا با اتفاقات و رویدادهای مهم علمی بوده است. مطالعه نتایج مربوط به روند بیست ‏ماهه انتشارات بین ‏المللی حاکی از آن است که در چهارده ماه از نخستین سال 2020 تا ژوئن 2021، واژه “Covid” در جایگاه نخست قرار گرفته است. این در حالی است که در خصوص انتشارات ایران در طول هجده ماه بجای بیست ماه، واژه "patient" و سپس "sarscov"و "covid" دارای بیشترین کاربرد بوده ‏اند. به عبارت دیگر تمرکز مطالعات پژوهشگران ایرانی، بر روی بیماران بستری در بیمارستان ها و سپس خود ویروس بوده است؛ در حالی که در مطالعات بین المللی، تمرکز تحقیقات بر ویروس کرونا و عفونت های ناشی از آن بوده است. گوپتا و همکاران (2021) روند تغییرات واژه ‏های COVID-19 را به صورت هفتگی و چایرسایر و پیندا-بریزائو (2021) نیز روند تغییرات واژگان در مناطق آمریکای لاتین را بررسی کرده ‏اند. نتایج حاصل از مطالعه آنان با نتایج کسب شده از این پژوهش هم‌خوانی دارد.
نتایج پژوهش حاضر حاکی از آن است که موضوع «Vaccine Immunogenicity» در انتشارات علمی بین المللی COVID-19، موضوع نو‌ظهوری محسوب می‌شود و در شش ماهه اول سال 2021، رشد زیادی را نسبت به اوایل همه‌گیری داشته است. قدرت ایمنی‌زایی در برابر ویروس، شاخصه مهم و اصلی یک واکسن است. در بحث توان و قدرت واکسن در ایجاد ایمنی جمعی و مصونیت افراد هر چه ایمنی‌زایی واکسن بیشتر باشد، قطعا کارایی و اثربخشی آن نیز بیشتر خواهد بود. این حوزه موضوعی نوظهور، پژوهشگران را در کنترل بهتر پاندمی یاری رسانده و مبنای اساسی در مطالعات حوزه واکسن COVID-19 قلمداد گردد.
موضوع نوظهور دیگر در سطح بین المللی، «جامعه و فناوری در COVID-19» است که تأثیر کاربرد فناوری ‏های نوین پزشکی در کارآزمایی‏ های بالینی و تولید انبوه واکسن، نمود عینی اهمیت و توجه به این موضوع است. در واقع به مدد فناوری نوین نرم افزاری و سخت افزاری پزشکی در ظرف مدت چندین هفته تمامی مراحل تولید نخستین واکسن COVID-19 با موفقیت طی شده و واکسن مذکور روانه بازار گردید. افزون بر بخش‏ های پژوهشی و تولیدی، بخش درمانی و مراقبت‏ های بهداشتی و بیمارستانی مرتبط با COVID-19 به‏ طور قابل ملاحظه ‏ای از ابزارها و فناوری ‏های نوین پزشکی در درمان بیماران مبتلا به COVID-19 بهره ‏برده‏اند.
در سطح انتشارات ایران، ارتقاء میانگین وزنی به بیش از 20 درصد در شش ماهه اول سال 2021، منجر به نوظهور شدن موضوع « Social and Mental Status» گردید. از جمله دلایل اهمیت یافتن این موضوع و انتشار مقالات متعدد در این زمینه، شاید بتوان به اثرات و آسیب ‏های روانی در سطح کلان و در سطح خرد در جامعه و خانواده ‏ها از جمله افزایش برخوردها و مشاجره‏ های بین والدین و فرزندان و خود زوجین در زمان قرنطینه اشاره کرد. در زمینه اجتماعی، فرهنگ جوامع گوناگون در برخورد با این بیماری، میزان پذیرش و پیشگیری و یا عدم پذیرش و انکار از جمله مواردی است که در سطح مقالات به آن پرداخته شده است.
از آنجا که داده ‏های پژوهش مربوط به ژوئن 2021 است، با توجه به سرعت قابل توجه تولیدات علمی COVID-19 در عرصه ملی و به خصوص بین ‏المللی، ممکن است نتایج و تحلیل ‏های ارائه شده در زمان حاضر جدید بودن خود را از دست داده باشد.

محدودیت ها و پیشنهادهای پژوهش
سرعت انتشارات و تولید علم در حوزه موضوعی کرونا بسیار بالا است. به گونه ای که طی یک سال گذشته، بیش از 200 هزار منبع به پایگاه PMC افزوده شده است. همین امر ضرورت تکرار این پژوهش در دوره‏های زمانی گوناگون را بیش از پیش می نماید.
انجام مطالعه ای جامع براساس داده‌های پایگاه های استنادی وب علوم و اسکوپوس، متن‏کاوی متون به روشی غیر از TF-IDF، از جمله آنالیز احساسات[5] و استخراج نظرات حوزه‌های مطالعاتی و عقیده‌کاوی[6] از جمله پیشنهادات کاربردی پژوهش حاضر است.


[1] Dornick

[2] Doanvo

[3] Cheng

[4] Hossain

[5] Sentiment analysis

[6] opinion mining


 

نتیجه گیری

در مجموع می توان چنین نتیجه گیری کرد که با توجه به شیوع گسترده COVID-19 در جهان و مطالعات گسترده در سطح دنیا جهت یافتن روش‌های درمانی یا کشف واکسن و داروهای جدید برای مقابله با این ویروس، آگاهی و شناخت نتایج این گونه مطالعات در حیطه موضوعات راهبردی همانند پاندمی COVID-19 می‌تواند برای پژوهشگران و سیاست‌گذاران عرصه بهداشت و درمان جهت تصمیم‌گیری بهتر و ارائه نقشه دانشی و مطالعاتی در زمینه این ویروس، مفید واقع گردد و آنان را در ارائه راهکارهای اثر بخش و تصمیم‌گیری بهینه، راهنمایی نماید. پژوهش‌ها به‌ درستی نشان می‌دهد که مطالعات جهانی بیشتر توسط کشورهای توسعه‌ یافته ارائه شده است. از آنجایی که کشور‌های فوق از زیر‌ساخت‌های بهتر و به‌روزتری در حوزه پزشکی مولکولار، واکسن و تولید دارو برخوردارند، متناسب با بروز بیماری، مطالعات خود را هدف‌دار در جهت «حل مساله» که همان «کنترل پاندمی کرونا از طریق ایجاد ایمنی جمعی توسط واکسن است»، متمرکز می‌نمایند و اکثر مطالعات آن‌ها که در مبحث اصلی «واکسیناسیون» می‌گنجد، طبقه‌بندی شده است. این در حالی است که تمرکز مطالعات پژوهشگران ایرانی بر بیماران کرونایی و عوارض ناشی از بیماری، بوده است.

 

سپاسگزاری

مقاله حاضر برگرفته از طرح پژوهشی با عنوان «شناسایی مدل‌های موضوعی و طبقه‌بندی مقالات علمی ملی و بین‌المللی کووید-۱۹ با استفاده از روش متن کاوی» مصوب معاونت پژوهش و فناوری مرکز منطقه‌ای اطلاع‌رسانی علم و فناوری است.


تعارض در منافع

در انجام مطالعه حاضر، نویسندگان هیچ‌گونه تضاد منافعی نداشته‌اند.

 

نوع مطالعه: مقاله پژوهشی | موضوع مقاله: تحلیل علم‌سنجی
دریافت: 1401/9/22 | پذیرش: 1401/12/9 | انتشار الکترونیک: 1402/1/10

فهرست منابع
1. Cui X, Wang P, Wei Z. Emergency use of COVID-19 vaccines recommended by the World Health Organization (WHO) as of June 2021. Drug Discov Ther. 2021;15(4):222-4. [DOI:10.5582/ddt.2021.01064] [PMID]
2. Saeidnia H, Mohammadzadeh Z, Saeidnia M, Mahmoodzadeh A, Ghorbani N, Hasanzadeh M. Identifying Requirements of a Self-care System on Smartphones for Preventing Coronavirus Disease 2019 (COVID-19). Iran J Med Microbiol. 2020;14(3):241-51. [DOI:10.30699/ijmm.14.3.241]
3. Danesh F, Ghavidel S. Coronavirus: Scientometrics of 50 Years of Global Scientific Productions. Iran J Med Microbiol. 2020;14(1):1-16. [DOI:10.30699/ijmm.14.1.1]
4. Shehata A, El Dakar M, Salem N, editors. Top COVID-19 100 vaccine papers: An Altmetric study. 2021 22nd International Arab Conference on Information Technology (ACIT); 2021. [DOI:10.1109/ACIT53391.2021.9677241] [PMID] [PMCID]
5. Falagas ME, Pitsouni EI, Malietzis GA, Pappas G. Comparison of PubMed, Scopus, Web of Science, and Google Scholar: strengths and weaknesses. FASEB J. 2008;22(2):338-42. [DOI:10.1096/fj.07-9492LSF] [PMID]
6. Cheng X, Shuai C, Liu J, Wang J, Liu Y, Li W, et al. Topic modelling of ecology, environment and poverty nexus: An integrated framework. Agric Ecosyst Environ. 2018;267:1-14. [DOI:10.1016/j.agee.2018.07.022]
7. Jelodar H, Wang Y, Yuan C, Feng X, Jiang X, Li Y, et al. Latent Dirichlet allocation (LDA) and topic modeling: models, applications, a survey. Multimed Tools Appl. 2019;78(11):15169-211. [DOI:10.1007/s11042-018-6894-4]
8. O'Callaghan D, Greene D, Carthy J, Cunningham P. An analysis of the coherence of descriptors in topic modeling. Expert Syst Appl. 2015;42(13):5645-57. [DOI:10.1016/j.eswa.2015.02.055]
9. Steyvers M, Griffiths T. Probabilistic topic models. Handbook of latent semantic analysis. 15 ed: Psychology Press; 2007. p. 439-60.
10. Meskarpour Amiri M, Nasiri T, Mehdizadeh P. Subjects clustering analysis and science mapping on COVID-19 researches in scopus database. J Mil Med. 2020;22(6):663-9.
11. Tran BX, Ha GH, Nguyen LH, Vu GT, Hoang MT, Le HT, et al. Studies of novel coronavirus disease 19 (COVID-19) pandemic: a global analysis of literature. Int J Environ Res Public Health. 2020;17(11):4095. [DOI:10.3390/ijerph17114095] [PMID] [PMCID]
12. Cheng X, Cao Q, Liao SS. An overview of literature on COVID-19, MERS and SARS: Using text mining and latent Dirichlet allocation. J Inf Sci. 2022;48(3):304-20. [DOI:10.1177/0165551520954674] [PMCID]
13. Doanvo A, Qian X, Ramjee D, Piontkivska H, Desai A, Majumder M. Machine Learning Maps Research Needs in COVID-19 Literature. Patterns. 2020;1(9):100123. [DOI:10.1016/j.patter.2020.100123] [PMID] [PMCID]
14. Han X, Wang J, Zhang M, Wang X. Using social media to mine and analyze public opinion related to COVID-19 in China. Int J Environ Res Public Health. 2020;17(8):2788. [DOI:10.3390/ijerph17082788] [PMID] [PMCID]
15. Chire Saire J, Pineda-Briseño A. Text Mining for Covid-19 Analysis in Latin America. Artif Intell. 2021:257-94. [DOI:10.1007/978-3-030-69744-0_16]
16. Abdeen MAR, Hamed AA, Wu X. Fighting the COVID-19 Infodemic in News Articles and False Publications: The NeoNet Text Classifier, a Supervised Machine Learning Algorithm. Appl Sci. 2021;11(16):7265. [DOI:10.3390/app11167265]
17. Jafari Baghiabadi S, Razieh F. Studying of Research Related to COVID-19 Vaccine in Iran and the World: A Thematic Analysis and Scientific Collaborations. Iran J Med Microbiol. 2021;15(4):414-57. [DOI:10.30699/ijmm.15.4.414]
18. Danesh F, Dastani M, Ghorbani M. Retrospective and prospective approaches of coronavirus publications in the last half-century: a Latent Dirichlet allocation analysis. Libr Hi Tech. 2021;39(3):855-72. [DOI:10.1108/LHT-09-2020-0216]
19. Žižka J, Dařena F, Svoboda A. Text mining with machine learning: principles and techniques: Crc Press; 2019. [DOI:10.1201/9780429469275]
20. Rehurek R, Sojka P. Software framework for topic modelling with large corpora. Proceedings of the LREC workshop on new challenges for NLP frameworks: Citeseer; 2010.
21. Kim YM, Delen D. Medical informatics research trend analysis: A text mining approach. Health Informatics J. 2018;24(4):432-52. [DOI:10.1177/1460458216678443] [PMID]
22. Malaterre C, Lareau F, Pulizzotto D, St-Onge J. Eight journals over eight decades: a computational topic-modeling approach to contemporary philosophy of science. Synthese. 2021;199(1):2883-923. [DOI:10.1007/s11229-020-02915-6]
23. Danesh F, Dastani M. Application of Artificial Intelligence for Discovering the Subject Classes of National Publications Based on International Publications: COVID-19 Publications. Digit Health. under review; 2023.
24. Dornick C, Kumar A. Seidenberger S, Seidle E, Mukherjee P. Analysis of Patterns and Trends in COVID-19 Research. Procedia Comput Sci; 2021 [DOI:10.1016/j.procs.2021.05.032]
25. Haghani M, Bliemer MCJ, Goerlandt F, Li J. The scientific literature on Coronaviruses, COVID-19 and its associated safety-related research dimensions: A scientometric analysis and scoping review. Saf Sci. 2020;129:104806. [DOI:10.1016/j.ssci.2020.104806] [PMID] [PMCID]
26. Gupta A, Aeron S, Agrawal A, Gupta H. Trends in COVID-19 publications: streamlining research using NLP and LDA. Front digit health. 2021;3:686720. [DOI:10.3389/fdgth.2021.686720] [PMID] [PMCID]
27. Hossain MM. Current status of global research on novel coronavirus disease (Covid-19): A bibliometric analysis and knowledge mapping. F1000Research. 2020(9):374. [DOI:10.12688/f1000research.23690.1]
28. Mullard A. COVID-19 vaccine development pipeline gears up. Lancet. 2020;395(10239):1751-2. [DOI:10.1016/S0140-6736(20)31252-6] [PMID]
29. Farahati M. Psychological impacts of the spread of coronavirus in society. Soc impact assess. 2020(2):207-5.
30. Haleem A, Javaid M, Vaishya R, Deshmukh SG. Areas of academic research with the impact of COVID-19. Am J Emerg Med. 2020;38(7):1524-6. [DOI:10.1016/j.ajem.2020.04.022] [PMID] [PMCID]

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به مجله میکروب شناسی پزشکی ایران می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق   ناشر: موسسه فرنام

© 2024 CC BY-NC 4.0 | Iranian Journal of Medical Microbiology

Designed & Developed by : Yektaweb Publishr: Farname Inc.