باهمه گیر شدن ویروس کرونا در دسامبر 2019، دولت ها و نهادهای ملی و بین المللی در جهت پاسداشت رفاه حال مردم و به منظور مقابله با این ویروس خطرناک، ضمن اتخاذ خط مشی های درست، سرمایه گذاری دولتی، اعمال سیاستهای تشویقی و جهت گیری سیاسی مطلوب از تحقیقات مختلف در زمینه کرونا و پژوهش در زمینه کرونا به شدت حمایت کردند. اهمیت و ضرورت پرداختن به موضوعCOVID-19 پژوهشگران حوزههای موضوعی گوناگون علوم پزشکی را بر آن داشت که در زمینه های گوناگون پژوهش هایی را بهمنظور حل مسئله و ارائه راهکار در سراسر جهان اجرا کنند. برخی از پژوهش ها به دنبال دستیابی به روش های درمانی جدید بوده و بعضی دیگر در راستای کشف واکسن یا داروهای جدیدی که بتواند در درمانCOVID-19 به بیماران و مبتلایان جدید یاری رساند، انجام می شود (1 و 2).
افزون بر کمیت بالا و سرعت انتشارات حوزه موضوعی COVID-19، انتشارات علمی مذکور در برگیرنده یافته های مهم و کاربردی بوده که میتواند در حل مسئله COVID-19 در سطح ملی و بین المللی نقش بسزایی ایفاء کند (3). اثر بخشی قابل توجه انتشارات علمی مذکور، ضرورت تحلیل انتشارات و موضوعات علمی COVID-19 را بیش از پیش آشکار می سازد (4).
اکنونکه جامعه بشری در پایان سومین سال از آغاز این پاندمی خطرناک که رو به افول نهاده، به سر می برد؛ با مراجعه به معتبرترین پایگاه اطلاعاتی علوم پزشکیPubMed Central® (PMC) (5) بیش از هزاران پژوهش در حوزه موضوعی COVID-19 نمایه شده در این پایگاه اطلاعاتی علوم پزشکی مشاهده می شود. حجم بسیار بالای انتشارات معتبر COVID-19 در سراسر جهان علیرغم سیر نزولی مبتلایان و متوفیان کرونا، ضرورت پایش و تحلیل متون علمی COVID-19 را برای پژوهشگران در سطح خرد و برای سیاستگذاران و برنامه ریزان در سطح کلان، بیش از پیش آشکار می سازد. به بیان دیگر، نتایج منتج از تحلیل مدارک منتشرشده COVID-19 با روش ها و تکنیکهای متنکاوی از جایگاه و اهمیت ویژهای برای پژوهشگران، سیاستگذاران و برنامه ریزان علوم پزشکی در سطح ملی و بین المللی برخوردار است و ضرورت انجام چنین پژوهشی را بیش از پیش آشکار میسازد.
نتایج این پژوهش برای پژوهشگران این حوزه در جهت انتخاب موضوعات پژوهش و انجام پژوهشهای آتی بر اساس اولویت بسیار مفید است و میتواند از انتخاب پژوهشهای موازی و اتلاف زمان و بودجه جلوگیری نماید. افزون بر این، سیاستگذاران این حوزه میتوانند با کمک گرفتن از نتایج بهدستآمده از پژوهش حاضر، اولویتهای پژوهشی مفید و کارآمدی را بر اساس روند تغییرات واژگانی و موضوعات نوظهور، تعیین نمایند (3 و 6-9).
علاوه بر ضرورت های مطرح شده، مسئولان پژوهشی وزارت بهداشت درمان و آموزش پزشکی و ستاد ملی کرونا می توانند ترندهای جهانی و ملی انتشارات بین المللی را با موضوعات، محورها و ترندهای پژوهش های ملی تطبیق داده و پاسخ این پرسش جدی به دست می آید که آیا انتشارات و پژوهشهای انجامشده توسط دانشمندان ایران COVID-19 همجهت و همراستا با پژوهشها و انتشارات بین المللی است؟
Research Questions
مهمترین کلیدواژه های مورد استفاده در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟
روند تغییرات واژگان بکار گرفتهشده در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) چگونه است؟
موضوعات نوظهور در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟
Literature Review
در پاندمی کووید19 مطالعات مختلفی با استفاده از فنون متن کاوی و الگوریتم های کلاسیفیکشن و کلاسترینگ جهت تحلیل متون منتشر شده مربوط به کووید-19 در انواع مختلف مدارک از جمله متون کاربران در شبکه های اجتماعی و یا متون انتشارات نمایه شده در پایگاه های اطلاعاتی پرداخته اند، از جمله ترن[1] و همکاران که در پژوهش خود با عنوان «مطالعات پاندمی کرونا ویروس جدید (COVID-19): تحلیل پیشینه های جهانی» تعداد 5780 مورد از انتشارات COVID-19 تا اواسط سال 2020 را با روش متنکاوی، علم سنجی (هم واژگانی) و تحلیل رگرسیون مورد بررسی قرار دادند. در این مقاله کشورها براساس میزان تولید ناخالص ملی[2] و گزارش بانک جهانی طبقهبندی شدند و 10 مدرک پراستناد هر کشور برای تحلیل شد. نتایج نشان داد که کشورهای آمریکا، چین و اتحادیه اروپا بیشترین تولید علم را دارند. مهمترین موضوعات پژوهش های بررسی شده عبارت بودند از: "Guidelines for emergency care and surgical"، "viral pathogenesis"، "global responses in the COVID-19 pandemic". تفاوت های اساسی این مقاله با پژوهش حاضر در تفاوت در بازه زمانی، تعداد مدارک مورد بررسی، روششناسی و در نوع مدارک مورد بررسی و جامعیت در یافته ها است (11).
در مقالهای دیگر، چنگ، کائو و لیائو[3] انتشارات کروناویروس را در سه بخش SARS، MERS و COVID-19 به کمک پایگاه COVID-19[4]، متنکاوی کردند. راهبرد جستجوی مورد استفاده در این پژوهش صرفاً با استفاده از چهار کلیدواژه طراحی شده بود که در مجموع 3440 مدرک را بازیابی نمود. نگاهی به یافته های این مقاله حاکی از آن است که "infection"، "patient" و "case" بیشترین فراوانی را بین تمامی اصطلاحات در مدارک مورد بررسی به خود اختصاص داده اند (12).
دوانوو و همکاران ویژگیهای گسترش COVID-19 را در مجموعه دادههای تحقیقاتی باز Covid-19 مطالعه و با استفاده از مدلسازی موضوعی آنها را تجزیه و تحلیل کردند. نتایج مطالعه آنها هشت موضوع اصلی را برای ادبیات COVID-19 شناسایی کرد و نشان داد که محققان باید تحقیقات بیشتری در زمینه تشخیص، درمان، واکسنها، ژنومیک ویروسی و پاتوژنز انجام دهند (13).
در پژوهش هان و همکاران، از روش متنکاوی جهت تجزیه و تحلیل افکار و احساسات عمومی مردم چین درخصوص COVID-19 که در رسانههای اجتماعی و از جمله [5]Sina-Weibo منعکس شده بود، استفاده نمودند. براساس مدل تخصیص نهفته دیریکله و الگوریتم جنگل تصادفی[6]، یک مدل استخراج و طبقهبندی موضوع برای شناسایی سلسله مراتبی هفت موضوع مرتبط با COVID-19 و 13 موضوع فرعی[7] از متون Weibo شناسایی شد. توزیع فضایی Weibo مربوط به COVID-19 عمدتا در ووهان[8]، پکن-تیانجین-هبی[9]، دلتای رودخانه یانگ تسه[10]، دلتای رودخانه مروارید[11] و مجموعه شهری چنگدو-چونگکینگ[12] متمرکز بود. بیشترین موضوعات بیان شده مربوط به "opinion and sentiments" با نسبت 42/34 بود (14).
در پژوهشی دیگر، چایرسایر و پیندا-بریزائو[13] با تکنیکهای متنکاوی و تحلیل شبکههای اجتماعی موضوع COVID-19 را در آمریکای لاتین مورد بررسی قرار دادند. پژوهش آنان در بازه زمانی ژانویه تا جولای در پایگاههایی چون Scopus، ACM، Springer، IEEE Xplorer، MedrXiv، ArXiv و PubMed که بر موضوعات علوم رایانه و سلامت متمرکز هستند را، شامل میشد. نتایج همچنین نشان داد، جامعه علمی آمریکای جنوبی علاقه بیشتری به استفاده از هوش مصنوعی برای نظارت بر توسعه همهگیری COVID-19 در آمریکای جنوبی نسبت به آمریکای مرکزی و شمالی است (15).
آبدین، حامد و وو[14] در پژوهش خود با عنوان «برخورد با اینفودمیک COVID-19 در مقالات خبری و انتشارات دروغین...» به مانیتورینگ اطلاعات و پالایش و بهبود دانش با استفاده از الگوریتم NeoNet که الگوریتم یادگیری ماشین با نظارت جدیدی است پرداختند. آنان مقالات جدید خبری و مقالات جدید پزشکی مستخرج از پابمد (انتشارات علمی، اخبار فیک و پستهای رسانههای اجتماعی) را مورد بررسی و تجزیه و تحلیل قرار داده و به کلمات آنان برچسب اختصاص دادند. ویژگیهای استخراجشده با استفاده از الگوریتم TF-IDF در پژوهش فوق عبارت بودند از "COVID-19"، "public health"، " world health"، " new coronavirus" و غیره. نتایج پژوهش آنان همچنین گسترش اطلاعات نادرست در سازمان خبری مهمی همچون "Daily Mail" را مشخص ساخت (16).
جعفری باقی آبادی و فرشید در پژوهشی به آشکارسازی موضوعات پژوهشی کووید 19 در پنج قاره بر اساس آثار نمایه شده در وب آو ساینس پرداخته و دریافتند که کشورهای آسیایی، اروپایی، آمریکایی، آفریقایی، استرالیا و اقیانوسیه به ترتیب در 608، 391، 301، 66 و 43 اثر مشارکت داشته اند. پس از کلیدواژه کووید 19، کلیدواژه های سارس، مرس و خورشید کلیدواژه های مشترک در پنج قاره هستند. پژوهشگران آسیایی بر مباحث اپیدمیولوژیک، پژوهشگران اروپایی بر مباحث بیولوژیکی و پژوهشگران آمریکایی بر مباحث اپیدمیولوژیک و ژنتیک متمرکز هستند. در مطالعات آسیایی "ذات الریه، میدان الکتریکی و ذات الریه"، در مطالعات اروپایی "خورشید، اشعه ایکس و سارس"، در مطالعات کشورهای آمریکایی "مرس، کهکشان ها و بیماری جانورآورد"، در مطالعات آفریقایی "حفاظت رعد و برق، مرس و مرس" و در مطالعات اقیانوسیه "مرس، مدیریت خطر و مرس" به ترتیب دارای بیشترین مرکزیت های رتبه، نزدیکی و بینابینی هستند (17).
دانش، داستانی و قربانی به مدل سازی مقالات جهانی کرونا در 50 سال گذشته پرداختند. یافتهها حاکی از آن است که مهمترین کلیدواژههای مقالات جهانی ویروس کرونا عبارتند از SARS، علم، پروتئین، MERS، دامپزشکی، سلول، انسان، RNA، پزشکی و ویروسشناسی. همچنین هشت موضوع مهم در مقالات جهانی کرونا شناسایی شد (18).
مطالعات گذشته بر اهمیت بکارگیری فنون متن کاوی در تحلیل و دستهبندی حجم عظیمی از متون تاکید دارند و به طور خاص مطالعه ای که به مقایسه و تحلیل واژگان مدارک مرتبط با کرونا در دنیا و ایران پرداخته باشد، مشاهده نشد. بنابراین با توجه به اهمیت مسئله پژوهش و نیز عدم مشاهده مطالعه مشابه ضرورت نگارش و انتشار این مقاله بیش از پیش احساس شد.
[1] Tran
[2] Gross domestic product
[3] Cheng, Cao & Liao
[5] سیستم میکروبلاگینگ شبیه توئیتر در چین Twitter-like microblogging system
[6] Random Forests
[7] sub-topics
[8] Wuhan
[9] Beijing-Tianjin-Hebei
[10] Yangtze River Delta
[11] Pearl River Delta
[12] Chengdu-Chongqing urban agglomeration
[13] Chire Saire & Pineda-Briseño
[14] Abdeen, Hamed & Wu
پژوهش حاضر از نوع کاربردی است و با استفاده از تکنیک های متن کاوی با رویکرد تحلیلی انجام شده است. جامعه پژوهش حاضر شامل کلیه انتشارات COVID-19 نمایه شده در پایگاه PubMed Central® (PMC) از نوامبر 2019 تا جولای 2021 است. این پایگاه از نظر پوشش یکی از گسترده ترین و از نظر اعتبار یکی از معتبرترین پایگاه اطلاعاتی علوم پزشکی جهان است (5). PubMed Central® (PMC)، در June 10, 2021 به منظور استخراج داده های داده های انتشارات بین المللی و ایرانی COVID-19 جستجو گردید. داده های انتشارات بین المللی و ایرانی کووید19 به طور جداگانه استخراج گردید. داده ها در قالب فایل مدلاین استخراج شد و در ادامه با استفاده از Science Space[1] جهت انجام تجزیه و تحلیل های متنکاوی به CSV تبدیل گردید. 157719 رکورد داده های انتشارات بین المللی COVID-19 و 3143 رکورد داده های انتشارات ایرانی کووید-19 استخراج شد. برای هر کدام از رکوردهای انتشارات COVID-19 فیلدهای عنوان و چکیده جهت انجام فرآیند متنکاوی مورد استفاده قرار گرفتند. به منظور تحلیل داده های این مطالعه از فنون متن کاوی استفاده گردید، عملیات متن کاوی مورد استفاده در سه مرحله "پیش پردازش متن"، "تجزیه و تحلیل متن" و "تفسیر نتایج" انجام شده است (19).
در ابتدا برای انجام فرایند متن کاوی عنوان، چکیده و کلیدواژه های هر کدام از انتشارات بازیابی شده، با همدیگر ادغام شدند. سپس عملیات پیش پردازش و پاکسازی دادهها در جهت افزایش کیفیت دادهها، اعتبار الگوها و روابط استخراج شده بر روی داده های مطالعه اعمال گردید (20).
شکل 1- فرآیند متنکاوی در قالب یک مدل مفهومی کلی (21)
جهت انجام عملیات پیش پردازش مراحل زیر انجام شد:
حذف نویسه های غیر مهم مانند فضاهای خالی اضافی، تگ های قالب بندی متن، حذف نویسه های غیر الفبایی شامل حذف علائم نگارشی یا اعداد از متن؛ شکستن اجزای متن به کلمات و واژهها؛ تبدیل حروف بزرگ به کوچک جهت یکدست سازی متن؛ یکدست سازی واژگان های مترادف و هم معنی به واژه ارجح؛ یکدست سازی اشکال مختلف واژگان نیز از روش lemmatization که شامل جایگزینی کلمات یا شکل پایه یا فرهنگ لغتی آن بهجای فرم های صرف شده کلمات است (22) و حذف stop words و کلماتی که برای بازیابی یا تجزیه و تحلیل اسناد ارزشی ندارند، مانند حروف ربط و حروف اضافه (and، the، of، for) که محتوای اطلاعاتی کم ارزشی دارند.
با توجه به مدلسازی موضوعی انجام گرفته روی داده ها (18)، با توجه به وزن اختصاص یافته به هر موضوع، نوظهور بودن هر کدام از موضوعات به تفکیک انتشارات ملی و بین المللی در بازه زمانی مورد مطالعه، بررسی و مشخص گردید. در نهایت موضوعاتی که روند رشد بیشتری داشته اند به عنوان موضوعات نوظهور انتخاب گردیدند.
جهت مشخص نمودن موضوعات نوظهور براساس موضوعات بدست آمده از مدل سازی موضوعی، میانگین وزنی موضوعات در هر کدام از موضوعات بدستآمد[2]و در طول دوره مورد بررسی از نوامبر 2019 تا ژوئن 2021 (20 ماه) در نمودارهای جداگانه براساس موضوع های هفتگانه در سطح بین المللی و ملی برای انتشارات COVID-19 ترسیم شد و موضوعات نوظهور بر اساس تغییر میانگین وزنی موضوعات در طول زمان مقایسه و مشخص گردید. لازم به ذکر است که در الگوریتم مدلسازی موضوعی برای هر سند مورد بررسی (در این پژوهش انتشارات علمی ملی و بین المللی COVID-19) در هر کدام از موضوعات، وزنی تعلق میگیرد و اسناد در موضوع هایی دستهبندی میگردد که دارای بیشترین وزن باشد (23).
[1] http://medialab.github.io/sciencescape/medline_utils
[2] . در مدلسازی موضوعی LDA به هر سند در هر کدام از موضوعات براساس میزان شباهت به هر موضوع ضریبی اختصاص داده می شود. سپس این سند در هر کدام از موضوعاتی که بیشترین ضریب را داشته باشد به همان موضوع تخصیص داده می شود. بر همین اساس تمامی اسناد در داخل موضوعات دارای ضریب وزنی هستند. در این پژوهش میانگین ضرایب اسنادی که در هر موضوع و در هر سال وجود دارد، بدست آمده است. سپس روند سالیانه ضرایب هر موضوع در سالهای متوالی نشان داده شده است.
روند انتشارات بین المللی کروناویروس
داده های مندرج در شکل 1روند تولید علم جهانی کروناویروس در بازۀ زمانی 1970 تا 2019 در پایگاهWOS را نشان می دهد.
مهمترین واژه های مورد استفاده در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID 19 در پایگاه PubMed Central® (PMC)
در جدول 1، ده واژه مهم و پرکاربرد براساس وزندهی TF-IDF در انتشارات علمی ملی و جهانی COVID-19 نشان داده شده است. داده ها حاکی از آن است که “covid” با وزن 132.45، “infect” با وزن 94.81 و “cell” با وزن 89.50 از مهمترین واژگان بکار رفته در انتشارات بینالمللی COVID-19 هستند. تحلیل دادههای مربوط به مهمترین کلیدواژههای مورد استفاده در انتشارات علمی ملی قلمرو موضوعی COVID-19 نشان داد که “patient” با وزن 31.77، “SARS-Cov” با وزن 22.52 و “covid” با وزن 19.36 مهمترین واژگان بکار رفته در انتشارات ملی COVID-19 هستند.
جدول 1. مهمترین واژه های مورد استفاده در انتشارات ملی و بین المللی COVID-19
TF-IDF |
Keywords of international publications |
TF-IDF |
Keywords of national publications |
رتبه |
132.45 |
Covid |
31.77 |
Patient |
1 |
94.81 |
Infect |
22.52 |
SARS-Cov |
2 |
89.50 |
Cell |
19.36 |
Covid |
3 |
85.65 |
Immune |
17.75 |
Infect |
4 |
84.22 |
Response |
16.77 |
Case |
5 |
82.21 |
Express |
16.21 |
Model |
6 |
81.00 |
Lung |
16.06 |
Pandemic |
7 |
75.29 |
Disease |
15.87 |
Disease |
8 |
74.98 |
Active |
15.83 |
Virus |
9 |
73.04 |
Protein |
15.21 |
Treatment |
|
در شکل 2 نیز مهمترین واژگان بکار رفته در متون مرتبط با کرونا در انتشارات ملی و بین المللی، در قالب ابر واژگان نشان داده است.
شکل 2: ابر واژگان مهمترین واژگان بکاررفته در انتشارات ملی (چپ) و بینالمللی (راست) COVID-19
روند تغییرات واژههای بکار گرفته شده در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) طی سالهای 2019 تا 2021
با توجه به تک رقمی بودن تعداد انتشارات ملی در ماه های نوامبر و دسامبر 2019 ، امکان وزن دهی براساس TF-IDF و بررسی روند تغییرات واژگان وجود نداشت؛ بنابراین برای سال 2019، مهمترین واژگان انتشارات بین المللی در ماه های مذکور بررسی شده است. در ادامه برای سال 2020 و شش ماهه نخست 2021 انتشارات ملی و بین المللی COVID-19 تحلیل شده و روند تغییرات واژه های مورد استفاده بهصورت ماهانه استخراج و پس از تجمیع به صورت سالانه گزارش شده است.
روند تغییرات واژگان بکار رفته در انتشارات بین المللی COVID-19 در نوامبر و دسامبر 2019
شکل 3: مهمترین واژگان بکار رفته در انتشارات بین المللی COVID-19 در نوامبر (چپ) و دسامبر (راست) 2019
بررسی شکل 3 حاکی از آن است “mers-cov” و “infect” با وزن 0.63، “Viru” با وزن 0.54 و “active” با وزن 0.52 مهمترین واژگان مورد استفاده در انتشارات بینالمللی COVID-19 در نوامبر 2019 و “viru” با وزن 0.54، “respons” با وزن 0.50 و “sadscov” و “noise” مشترکاً با وزن 0.49 مهمترین واژگان مورد استفاده در انتشارات بینالمللی COVID-19 در دسامبر 2019 محسوب میشوند (شکل 3).
شکل 4. ابر واژگان انتشارات بین المللی COVID-19 در نوامبر و دسامبر 2019
واژگان بکار رفته در انتشارات بینالمللی و ملی COVID-19 در 2020
بهمنظور بررسی و مقایسه منطقی تر روند تغییرات مهمترین واژگان استفاده شده در انتشارات بین المللی و ملی COVID-19 در سال 2020، نتایج تحلیل داده ها در این سال، در قالب نمودار و ابر واژگان در کنار یکدیگر قرار گرفته است. به بیان دیگر، نمودار و ابر واژگان مربوط به انتشارات بین المللی در سمت راست قرار گرفته و با نمودار با رنگ قهوه ای نشان داده شده است. در مقابل بهمنظور نشان دادن انتشارات در سطح ملی نمودار رنگ آبی و ابر واژگان سمت چپ ترسیم گردیده که نشان دهنده مهمترین واژه های به کار رفته در انتشارات بین المللی و ملی در سال 2020 است.
شکل 5. مهمترین واژگان بکار رفته در انتشارات بین المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2020
داده های شکل 5 مهمترین واژه های به کار رفته در انتشارات بین المللی و ملی COVID-19 در سال 2020 براساس وزندهی TF-IDF را نشان می دهد. “Covid” با وزن 7.32، “sarscov” با وزن 6.33 و “infection” با وزن 5.3 مهمترین واژه های مورد استفاده در انتشارات بین المللی COVID-19 در سال 2020 هستند. واژگان “Patient” با وزن 1.99، “sarscov” با وزن 1.42 و “infection” با وزن 1.02 مهمترین واژه های به کار رفته در انتشارات ملی COVID-19 در سال 2020 به شمار می آید.
شکل 6. واژگان بکار رفته در انتشارات بین المللی و ملی COVID-19 در 2020
روند تغییرات مهمترین واژگان استفاده شده در انتشارات بینالمللی و ملی COVID-19 در سال 2021، در قالب نمودار و ابر واژگان در ادامه آمده است.
شکل 7. مهمترین واژگان بکار رفته در انتشارات بین المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2021
داده های شکل 7 مهمترین واژه های به کار رفته در انتشارات بین المللی و ملی COVID-19 در سال 2021 بر اساس وزن دهی TF-IDF را نشان می دهد. “Covid” با وزن 8.85، “Sarscov” با وزن 7.23 و “Patient” با وزن 6.35 مهمترین واژه های مورد استفاده در انتشارات بین المللی COVID-19 در شش ماهه اول سال 2021 هستند. افزون بر این، “Patient” با وزن 2.99، “Covid” با وزن 1.87 و “Sarscov” با وزن 1.72 مهمترین واژه های به کار رفته در انتشارات ملی COVID-19 در سال 2021 به شمار می آید.
شکل 8. ابر واژگان انتشارات بین المللی (سمت راست) و ملی (سمت چپ) COVID-19 در سال 2021
موضوعات نوظهور در انتشارات علمی بین المللی و ملی حوزه موضوعی COVID-19 در پایگاه PubMed Central® (PMC) کدامند؟
بهمنظور پاسخ به این پرسش و تعیین موضوعات نوظهور، روند انتشارات بین المللی و ملی در موضوع های هفت گانه به دست آمده از اجرای الگوریتم مدلسازی موضوعی LDA (مقاله در دست چاپ) مورد مطالعه بیشتر قرار گرفت. در جدول 3، نوظهور بودن یا نبودن هر یک از موضوعات هفتگانه مشخص شده است.
جدول 3. موضوعات نوظهور در انتشارات علمی بین المللی و ملی حوزه موضوعی
Row |
International Subject |
Emerging Subject |
Row |
National (Iran) Subject |
Emerging Subject |
1 |
Diagnostic Tests |
No |
1 |
COVID-19 and molecular structure |
No |
2 |
COVID Proteins: Vaccine and Antibody Response |
No |
2 |
Social and Mental Status |
Yes |
3 |
Vaccine Immunogenicity |
Yes |
3 |
Treatment |
No |
4 |
Other |
No |
4 |
Other |
No |
5 |
Social and technology in COVID-19 |
Yes |
5 |
Application of artificial intelligence |
No |
6 |
Covid Complication |
No |
6 |
Clinical features |
No |
7 |
Covid & immune system |
No |
7 |
Vaccine |
No |
بررسی تغییرات میانگین وزنی انتشارات بینالمللی COVID-19 در هر یک از قلمروهای موضوعی هفتگانه که در جدول بالا آمده است، بیانگر این امر است که برخی از موضوعات دارای روند افزایشی بوده و برخی روند کاهشی داشته اند که در این میان دو موضوع Vaccine Immunogenicity و Social and technology in COVID-19 در زمره موضوعات نوظهور انتشارات علمی بینالمللی COVID-19 قرار گرفتند.
شکل 9. روند تغییر میانگین وزنی (بر حسب درصد) موضوعات نوظهور Vaccine Immunogenicity و Social and technology in COVID-19 در انتشارات بین المللی
در سطح انتشارات کشور ایران، یافته ها نشان داد که صرفا موضوع Social and mental status in COVID-19 در زمره موضوعات نوظهور مقالات محققان ایرانی است.
شکل 10. روند تغییر میانگین وزنی (بر حسب درصد) ماهیانه انتشارات ملی COVID-19 با موضوع Social and Mental Status
نتایج این پژوهش مهمترین واژگان بکار رفته در انتشارات علمی COVID-19 بینالمللی و ملی بر اساس وزن TF-IDF تا ژوئن 2021، را نشان داده است. نتایج نشان داد که "respons"، "immune"، "cell"، "infect" و "Covid" مهمترین و پرکاربردترین واژگان در انتشارات علمی بینالمللی COVID-19 بوده است. واژگان "case" و"infect", "Covid", "sarscov","Patient" مهمترین و پرکاربردترین واژگان در انتشارات علمی ایران در زمینه COVID-19 بوده است. نگاهی به وجه اشتراک نتایج بدست آمده، نشان می دهد که واژه های "infect" و "Covid" در انتشارات بین المللی و ایران مشترک هستند. افزون براین، تنوع موضوعی واژه های پرتکرار نشان از دامنه وسیع تاثیرات این ایپدمی خطرناک و تحت تأثیر قرار گرفتن رشته ها و زیرشاخه های مختلف علوم پزشکی مانند ایمونولوژی و میکروبیولوژی در راستای رفع معضل COVID-19 است.
درنیک[1] و همکاران (2021)، واژگان "patient"، "infect"، "disease"، "case"و "pandem"، حقانی و همکاران (2020) واژگان "human*"، "Coronavirus infection*"، "viral pneumonia"، دناوو[2] و همکاران (2020) نیز واژگان "case"، "coronavirus"، "pandemic"، "patient" و "Covid"، چنگ[3] و همکاران (2020) واژگان "study"، "infection"، "number"، "case" و "patient" را به عنوان واژگان مهم و متداول در ادبیات حوزه کروناویروس معرفی نمودند. این در حالی است که گوپتا و همکاران (2021) ضمن شناسایی مهمترین کلیدواژه های انتشارات علمی COVID-19، انتظار داشتند «ماسک» و «تجهیزات حفاظت شخصی» کلیدواژههای پرتکرار باشند؛ اما نتایج این موضوع را تأیید نکرد. واژگان و کلمات کلیدی بکار رفته در انتشارات حوزه COVID-19، بیانگر پیچیدگی و گستردگی این حوزه علمی است و نشاندهنده شمول رشتههای مختلف در انتشارات COVID-19 است (حسین[4] و همکاران، 2020).
روند تغییرات مهمترین واژگان حوزه COVID-19، در انتشارات ملی و بین المللی همراستا با اتفاقات و رویدادهای مهم علمی بوده است. مطالعه نتایج مربوط به روند بیست ماهه انتشارات بین المللی حاکی از آن است که در چهارده ماه از نخستین سال 2020 تا ژوئن 2021، واژه “Covid” در جایگاه نخست قرار گرفته است. این در حالی است که در خصوص انتشارات ایران در طول هجده ماه بجای بیست ماه، واژه "patient" و سپس "sarscov"و "covid" دارای بیشترین کاربرد بوده اند. به عبارت دیگر تمرکز مطالعات پژوهشگران ایرانی، بر روی بیماران بستری در بیمارستان ها و سپس خود ویروس بوده است؛ در حالی که در مطالعات بین المللی، تمرکز تحقیقات بر ویروس کرونا و عفونت های ناشی از آن بوده است. گوپتا و همکاران (2021) روند تغییرات واژه های COVID-19 را به صورت هفتگی و چایرسایر و پیندا-بریزائو (2021) نیز روند تغییرات واژگان در مناطق آمریکای لاتین را بررسی کرده اند. نتایج حاصل از مطالعه آنان با نتایج کسب شده از این پژوهش همخوانی دارد.
نتایج پژوهش حاضر حاکی از آن است که موضوع «Vaccine Immunogenicity» در انتشارات علمی بین المللی COVID-19، موضوع نوظهوری محسوب میشود و در شش ماهه اول سال 2021، رشد زیادی را نسبت به اوایل همهگیری داشته است. قدرت ایمنیزایی در برابر ویروس، شاخصه مهم و اصلی یک واکسن است. در بحث توان و قدرت واکسن در ایجاد ایمنی جمعی و مصونیت افراد هر چه ایمنیزایی واکسن بیشتر باشد، قطعا کارایی و اثربخشی آن نیز بیشتر خواهد بود. این حوزه موضوعی نوظهور، پژوهشگران را در کنترل بهتر پاندمی یاری رسانده و مبنای اساسی در مطالعات حوزه واکسن COVID-19 قلمداد گردد.
موضوع نوظهور دیگر در سطح بین المللی، «جامعه و فناوری در COVID-19» است که تأثیر کاربرد فناوری های نوین پزشکی در کارآزمایی های بالینی و تولید انبوه واکسن، نمود عینی اهمیت و توجه به این موضوع است. در واقع به مدد فناوری نوین نرم افزاری و سخت افزاری پزشکی در ظرف مدت چندین هفته تمامی مراحل تولید نخستین واکسن COVID-19 با موفقیت طی شده و واکسن مذکور روانه بازار گردید. افزون بر بخش های پژوهشی و تولیدی، بخش درمانی و مراقبت های بهداشتی و بیمارستانی مرتبط با COVID-19 به طور قابل ملاحظه ای از ابزارها و فناوری های نوین پزشکی در درمان بیماران مبتلا به COVID-19 بهره بردهاند.
در سطح انتشارات ایران، ارتقاء میانگین وزنی به بیش از 20 درصد در شش ماهه اول سال 2021، منجر به نوظهور شدن موضوع « Social and Mental Status» گردید. از جمله دلایل اهمیت یافتن این موضوع و انتشار مقالات متعدد در این زمینه، شاید بتوان به اثرات و آسیب های روانی در سطح کلان و در سطح خرد در جامعه و خانواده ها از جمله افزایش برخوردها و مشاجره های بین والدین و فرزندان و خود زوجین در زمان قرنطینه اشاره کرد. در زمینه اجتماعی، فرهنگ جوامع گوناگون در برخورد با این بیماری، میزان پذیرش و پیشگیری و یا عدم پذیرش و انکار از جمله مواردی است که در سطح مقالات به آن پرداخته شده است.
از آنجا که داده های پژوهش مربوط به ژوئن 2021 است، با توجه به سرعت قابل توجه تولیدات علمی COVID-19 در عرصه ملی و به خصوص بین المللی، ممکن است نتایج و تحلیل های ارائه شده در زمان حاضر جدید بودن خود را از دست داده باشد.
محدودیت ها و پیشنهادهای پژوهش
سرعت انتشارات و تولید علم در حوزه موضوعی کرونا بسیار بالا است. به گونه ای که طی یک سال گذشته، بیش از 200 هزار منبع به پایگاه PMC افزوده شده است. همین امر ضرورت تکرار این پژوهش در دورههای زمانی گوناگون را بیش از پیش می نماید.
انجام مطالعه ای جامع براساس دادههای پایگاه های استنادی وب علوم و اسکوپوس، متنکاوی متون به روشی غیر از TF-IDF، از جمله آنالیز احساسات[5] و استخراج نظرات حوزههای مطالعاتی و عقیدهکاوی[6] از جمله پیشنهادات کاربردی پژوهش حاضر است.
در مجموع می توان چنین نتیجه گیری کرد که با توجه به شیوع گسترده COVID-19 در جهان و مطالعات گسترده در سطح دنیا جهت یافتن روشهای درمانی یا کشف واکسن و داروهای جدید برای مقابله با این ویروس، آگاهی و شناخت نتایج این گونه مطالعات در حیطه موضوعات راهبردی همانند پاندمی COVID-19 میتواند برای پژوهشگران و سیاستگذاران عرصه بهداشت و درمان جهت تصمیمگیری بهتر و ارائه نقشه دانشی و مطالعاتی در زمینه این ویروس، مفید واقع گردد و آنان را در ارائه راهکارهای اثر بخش و تصمیمگیری بهینه، راهنمایی نماید. پژوهشها به درستی نشان میدهد که مطالعات جهانی بیشتر توسط کشورهای توسعه یافته ارائه شده است. از آنجایی که کشورهای فوق از زیرساختهای بهتر و بهروزتری در حوزه پزشکی مولکولار، واکسن و تولید دارو برخوردارند، متناسب با بروز بیماری، مطالعات خود را هدفدار در جهت «حل مساله» که همان «کنترل پاندمی کرونا از طریق ایجاد ایمنی جمعی توسط واکسن است»، متمرکز مینمایند و اکثر مطالعات آنها که در مبحث اصلی «واکسیناسیون» میگنجد، طبقهبندی شده است. این در حالی است که تمرکز مطالعات پژوهشگران ایرانی بر بیماران کرونایی و عوارض ناشی از بیماری، بوده است.
مقاله حاضر برگرفته از طرح پژوهشی با عنوان «شناسایی مدلهای موضوعی و طبقهبندی مقالات علمی ملی و بینالمللی کووید-۱۹ با استفاده از روش متن کاوی» مصوب معاونت پژوهش و فناوری مرکز منطقهای اطلاعرسانی علم و فناوری است.
در انجام مطالعه حاضر، نویسندگان هیچگونه تضاد منافعی نداشتهاند.
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |