
Диагностика короновирусных заболеваний с помощью нейронных сетей
Полученные данные позволили получить результаты, которые подтверждают эффективность глубокого обучения в диагностике заболеваний, вызванных коронавирусной инфекцией
ВВЕДЕНИЕ
Пандемия COVID-19, вызванная корона- вирусом SARS-CoV-2, стала глобальной проблемой, затронувшей системы здравоохранения по всему миру [1-3]. Для эффективного управления распространением вируса и лечения пациентов требуются быстрые и точные методы диагностики. Традиционные подходы, такие как ПЦР и серологические тесты [4, 5], обладают высокой точностью, но требуют времени, значительных финансовых и технических ресурсов [6].
Современные технологии искусственного интеллекта, включая нейронные сети, предоставляют возможности для автоматизации диагностики.
Благодаря способности обрабатывать и анализировать большие объемы медицинских данных, такие модели позволяют быстро выявлять признаки инфекции, оптимизируя ресурсы медицинских учреждений [7, 8]. Актуальность данной работы обусловлена не только необходимостью быстрого и точного выявления COVID-19, но и общим трендом, направленным на цифровизацию и автоматизацию процессов диагностики в здравоохранении.
МЕТОДИКА ИССЛЕДОВАНИЯ
Нейронная сеть представляет собой алгоритм обучения, который является ключевым компонентом большинства методов глубокого обучения. Искусственные нейронные сети обладают способностью функционировать аналогично человеческому мозгу. Они способны более быстро и надежно выявлять закономерности и способствовать интерпретации медицинских изображений. Нейронная сеть служит парадигмой обработки информации, созданной для имитации процессов, происходящих в человеческом мозге, и анализа доступной информации [9, 10].
Архитектура нейронной сети включает в себя нейроны, а также входной, выходной и один или несколько промежуточных слоев, известных как скрытые. Нейроны представляют собой математические операции. Слои нейронных сетей находятся в тесной взаимосвязи и координируют свои действия для обучения на основе входных данных и оптимизации конечного результата. На рис. 1 представлена базовая архитектура нейронной сети [3, 11, 12].
Вначале данные поступают в сеть через входной слой, после чего они проходят через несколько скрытых слоев, где происходит их обработка на каждом этапе. Затем информация, полученная на предыдущем слое, передается на выходной слой, который формирует окончательный результат. Нейронные сети, включающие в себя несколько скрытых слоев, классифицируются как глубокие нейронные сети, что способствовало возникновению термина «глубокое обучение» [13, 14].

Методы глубокого обучения обладают высокой адаптивностью к различным приложениям и областям. В отличие от классических систем, которые основываются на заранее заданных признаках, модели глубоких нейронных сетей способны самостоятельно извлекать признаки из данных, что позволяет им эффективно выявлять морфологические закономерности в изображениях. Метод нейронных сетей не нуждается в ручной предварительной обработке необработанных данных. К различным типам нейронных сетей относятся сверточные нейронные сети (CNN), рекуррентные нейронные сети, сети с долгосрочной и краткосрочной памятью, а также генеративно-состязательные сети (GAN).
Наиболее распространенной моделью, применяемой для анализа медицинских изображений, является сверточная нейронная сеть, известная также как ConvNet [4, 15].

Архитектура CNN помогает реализовать многоуровневое иерархическое изучение функций. В то время как ранние слои CNN позволяют извлекать объекты низкого уровня (текстуры и формы), глубокие слои объединяются для точного определения ключевых точек. Входные данные высокого уровня состоят из изображений, поэтому CNN делает архитектуру более рациональной. В сверточных нейронных сетях (ConvNet) нейроны организованы трехмерно: по высоте, ширине и глубине. На рис. 2 представлена базовая архитектура сверточной нейронной сети, применяемая для классификации изображений [16]. Данная архитектура включает входной слой, сверточный слой, линейную функцию активации (ReLU), слой объединения, полносвязный слой и выходной слой.
Взаимодействие указанных слоев формирует полноценную архитектуру сверточной нейронной сети. Выделение признаков осуществляется за счет сверточного слоя, функции ReLU и слоя объединения [4, 17]. Классификация в данной модели реализуется на полносвязном слое. Определение функций отдельных слоев и связей между ними в глубокой нейронной сети представляет собой задачу большей сложности, чем применение предобученной общей архитектуры [18, 19]. Разработка сквозной модели нейронной сети может способствовать более точному выявлению взаимосвязей между слоями. Исключение несущественных признаков позволяет модели с большей точностью выявлять существенные закономерности и повышает эффективность ее работы [20-22].

РЕЗУЛЬТАТЫ И ДИСКУССИЯ
В области медицинской визуализации нейронные сети находят широкое применение в различных областях анализа изображений, таких как классификация, обнаружение, сегментация, локализация и регистрация. Применение нейронных сетей представляет собой перспективный метод повышения эффективности ранней диагностики COVID-19.
Благодаря трансферному обучению стало возможным использовать предварительно обученные модели нейронных сетей для обработки, анализа, сегментации и классификации рентгеновских снимков пациентов с COVID- 19. Более того, некоторые нейронные сети были специально адаптированы для решения конкретных задач в этой области. Рентгенологические исследования, в частности рентгенография грудной клетки и компьютерная томография (КТ), рассматриваются как дополнительные методы скрининга на COVID-19.
Проведено множество исследований, направленных на оценку эффективности рентгенографии грудной клетки в диагностике COVID- 19. Анализы показывают, что характерный признак COVID-19 - пневмония, может быть выявлена при изучении снимков рентгенографии и КТ грудной клетки. Первоначальные исследования выявили ряд типичных признаков на рентгеновских снимках и КТ. В зависимости от стадии заболевания, изображения пациентов могут варьироваться от нормы до наличия множественных очаговых уплотнений. Часто встречающиеся изменения на КТ снимках инфицированных пациентов включают:
затемнения типа "матового стекла" (GGO);
"мозаичный" рисунок;
уплотнение воздушных пространств;
утолщение бронхов и трахеи;
тяжистые бронхоэктазы.
На рис. 3 представлены примеры нормальных и патологических рентгеновских снимков пациентов с COVID-19.
Сверточные нейронные сети (CNN) признаны наиболее эффективным методом выявления и классификации COVID-19 на основе рентгенологических изображений грудной клетки.
Их преимущество заключается в способности распознавать характерные паттерны, присущие данному заболеванию. Процесс классификации реализуется путем выделения ключевых признаков из изображений и их последующей обработки в глубоких слоях сети. В результате, CNN способны классифицировать как КТ, так и рентгеновские снимки пораженной грудной клетки, сопоставляя их с эталонными образцами.
Сегментация изображений может предоставить количественные данные, необходимые для идентификации COVID-19, оценки тяжести заболевания и выделения специфических областей интереса. Однако применение сегментации для оптимизации производительности существующих систем пока ограничено несколькими исследованиями. В таблице представлены архитектуры сверточных нейронных сетей (CNN), используемые в задачах сегментации изображений, связанных с COVID-19. Авторы Алом и др. применили нейронную сеть Inception Residual Recurrent CNN (IRRCNN) в сочетании с методом трансферного обучения для диагностики COVID- 19. Модель IRRCNN была проверена на рентгенограммах грудной клетки и компьютерных томограммах, а также проведена количественная оценка для определения степени тяжести заболевания. IRRCNN использовался для классификации случаев COVID-19, в то время как модель NABLA-3 применялась для сегментации пораженных участков легких. Предложенный метод продемонстрировал точность 84,67% для рентгеновских снимков и 98,78% для КТ-изображений.
АНАЛИЗ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ
Для анализа был взят набор данных под названием «SIIM COVID-19: Resized to 256px JPG». Набор данных содержит 6334 сканирований грудной клетки в формате DICOM. Они были деидентифицированы для защиты конфиденциальности пациента. Все изображения были помечены группой опытных рентгенологов на предмет наличия затемнений.
Данный набор был создан в рамках конкурса, организованного Society for Imaging Informatics in Medicine (SIIM). Он предназначен для исследования и анализа изображений медицинской визуализации, связанных с COVID- 19. Набор данных включает в себя рентгеновские снимки грудной клетки, которые были уменьшены до разрешения 256x256 пикселей. Эти изображения могут содержать различные патологии, связанные с COVID-19, а также другие заболевания легких. Изображения представлены в формате JPG, что делает их удобными для обработки и анализа с использованием различных библиотек и инструментов для работы с изображениями. Набор данных может быть использован для обучения моделей классификации, сегментации и других задач, связанных с анализом медицинских изображений, а также для разработки различных приложений. Основная цель использования этого набора данных - разработка и тестирование алгоритмов машинного обучения и глубокого обучения для автоматической диагностики COVID-19 на основе рентгеновских изображений. Основные этапы подготовки данных приведены на рис. 4.
На рис. 5 реализуется аугментация данных с помощью библиотеки albumentations. Генераторы аугментации для обучающего (get_train_ transforms) и тестового (get_valid_transforms) наборов включают преобразования, такие как горизонтальное и вертикальное отражение, коррекция яркости/контраста, изменение оттенка и размера изображения.
На рис. 6 представлена рентгенограмма грудной клетки, на которой зеленые прямоугольники выделяют области интереса. Эти области могут соответствовать аномальным структурам, таким как опухоли, затемнения, воспаления или иные патологические изменения.
Датасет train_dataset используется для извлечения изображения, аннотаций (target) и идентификатора. Данные включают изображения грудной клетки и связанные с ними разметки, где разметки, хранящиеся в target['boxes'], представляют собой ограничивающие рамки (bounding boxes), задающие координаты аномальных областей (в данном случае, прямоугольные регионы). Аннотации (bounding boxes) извлекаются из target['boxes'] и переводятся с устройства (GPU) в формат NumPy для последующей обработки. Координаты приводятся к целочисленному типу для совместимости с графическими библиотеками. Это необходимо для точной визуализации областей интереса. Каждая рамка задается четырьмя значениями: [x_min, y_min, x_max, y_max], определяющими верхний левый и нижний правый углы прямоугольника. Изображение, изначально представленное в формате PyTorch (каналы, высота, ширина - (C, H, W)), преобразуется в привычный для визуализации формат (H, W, C) (высота, ширина, каналы). Это преобразование обеспечивает совместимость изображения с библиотеками визуализации, такими как Matplotlib, и соответствует стандартам цифровой обработки изображений. Для каждой рамки (координатной пары) накладывается прямоугольник с использованием функции cv2.rectangle:
Это шаг визуализации ограничивающих рамок, которые выделяют области, представляет интерес. В данном контексте это могут быть потенциальные патологические изменения на рентгенограмме. Создается объект визуализации с заданным размером. Отключаются оси для удобства восприятия. Затем изображение с нанесенными рамками отображается. Этот этап позволяет визуально оценить результаты детекции. Визуализация обеспечивает проверку правильности аннотаций и может использоваться для дальнейшего анализа или валидации модели.
На рентгенограмме выделены прямоугольные области (bounding boxes) зеленым цветом. Эти области указывают на участки, которые модель считает патологическими.
Выделенные зоны находятся в обоих легких, что может указывать на наличие диффузных изменений, характерных для COVID-19 (например, участки уплотнения ткани легких или воспалительные процессы). Размеры прямоугольников варьируются, что свидетельствует о способности модели выявлять области с различными размерами поражений. Это важно для обнаружения как мелкоочаговых изменений, так и более крупных поражений, которые могут быть связаны с прогрессирующими стадиями заболевания. Области выглядят четкими, а их расположение соответствует анатомическим особенностям легких, это говорит о корректной работе модели. На изображении присутствует умеренный уровень шума (смазанность границ). В условиях более низкого качества рентгенограмм результаты могут ухудшиться. Результаты программы демонстрируют, что модель способна автоматически выявлять аномалии на рентгенограммах грудной клетки.
Суммарная ошибка выборки была ~0,36. Оценку качества модели можно увеличить, если: улучшить качество данных, найти оптимальный вариант гиперпараметров, использовать более глубокие модели (ResNet101 или ResNet152), уменьшить переобучение модели с помощью L2- регуляризации. Данный алгоритм практически универсален для любой задачи, связанной с обнаружением и выделением объектов, для выявления несоответствий в произведенной продукции (дефектов), для обнаружения пешеходов, транспортных средств и дорожных знаков, для классификации животных и растений на фотографиях или видеозаписи, в личных целях для фиксирования подозрительных людей и объектов на камере видеонаблюдения.
ЗАКЛЮЧЕНИЕ
На основе проведенного исследования с использованием нейронной сети для анализа медицинских рентгенограмм грудной клетки были получены достоверные результаты, подтверждающие эффективность глубокого обучения в диагностике заболеваний, вызванных коронавирусной инфекцией. Разработанная модель корректно идентифицировала патологические области на изображениях, что демонстрирует ее способность автоматизировать выявление поражений легочной ткани, характерных для COVID-19. Тем не менее, анализ также выявил ограничения модели, связанные с возможной недостаточной генерализацией на новых данных и чувствительностью к особенностям изображения, таким как качество снимков. Дальнейшее совершенствование подхода, включая обучение на более разнообразных выборках и интеграцию дополнительных источников данных, таких как КТ-сканы или клинические показатели, может повысить надежность и универсальность алгоритма. Таким образом, результаты работы подтверждают, что применение нейронных сетей для диагностики COVID-19 является перспективным направлением. Модель продемонстрировала свою практическую значимость в условиях реальных данных, что открывает возможности для ее интеграции в клиническую практику, особенно в условиях ограниченных ресурсов или высокой нагрузки на медицинские учреждения.
ЛИТЕРАТУРА
Erfan G., Ozkaya D.B. COVID-19 and dermatology (Part I): skin manifestations in adults and children with COVID-19 infec- tionjActa Medica Mediterranea. 2022. V. 38. N 2. P. 991-1000.
Ксенофонтова О.Л., Смирнова Н.В., Котова А.В. Применение методов интеллектуального анализа данных в эпидемиологии. Современные наукоемкие технологии. Региональное приложение. 2023. № 2(74). С. 88-93.
Горев С.В. Исследование методов и алгоритмов искусственного интеллекта при определении стоимости произведений искусства. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. 2022. № 04(54). С. 21-28. DOI: 10.6060/ivecofin.2022544.622.
Кутузова А.С., Астраханцев Г.В., Нодель А.Г., Смирнов Д.Н. Алгоритмы искусственного интеллекта для прогнозирования показателей в инкассаторской деятельности. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. 2023. № 04(58). С.52-61.
Li Q., Wang Ju., Tang Ya., Lu H. Next-generation COVID-19 vaccines: opportunities for vaccine development and challenges in tackling COVID-19. Drug Discoveries & Therapeutics. 2021. V. 15. N 3. P. 118-123.
Татаринов К.А. Развитие интернет-маркетинга и его инструментов. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. 2022. № 01(51). С. 54-61. DOI: 10.6060/ ivecofin.2022511.585.
Кораблев Г.А. Энтропийные характеристики вируса. Изв. вузов. Химия и хим. технология. 2020. Т. 63. Вып. 9. С. 101-107. DOI: 10.6060/ivkkt.20206309.6284.
Гордина Н.Е., Мельников А.А., Гусев Г.И., Гущин А.А., Румянцев Р.Н., Астраханцева И.А. Использование механохимической и плазмохимической обработок при синтезе каталитических систем на основе вермикулита и оксихлорида циркония. Изв. вузов. Химия и хим. технология. 2022. Т. 65. Вып. 5. С. 43-57. DOI: 10.6060/ ivkkt.20226505.6612.
Петрухин А.Б., Смирнова О.П. Перспективы развития деревянного домостроения в России. Строительные материалы. 2006. № 9. С. 25-27.
Смирнова О.П., Строкин К.Б. Факторы, ограничивающие развитие строительных предприятий и пути решения исследуемой проблемы. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. 2012. № 1 (11). С. 81-90.
Машкин Д.В., Гущин А.А., Извекова Т.В., Боровова Ю.Г. Опыт использования снежного покрова в качестве универсального показателя загрязнения урбанизированных территорий. Известия Иркутского государственного университета. Серия: Биология. Экология. 2016. Т. 18. С. 58-73.
Orlova E.V. System model for diagnostics in ophthalmology based on fuzzy inference algorithms. Ivecofin. 2024. N 04(62). Р. 64-72. DOI: 10.6060/ivecofin.2024624.703. (in Russian).
Gusev G.I., Gushchin A.A., Grinevich V.I., Rybkin V.V., Izvekova T.V., Sharonov A.V. Treatment of wastewater containing 2,4-dichlorophenol in dielectric barrier discharge plasma. ChemChemTech [Izv. Vyssh. Uchebn. Zaved. Khim. Khim. Tekhnol.]. 2020. V. 63. N 7. P. 88-94. DOI: 10.6060/ ivkkt.20206307.6182. (in Russian).
Smirnova O.P. Features of the formation of a modern investment management system and the specifics of the economic assessment of investment projects in housing construction. Ivecofin. 2017. N 2(32). P. 17-22. (in Russian).
Balakin M.A., Mirolyubova A.A. Analysis and processing of information in decision-making under conditions of uncertainty. Collection of scientific papers of Russian universities "Problems of economics, finance and production management". 2024. N 55. P. 29-31. (in Russian).
Gvozdeva T.V., Smirnova E.M. Development of a system model for the formation of educational programs. Ivecofin. 2024. N 03(61). P. 91-96. DOI: 10.6060/ivecofin.2024613. 693. (in Russian).
Bubnov A.G., Grinevich V.I., Gushchin A.A., Plastinina N.A. Methodology for selecting a method for water purification from organic compounds using environmental risk parameters. ChemChemTech [Izv. Vyssh. Uchebn. Zaved. Khim. Khim. Tekhnol.]. 2007. V. 50. N 8. P. 89-92. (in Russian).
Kosmina S.V. Artificial intelligence. From idea to implementation in software-oriented systems. Collection of scientific papers of Russian universities "Problems of economics, finance and production management". 2024. N 55. P. 88-95. (in Russian).
Astrakhantseva I.A., Gerasimov A.S., Smirnova O.P.
Evaluating statistical and machine learning models for inflation forecasting. Modern high technologies. Regional application. 2024. N 3(79). P. 120-131. DOI 10.6060/snt. 20247903.0019. (in Russian).
Авторы
А.П. Куликова, А.А. Девочкин, А.Л. Куленцан, О.П. Смирнова
Александра Павловна Куликова, Александр Андреевич Девочкин, Антон Львович Куленцан , Смирнова Ольга Павловна
Ивановский государственный химико-технологический университет
Теги: коронавирус
234567 Начало активности (дата): 12.08.2025
234567 Кем создан (ID): 989
234567 Ключевые слова: коронавирус, сверточные нейронные сети, обработка изображений, COVID-19
12354567899
Похожие статьи
В России выявили более 100 случаев заражения новым штаммом коронавирусаРентген на дому 8 495 22 555 6 8
Коронавирусная инфекция COVID-19. Лучевые методы исследования при COVID-19 и вирусных пневмониях
Лучевая диагностика короновирусной болезни (COVID-19): организация, методология, интерпретация результатов
Постановление Об утверждении санитарно-эпидемиологических правил СП 3.1.3597-20 «Профилактика новой коронавирусной инфекции (COVID-19)»