982 讀數

你能用 Python 打开医疗数据（MR、CT、X 射线）并用 AI 查找肿瘤吗？！也许吧

经过 Laszlo Fazekas8m2024/04/23

太長; 讀書

当程序员听到处理医疗数据时，他们可能会认为这是一件严肃的事情，只有大学和研究机构才能处理（至少我是这么认为的）。如您所见，我们谈论的是简单的灰度图像，这些图像非常容易处理，非常适合神经网络处理等。

featured image - 你能用 Python 打开医疗数据（MR、CT、X 射线）并用 AI 查找肿瘤吗？！也许吧

几天前，我接受了核磁共振扫描。他们把我放进一个大管子里，15 分钟内，我周围的机器嗡嗡作响，嗡嗡作响，咔哒作响。检查结束时，我收到了一张包含数据的 CD。在这种情况下，一个优秀的开发人员会做什么？当然，他们一回到家，就开始检查数据，思考如何使用Python提取数据。

该 CD 包含一堆 DLL、一个 EXE 和一些用于 Windows 查看器的附加文件，这些文件在 Linux 上显然毫无用处。关键在于一个名为 DICOM 的文件夹。它包含八个文件夹中的一系列无扩展名文件。ChatGPT 帮助我弄清楚了DICOM是一种通常用于存储 MRI、CT 和 X 射线图像的标准格式。本质上，它是一种简单的打包格式，包含灰度图像以及一些元数据。

以下代码可让您轻松地导出 PNG 格式的文件：

 import os import pydicom from PIL import Image import sys def save_image(pixel_array, output_path): if pixel_array.dtype != 'uint8': pixel_array = ((pixel_array - pixel_array.min()) / (pixel_array.max() - pixel_array.min()) * 255).astype('uint8') img = Image.fromarray(pixel_array) img.save(output_path) print(f"Saved image to {output_path}") def process_dicom_directory(dicomdir_path, save_directory): if not os.path.exists(save_directory): os.makedirs(save_directory) dicomdir = pydicom.dcmread(dicomdir_path) for patient_record in dicomdir.patient_records: if 'PatientName' in patient_record: print(f"Patient: {patient_record.PatientName}") for study_record in patient_record.children: if 'StudyDate' in study_record: print(f"Study: {study_record.StudyDate}") for series_record in study_record.children: for image_record in series_record.children: if 'ReferencedFileID' in image_record: file_id = list(map(str, image_record.ReferencedFileID)) file_id_path = os.path.join(*file_id) print(f"Image: {file_id_path}") image_path = os.path.join(os.path.dirname(dicomdir_path), file_id_path) modified_filename = '_'.join(file_id) + '.png' image_save_path = os.path.join(save_directory, modified_filename) try: img_data = pydicom.dcmread(image_path) print("DICOM image loaded successfully.") save_image(img_data.pixel_array, image_save_path) except FileNotFoundError as e: print(f"Failed to read DICOM file at {image_path}: {e}") except Exception as e: print(f"An error occurred: {e}") if __name__ == "__main__": if len(sys.argv) < 3: print("Usage: python dicomsave.py <path_to_DICOMDIR> <path_to_save_images>") sys.exit(1) dicomdir_path = sys.argv[1] save_directory = sys.argv[2] process_dicom_directory(dicomdir_path, save_directory)

该代码需要两个参数。第一个是 DICOMDIR 文件的路径，第二个是将以 PNG 格式保存图像的目录。

为了读取 DICOM 文件，我们使用Pydicom库。使用pydicom.dcmread函数加载结构，从中可以提取元数据（例如患者姓名）和包含图像的研究。还可以使用dcmread读取图像数据。原始数据可通过pixelarray字段访问， save_image函数将其转换为 PNG。这并不太复杂。

结果是几个方块（通常为 512x512）灰度图像，以后可以轻松利用。

为什么我认为写这篇关于我使用 DICOM 格式的冒险经历的短篇故事很重要？当程序员听到处理医疗数据时，他们可能会认为这是一件严肃的事情，只有大学和研究机构才能处理（至少我是这么认为的）。如您所见，我们谈论的是简单的灰度图像，这些图像非常容易处理，非常适合神经网络处理之类的事情。

考虑一下这会带来哪些可能性。对于像简单的肿瘤检测器这样的东西，你只需要一个相对简单的卷积网络和足够数量的样本。实际上，这项任务与识别图像中的狗或猫没有太大区别。

为了说明这是多么真实，让我举一个例子。在 Kaggle 上进行简单搜索后，我找到了一个笔记本，其中根据 MRI 数据（灰度图像）对脑肿瘤进行分类。数据集将图像分为四类：三类脑肿瘤和第四类健康大脑图像。网络架构如下：

 ┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┓ ┃ Layer (type) ┃ Output Shape ┃ Param # ┃ ┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━┩ │ conv2d (Conv2D) │ (None, 164, 164, 64) │ 1,664 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ max_pooling2d (MaxPooling2D) │ (None, 54, 54, 64) │ 0 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ conv2d_1 (Conv2D) │ (None, 50, 50, 64) │ 102,464 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ max_pooling2d_1 (MaxPooling2D) │ (None, 16, 16, 64) │ 0 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ conv2d_2 (Conv2D) │ (None, 13, 13, 128) │ 131,200 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ max_pooling2d_2 (MaxPooling2D) │ (None, 6, 6, 128) │ 0 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ conv2d_3 (Conv2D) │ (None, 3, 3, 128) │ 262,272 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ max_pooling2d_3 (MaxPooling2D) │ (None, 1, 1, 128) │ 0 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ flatten (Flatten) │ (None, 128) │ 0 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ dense (Dense) │ (None, 512) │ 66,048 │ ├─────────────────────────────────┼────────────────────────┼───────────────┤ │ dense_1 (Dense) │ (None, 4) │ 2,052 │ └─────────────────────────────────┴────────────────────────┴───────────────┘

如您所见，前几层由卷积和最大池化三明治结构组成，用于提取肿瘤模式，然后是两个执行分类的密集层。这与使用 CIFAR-10 数据集的TensorFlow CNN 示例代码中使用的架构完全相同。我记得很清楚，因为它是我遇到的第一个神经网络之一。正如我之前提到的， CIFAR-10数据集包含 60,000 张分为十类的图像，包括狗和猫两类。网络架构如下所示：

 Model: “sequential” _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= conv2d (Conv2D) (None, 30, 30, 32) 896 _________________________________________________________________ max_pooling2d (MaxPooling2D) (None, 15, 15, 32) 0 _________________________________________________________________ conv2d_1 (Conv2D) (None, 13, 13, 64) 18496 _________________________________________________________________ max_pooling2d_1 (MaxPooling2 (None, 6, 6, 64) 0 _________________________________________________________________ conv2d_2 (Conv2D) (None, 4, 4, 64) 36928 _________________________________________________________________ flatten (Flatten) (None, 1024) 0 _________________________________________________________________ dense (Dense) (None, 64) 65600 _________________________________________________________________ dense_1 (Dense) (None, 10) 650 ================================================================= Total params: 122,570 Trainable params: 122,570 Non-trainable params: 0 _________________________________________________________________

显然，我们处理的是相同的架构，只是参数略有不同，因此识别 MRI 图像中的脑肿瘤确实并不比识别图片中的猫或狗困难多少。此外，上述 Kaggle 笔记本能够以 99% 的有效性对肿瘤进行分类！

我只是想指出在某些情况下提取和处理医疗数据是多么简单，以及看似复杂的问题（如检测脑肿瘤）通常可以通过简单的传统解决方案非常有效地解决。

因此，我鼓励大家不要回避医疗数据。如您所见，我们处理的是相对简单的格式，并且使用相对简单、成熟的技术（卷积网络、视觉转换器等），可以在这里取得重大影响。如果您在业余时间加入开源医疗保健项目，只是出于爱好，并且可以对所使用的神经网络进行轻微改进，那么您可能会挽救生命！