机器学习中的腺病毒疾病预测

2025年7月22日 | 阅读9分钟

Cataract Detection Using Machine Learning

白内障是一种常见的眼部疾病，尤其是在老年人中，很多人都会患上。这种疾病会导致眼球晶状体混浊，从而损害视力、降低对光线的敏感度以及夜间视力下降。及早发现白内障至关重要，以便及时治疗并防止视力进一步丧失。通过检查眼部图像，机器学习算法有可能帮助早期诊断白内障。

用于检测白内障的机器学习算法的工作原理

机器学习是人工智能的一个分支，涉及训练算法在数据中识别模式。在白内障诊断的背景下，机器学习算法可以在大量的眼部图像数据集上进行训练，学习如何区分健康的眼睛和患有白内障的眼睛。

研究人员通常会使用一个标记好的眼部图像集合来训练机器学习系统以识别白内障。通过将数据集中的每张图像分类为患有白内障或没有白内障，算法被训练来识别图像中的模式，这些模式区分了患有白内障的眼睛和正常的眼睛。

然后，算法可以在另一组眼部图像上进行测试，以评估其性能。通过确定算法的敏感性和特异性来评估白内障检测的准确性。

白内障检测的机器学习方法通常涉及以下步骤：

第一步：首先需要获取高质量的眼部图像。可以使用各种设备，包括相机和光学相干断层扫描（OCT）设备来记录这些图像。在获取图像后，需要对图像进行预处理，以确保它们在分析中得到正确对齐、归一化和增强。
第二步：在识别出预处理的图像后，必须找到感兴趣的区域（ROI）。这些感兴趣的区域对应于眼部中更可能发生白内障的区域，例如晶状体或角膜。
第三步：在找到感兴趣的区域后，必须从中提取特征。这些特征可能包括纹理、形状、颜色或强度等细节。算法在识别白内障方面的成功取决于特征提取过程。
第四步：在提取特征后，必须训练机器学习算法。为此，必须将一系列标记好的图像（每张图像都标明是否患有白内障）输入到算法中。该程序将获得识别特征中区分白内障图像和非白内障图像的能力。
第五步：在提取特征后，必须训练机器学习算法。为此，必须将一系列标记好的图像（每张图像都标明是否患有白内障）输入到算法中。该程序将获得识别特征中区分白内障图像和非白内障图像的能力。
第六步：一旦经过验证和测试，该技术就可以在临床环境中实施，以帮助进行白内障的早期检测。

使用机器学习检测白内障的优点

一旦经过验证和测试，该技术就可以在临床环境中实施，以帮助进行白内障的早期检测。
通过检查大量的眼部图像数据集并学会识别可能难以被人眼看到的细微模式，机器学习算法有可能提高白内障诊断的准确性。
通过自动化分析过程并消除对合格专家的手动检查的需求，机器学习算法可以降低白内障诊断的成本。
通过促进偏远或服务欠缺地区（合格专家获取受限）的诊断，机器学习算法可以提高白内障诊断的可及性。

使用机器学习检测白内障的局限性

机器学习算法的好坏取决于用于训练它们的数据。如果用于训练算法的数据集存在偏差或不能代表总体，那么算法的性能可能不如预期。
理解机器学习算法如何做出诊断并解释这些诊断可能很棘手。缺乏透明度可能会阻碍广泛采用。
在医疗保健领域使用机器学习会引发道德问题，例如患者隐私、知情同意以及决策中的偏见。
机器学习算法可能需要大量的处理能力和存储空间，这对于资金不足的组织来说可能是一个挑战。

代码实现

我们将尝试区分正常眼和白内障眼图像。在这里，我们将使用两个数据集：白内障数据集和眼部疾病识别数据集。

导入库

一个名为“glob”的 Python 包用于扩展到文件和目录的路径。用户可以使用通配符模式搜索文件，它将返回满足搜索条件的文件路径列表。

“glob”库提供了一种使用模式（如文件名、文件扩展名或目录名）查找文件的简单方法。在数据科学和机器学习项目中，读取具有相同名称或扩展名的多个文件是很常见的做法。

import os, glob, cv2
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import tensorflow as tf
from tensorflow.keras.layers import *
from tensorflow.keras import backend as K
from tensorflow.keras.models import Sequential
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import get_custom_objects
import efficientnet.tfkeras as efn
from tqdm import tqdm

读取元数据并设置配置

两个关键的机器学习操作，即设置配置和读取元数据，可以提高模型的性能，并有助于精确的数据处理。

设置配置涉及调整模型的各种设置或参数。这些参数可能包括超参数，如 epoch、batch size 和学习率，以及那些影响模型行为的参数，如正则化技术或优化器算法。

包含其他数据的信息的数据称为元数据。机器学习中的元数据可能包括有关数据集大小、它包含的特征或标签的类型以及数据收集过程的其他详细信息等。

为了确保数据被正确处理和处理，读取元数据是机器学习中的一个关键步骤。例如，如果元数据显示数据集中某些特征存在缺失值，开发人员可以使用适当的方法（如插补）来管理缺失值。

SEED = 42
EPOCHS = 100
SIZE_BATCH = 32
HEIGHT_IMG = 192
WIDTH_IMG = 256

# Dataset: cataract
ROOT_IMG = '../input/cataractdataset/dataset/'
DIR_IMG = [ROOT_IMG+'1_normal',
           ROOT_IMG+'2_cataract',
           ROOT_IMG+'2_glaucoma',
           ROOT_IMG+'3_retina_disease']

#Dataset: ocular-disease-recognition dataset
ROOT_IMG_OCU = '../input/ocular-disease-recognition-odir5k/ODIR-5K/Training Images/'
dataframe_ocu = pd.read_excel('../input/ocular-disease-recognition-odir5k/ODIR-5K/data.xlsx')

def seed_everything(seed):
    np.random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    tf.random.set_seed(seed)

seed_everything(SEED)
#The seeding step includes giving the model's training-phase random number generator a fixed value. This guarantees that the model's outcomes are consistent over several runs and on various computers.

处理白内障数据集

数据集的处理过程必须包括数据收集、清理、集成、转换、缩减、分离和可视化。每个步骤都对于确保数据精确、一致且适合分析或机器学习至关重要。数据处理是任何数据科学或机器学习项目的一部分，需要仔细规划和密切关注细节。通过使用这些方法来准备数据以供分析或机器学习，您可以充分利用您的数据。

在这里，我们将处理白内障数据集。

dataframe_cataract = pd.DataFrame(0,
                  columns=['paths',
                           'cataract'],
                  index=range(601))

filepaths = glob.glob(ROOT_IMG + '*/*')


for i, path_file in enumerate(filepaths):
    path_file = os.path.split(path_file)
    dataframe_cataract.iloc[i, 0] = path_file[0] + '/' + path_file[1]
   
    if path_file[0] == DIR_IMG[0]:    # normal
        dataframe_cataract.iloc[i, 1] = 0
    elif path_file[0] == DIR_IMG[1]:  # cataract
        dataframe_cataract.iloc[i, 1] = 1
    elif path_file[0] == DIR_IMG[2]:  # glaucoma
        dataframe_cataract.iloc[i, 1] = 2
    elif path_file[0] == DIR_IMG[3]:  # retine_disease
        dataframe_cataract.iloc[i, 1] = 3


# Only sampling normal and cataract from the dataset    
dataframe_cataract = dataframe_cataract.query('0 <= cataract < 2')
dataframe_cataract

输出

print('Number of normal and cataract images')
print(dataframe_cataract['cataract'].value_counts())

输出

在这里，我们可以看到有 300 张正常眼图像和 100 张患有白内障的图像。

处理眼部疾病识别数据集

现在我们将处理眼部疾病识别数据集。

输出

def has_cataract_mentioned(text):
    if 'cataract' in text:
        return 1
    else:
        return 0
   
dataframe_ocu['left_eye_cataract'] = dataframe_ocu['Left-Diagnostic Keywords']\
                                 .apply(lambda x: has_cataract_mentioned(x))
dataframe_ocu['right_eye_cataract'] = dataframe_ocu['Right-Diagnostic Keywords']\
                                 .apply(lambda x: has_cataract_mentioned(x))

我们创建了一个函数，用于标记数据，以确定该人是否患有白内障。

dataframe_lefteye = dataframe_ocu.loc[:, ['Left-Fundus', 'left_eye_cataract']]\
        .rename(columns={'left_eye_cataract':'cataract'})
dataframe_lefteye['paths'] = ROOT_IMG_OCU + dataframe_lefteye['Left-Fundus']
dataframe_lefteye = dataframe_lefteye.drop('Left-Fundus', axis=1)


dataframe_righteye = dataframe_ocu.loc[:, ['Right-Fundus', 'right_eye_cataract']]\
        .rename(columns={'right_eye_cataract':'cataract'})
dataframe_righteye['paths'] = ROOT_IMG_OCU + dataframe_righteye['Right-Fundus']
dataframe_righteye = dataframe_righteye.drop('Right-Fundus', axis=1)

dataframe_lefteye.head()

输出

这里我们获取左眼图像的文件路径。

输出

这里我们获取右眼图像的文件路径。

print('Number of left eye images')
print(dataframe_lefteye['cataract'].value_counts())
print('\nNumber of right eye images')
print(dataframe_righteye['cataract'].value_counts())

输出

在这里，我们获得了患有白内障或没有白内障的左眼和右眼的数量。

def downsample(dfa):
    dfa = pd.concat([
        dfa.query('cataract==1'),
        dfa.query('cataract==0').sample(sum(dfa['cataract']),
                                       random_state=SEED)
    ])
    return dfa


dataframe_lefteye = downsample(dataframe_lefteye)
dataframe_righteye = downsample(dataframe_righteye)

print('Number of left eye images')
print(dataframe_lefteye['cataract'].value_counts())
print('\nNumber of right eye images')
print(dataframe_righteye['cataract'].value_counts())

输出

dataframe_ocu = pd.concat([dataframe_lefteye, dataframe_righteye])
dataframe_ocu.head()

输出

这里我们获取所有眼部疾病图像所在的文件夹路径。

合并数据集

在这里，我们将合并两个元数据，以便我们可以使用它来加载图像数据并创建一个新数据集。

dataframe = pd.concat([dataframe_cataract, dataframe_ocu], ignore_index=True)
dataframe

输出

现在我们将把数据集分成训练集和测试集。

dataframe_train, dataframe_test = train_test_split(dataframe,
                                     test_size=0.2,
                                     random_state=SEED,
                                     stratify=dataframe['cataract'])

dataframe_train, dataframe_value = train_test_split(dataframe_train,
                                    test_size=0.15,
                                    random_state=SEED,
                                    stratify=dataframe_train['cataract'])

def create_datasets(dfa, widht_img, height_img):
    imgs = []
    for path in tqdm(dfa['paths']):
        img = cv2.imread(path)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, (widht_img, height_img))
        imgs.append(img)
       
    imgs = np.array(imgs, dtype='float32')
    dfa = pd.get_dummies(dfa['cataract'])
    return imgs, dfa


train_imgs, dataframe_train = create_datasets(dataframe_train, WIDTH_IMG, HEIGHT_IMG)
val_imgs, dataframe_value = create_datasets(dataframe_value, WIDTH_IMG, HEIGHT_IMG)
test_imgs, dataframe_test = create_datasets(dataframe_test, WIDTH_IMG, HEIGHT_IMG)

train_imgs = train_imgs / 255.0
val_imgs = val_imgs / 255.0
test_imgs = test_imgs / 255.0

输出

现在我们将开始训练我们的模型。

# plot the first 25 sheets of image data for training

f, ax = plt.subplots(5, 5, figsize=(15,15))
norm_list = list(dataframe_train[0][:25])
for i, img in enumerate(train_imgs[:25]):
    ax[i//5, i%5].imshow(img)
    ax[i//5, i%5].axis('off')
    if norm_list[i] == 1:
        ax[i//5, i%5].set_title('TrainData: Normal')
    else:
        ax[i//5, i%5].set_title('TrainData: Cataract')
plt.show()

输出

在测试方面，我们仍然选择 25 张图片。

# plot the first 25 sheets of image data for Test
f, ax = plt.subplots(5, 5, figsize=(15,15))
norm_list = list(dataframe_train[0][:25])
for a, img in enumerate(test_imgs[:25]):
    ax[a//5, a%5].imshow(img)
    ax[a//5, a%5].axis('off')
    if norm_list[a] == 1:
        ax[a//5, a%5].set_title('TestData: Normal')
    else:
        ax[a//5, a%5].set_title('TestData: Cataract')
plt.show()

输出

建模

建模是使用数据集训练数学或统计算法以查找模式或进行预测的过程。构建一个具有良好泛化能力以适应新数据并有效预测能力的机器学习模型是建模的目标。

class Mish(tf.keras.layers.Layer):

    def __init__(self, **kwargs):
        super(Mish, self).__init__(**kwargs)
        self.supports_masking = True

    def call(self, inputs):
        return inputs * K.tanh(K.softplus(inputs))

    def get_config(self):
        base_config = super(Mish, self).get_config()
        return dict(list(base_config.items()) + list(config.items()))

    def compute_output_shape(self, input_shape):
        return input_shape
def mish(x):
    return tf.keras.layers.Lambda(lambda x: x*K.tanh(K.softplus(x)))(x)
 
get_custom_objects().update({'mish': Activation(mish)})

input_shape = (HEIGHT_IMG, WIDTH_IMG, 3)

model = Sequential()
model.add(Conv2D(16, kernel_size=3, padding='same',
                 input_shape=input_shape, activation='mish'))
model.add(Conv2D(16, kernel_size=3, padding='same', activation='mish'))
model.add(BatchNormalization())
model.add(MaxPool2D(3))
model.add(Dropout(0.3))
model.add(Conv2D(16, kernel_size=3, padding='same', activation='mish'))
model.add(Conv2D(16, kernel_size=3, padding='same', activation='mish'))
model.add(BatchNormalization())
model.add(MaxPool2D(3))
model.add(Dropout(0.3))
model.add(Flatten())
model.add(Dense(2, activation='softmax'))
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])


model.summary()

输出

现在，我们将使用 ImageDataGenerator 对象通过一些图像数据增强来创建随机增强的图像数据。

generator = ImageDataGenerator(horizontal_flip=True,
                               height_shift_range=0.1,
                               fill_mode='reflect')



es_callback = tf.keras.callbacks.EarlyStopping(patience=20,
                                               verbose=1,
                                               restore_best_weights=True)
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(factor=0.1, patience=10, verbose=1)

history = model.fit(generator.flow(train_imgs,
                                   dataframe_train,
                                   batch_size=SIZE_BATCH),
                    epochs=EPOCHS,
                    steps_per_epoch=len(train_imgs)/SIZE_BATCH,
                    callbacks=[es_callback, reduce_lr],
                    validation_data=(val_imgs, dataframe_value))


pd.DataFrame(history.history)[['accuracy', 'val_accuracy']].plot()
pd.DataFrame(history.history)[['loss', 'val_loss']].plot()
plt.show()

输出

评估模型

现在我们将评估模型。

输出

嗯，模型的准确率为 88%，损失为 36%，这看起来不错。

但是，我们将应用一个已经在数据集上训练过的模型。这个预训练模型已经识别了数据中的多种特征和模式，这可能有助于执行特定任务。

def build_model(height_img, width_img, n):
    inp = Input(shape=(height_img,width_img,n))
    efnet = efn.EfficientNetB0(
        input_shape=(height_img,width_img,n),
        weights='imagenet',
        include_top=False
    )
    x = efnet(inp)
    x = GlobalAveragePooling2D()(x)
    x = Dense(2, activation='softmax')(x)
    model = tf.keras.Model(inputs=inp, outputs=x)
    opt = tf.keras.optimizers.Adam(learning_rate=0.000003)
    loss = tf.keras.losses.CategoricalCrossentropy(label_smoothing=0.01)
    model.compile(optimizer=opt, loss=loss, metrics=['accuracy'])
    return model

model = build_model(HEIGHT_IMG, WIDTH_IMG, 3)
model.summary()

输出

generator = ImageDataGenerator(horizontal_flip=True,
                               height_shift_range=0.1,
                               fill_mode='reflect')



es_callback = tf.keras.callbacks.EarlyStopping(patience=20,
                                               verbose=1,
                                               restore_best_weights=True)
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(factor=0.1, patience=10, verbose=1)

history = model.fit(generator.flow(train_imgs,
                                   dataframe_train,
                                   batch_size=SIZE_BATCH),
                    epochs=EPOCHS,
                    steps_per_epoch=len(train_imgs)/SIZE_BATCH,
                    callbacks=[es_callback, reduce_lr],
                    validation_data=(val_imgs, dataframe_value))


pd.DataFrame(history.history)[['accuracy', 'val_accuracy']].plot()
pd.DataFrame(history.history)[['loss', 'val_loss']].plot()
plt.show()

输出

重新评估模型

输出

在测试模型时，准确率为 93%，损失为 21%，这相当不错。

考虑到这是一个基于光学的人工智能模型，这个准确率非常棒。

结论

基于机器学习的白内障检测有潜力改善白内障的早期诊断和治疗，从而实现个性化和有效的患者护理。尽管该方法存在缺点和限制，但持续的研究和开发旨在解决这些问题并提高机器学习算法在白内障检测中的功能和可用性。随着技术不断进步以及研究人员与临床医生之间协作的加强，白内障的检测和治疗前景一片光明。

下一主题使用 Keras 模型进行 ResNet50 迁移学习

机器学习中的腺病毒疾病预测

用于检测白内障的机器学习算法的工作原理

使用机器学习检测白内障的优点

使用机器学习检测白内障的局限性

代码实现

重新评估模型

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

机器学习

监督式学习

分类

杂项

相关教程

面试题

机器学习中的腺病毒疾病预测

用于检测白内障的机器学习算法的工作原理

使用机器学习检测白内障的优点

使用机器学习检测白内障的局限性

代码实现

重新评估模型

结论

相关帖子

机器学习中的 XGBoost 算法简介

机器学习中的数据增强

图像分割的区域级评估指标

机器学习的挑战

最大似然估计

随时间反向传播 - RNN

用于推荐系统的矩阵分解

机器学习在交易中的应用

机器学习中的词袋 (BoW) 模型

机器学习中的感知器

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器