适合初学者的人工智能项目创意

2025年4月2日 | 阅读9分钟

引言

人工智能从根本上影响着我们的日常生活。每次您查看社交媒体、打开 Spotify 或进行快速的 Google 搜索时,您都在使用人工智能。人工智能行业在过去几年中取得了巨大的发展,预计将进一步增长,到 2025 年将达到约 1260 亿美元。IBM、埃森哲和苹果等全球性公司正在积极招聘人工智能专家。截至 2021 年,人工智能工程师的薪资中位数为 171,715 美元,最高可超过 250,000 美元。

如今,为了推动人工智能的发展,人们正在进行大量工作。公司需要能够构建和部署可扩展模型以满足日益增长的行业需求的人工智能专家。进入人工智能领域并不困难。虽然从头开始构建人工智能模型存在复杂性,但当今行业中的大多数人工智能工作并不要求您了解这些模型背后的数学原理。

您可以通过各种人工智能项目来掌握这些库。如果您希望进入人工智能领域并且没有专业资格,那么找到工作的最有效方法是在您的作品集中展示一些有趣的人工智能项目,或展示您对开源人工智能项目的贡献。

2024 年供初学者实践的 10 个人工智能项目创意

在这里,我们将讨论您可以构建并展示在简历上的 10 大人工智能项目。这些人工智能项目将有不同的难度级别,分为初级、中级和高级。项目行业专家建议,如果您是人工智能行业的新手,可以从简单的人工智能项目开始。随着您的技能进步,您可以继续实践更高级的人工智能项目。

面向初学者的顶级人工智能项目

对于那些有兴趣学习人工智能概念的人来说,这里有一些人工智能领域的项目。

1. 简历解析器人工智能项目

招聘专员花费大量时间浏览简历,以寻找最适合某个职位的候选人。由于一个职位可能会有数百份申请,这个过程已经通过多种方式实现了自动化,最常见的是关键词匹配。招聘人员根据候选人简历中的一组关键词来筛选和阅读简历。否则,简历就会被丢弃,候选人也会被拒绝。然而,这种筛选过程有许多缺点。候选人知道关键词匹配算法,他们中的许多人会在简历中尽可能多地插入关键词,以便被公司选中。

您可以借助人工智能和机器学习技术构建一个简历解析器,它可以浏览候选人的申请并识别有技能的候选人,筛选出那些用不必要关键词填充简历的人。

您可以使用 Kaggle 上可用的简历数据集来构建此模型。该数据集仅包含标题和候选人简历信息两列。

数据以文本形式存在,需要进行预处理。您可以使用 NLTK Python 库来完成此任务。然后,您可以构建一个聚类算法,将候选人在每个领域应具备的密切相关的词和技能进行分组。应考虑上下文相似的词(而不仅仅是关键词)。您可以为每份简历分配一个最终的权重分数,从 0(最不理想)到 10(最理想)。如果您想学习人工智能,这是最适合初学者的项目。

2. 人工智能中的假新闻检测器项目

假新闻是以新闻形式传播的误导性或虚假信息。通常很难区分假新闻和真新闻,直到情况被大肆宣扬后才会曝光。在选举或疫情等事件期间,假新闻的传播尤其危险。对生命构成威胁的虚假谣言和错误信息对个人和社会都是危险的。

假新闻必须在造成恐慌并传播给大量人群之前被及早发现和阻止。

3. 翻译应用

如果您有兴趣开始进入自然语言处理领域,您应该尝试借助 Transformer 构建一个翻译应用程序。

Transformer 模型从句子中提取特征并确定句子中每个词的含义。Transformer 有一个编码和解码部分,两者都是端到端训练的。

您可以使用 Transformer 制作自己的人工智能翻译应用程序。为此,您可以将一个预训练的 Transformer 模型加载到 Python 中。然后,将您要翻译的文本转换为令牌并将其输入到预训练模型中。

您可以使用 GluonNLP 库来完成此任务。您还可以从此库中加载此人工智能项目的训练和测试数据集。

Python 包:GluonNLP

4. Instagram 垃圾信息识别

您是否曾收到有人在您的 Instagram 帖子上发表评论的通知?您兴奋地拿起手机打开应用,却发现它是一个推广某种山寨品牌鞋子的机器人。许多 Instagram 帖子的评论区都充斥着机器人。它们可以从烦人到危险不等,具体取决于它们希望您采取的行动号召类型。

您可以使用人工智能技术构建一个垃圾信息检测模型,以识别垃圾评论和真实评论之间的区别。

您可能无法找到包含各种 Instagram 垃圾评论的数据集,但您可以通过网络抓取来收集此分析所需的数据。使用 Python 访问 Instagram API,以获取来自 Instagram 的未标记评论。

您可以使用不同的数据集进行训练,例如 Kaggle 的 YouTube 垃圾信息集合数据集。然后,使用关键词来定义通常出现在垃圾评论中的词语。

使用像 N-Gram 这样的技术为倾向于出现在垃圾评论中的词语分配权重,然后将这些词语与从网络上抓取的每条评论进行比较。您可以采取的另一种方法是使用基于距离的算法,如余弦相似度。根据您应用的预处理类型,这些方法将产生更好的结果。

如果您移除停用词、空白、标点符号并正确清理数据,您会发现算法表现更好,因为它可以将相似的词匹配在一起。

您还可以使用像 ALBERT 这样的预训练模型以获得更好的结果。虽然基于距离或权重的匹配算法在查找相似词方面效果很好,但它们无法掌握句子的上下文。

像 BERT 和 ALBERT 这样的 NLP 模型可以更好地完成这项工作,因为它们考虑了句子上下文、稳健性和可解释性等因素。

5. 物体检测系统

您可以通过这个项目展示在计算机视觉领域的技能。一个物体检测系统可以利用后台的计算机视觉技术,识别出图像中存在的物体类别。

例如,假设一张图片中有您正在使用电脑的画面。一个物体检测系统应该能够识别并标记出您(人类)和电脑,以及您在图片中的位置。

您可以使用 Kaggle 的 Open Images Object Detection 数据集来完成这个项目。有一个已经开源的预训练物体检测模型叫做 SSD。这个模型是在一个名为 COCO 的日常物品数据集上训练的,可以识别像桌子、椅子和书籍这样的东西。

您可以进一步在 Kaggle Open Images 数据集上训练该模型的输出层,以构建您自己的高精度物体检测系统。

数据集:Kaggle Open Images Object Detection 数据集

6. 动物物种预测

另一个您可以做的有趣的计算机视觉项目是根据图像预测动物的物种。您可以使用 Kaggle 上的 Animals-10 数据集来完成。该数据集中有十种不同的动物类别——狗、猫、马、蜘蛛、蝴蝶、鸡、羊、牛、松鼠、大象。这是一个多类别分类问题,您需要根据数据集中动物的图片来预测其物种。您可以使用一个名为 VGG-16 的预训练模型来完成此任务。您可以使用 Keras 库将此模型加载到 Python 中。

VGG-16 是一种在 ImageNet 上训练的卷积神经网络(CNN)架构,该数据集包含超过 1400 万张图像。它包含日常物品、水果、汽车和某些动物物种的图片。

将 VGG-16 模型加载到 Python 后,您可以在此基础上使用 Kaggle 数据集中的标记图像进行训练,以对十种不同类型的动物进行分类。

数据集:Animals 10 Kaggle 数据集

7. 使用 Python 进行肺炎检测

许多疾病如癌症、肿瘤和肺炎都是借助人工智能模型通过计算机辅助诊断来检测的。Kaggle 上有可用于疾病检测的开放图像数据集。您可以在其中一个数据集上尝试进行疾病预测,例如 Kaggle 上的 Chest X-Ray Images (Pneumonia Detection) 数据集。

该数据集包含三种标记的肺部 X 射线图像:正常、细菌性肺炎和病毒性肺炎。您可以构建一个模型,根据患者肺部的 X 射线图像,将其健康状况分为这三个类别之一。

要构建此模型,您可以使用一个名为 FastAI 的 Python 库。FastAI 是一个开源库,允许用户快速创建和训练用于各种问题(包括计算机视觉和 NLP)的深度学习模型。该库提供了比 Keras 更高层次的抽象,如果您是初学者,使用起来非常容易。一个用 Keras 需要超过 30 行代码解决的问题,用 FastAI 只需五行代码即可解决。

您可以从 FastAI 下载 ResNet50 预训练模型,并在此模型的基础上进行训练来构建分类器。ResNet50 允许我们训练超过 150 层的极深神经网络,在此基础上进行训练将给您带来很好的结果。

数据集:Kaggle Chest X-Ray Images

8. Teachable Machine(可教机器)

如果您是人工智能从业者,您可能听说过谷歌的 Teachable Machine。Teachable Machine 是一个基于网络的工具,旨在让每个人都能接触到人工智能。如果您访问谷歌的 Teachable Machine 网站,他们允许您上传不同类别的图片,然后用这些图片训练一个客户端的人工智能模型。

Teachable Machine 工作原理示例

您需要上传两类图片。首先,您上传大约 100 张自己的照片,并将其标记为类别 1。然后,您上传另外 100 张您的猫的照片,并将其标记为类别 2。

然后,您点击“训练模型”按钮,一个客户端的人工智能模型将学会识别您和您猫的图片。

然后,您可以使用这个模型对新图片进行新的预测。谷歌在一段时间前发布了 Teachable Machine,这样不精通人工智能的人也可以访问该网站并训练他们自己的模型。它让非技术人员也能熟悉人工智能。您可以构建您自己版本的谷歌 Teachable Machine。

您需要采取的步骤如下

  • 创建一个客户端应用程序,允许用户上传不同类别的图片。
  • 收集图片,进行变换,并在预训练模型的基础上进行训练。您可以使用像 JavaScript 这样的语言在客户端完成此操作。可以通过 ml5.js 和 tensorflow.js 等语言在 JavaScript 中访问预训练的人工智能模型。
  • 模型训练完成后,在屏幕上发送一个通知,以便用户知道已经完成。然后,让用户上传每个类别的照片,以便对新图片进行预测。

结论

为初学者开展人工智能项目提供了宝贵的学习机会,培养了对算法、数据处理和解决问题的更深理解。通过实践项目,初学者在机器学习、自然语言处理和计算机视觉方面获得实用技能,使他们能够为不断发展的人工智能领域做出重要贡献。