Python 中的情感分析2025年1月12日 | 阅读 6 分钟 在本文中,我们将讨论 Python 中的情感分析。这个应用程序再次证明了这种编程语言是多么通用。但在开始情感分析之前,让我们先看看我们都应该了解的背景知识: 所以,在这里我们将讨论-
让我们从自然语言处理开始- 简单来说,我们可以说计算机可以理解和处理人类语言。这里的目标是从文本数据中获取有用的信息。输入的原数据会经历不同的处理阶段,以便我们对其进行所需的操作。 在数据清理阶段,我们会得到一个称为“干净文本”的单词列表。其中一些步骤包括分词、停用词移除、词干提取和向量化(将单词转换为数字的过程),然后最后我们进行分类,也称为文本标记或文本分类,在这里我们将文本分类到明确定义的组中。 所以,以上就是关于自然语言处理的全部内容,现在让我们看看开源工具自然语言处理工具包可以如何帮助我们。 这是一个平台,我们使用它来编写 Python 程序,这些程序可用于实现自然语言处理的所有预处理阶段。 现在,下一个任务是分类我们的文本,可以使用朴素贝叶斯算法来完成,所以让我们来理解它是如何工作的? 这个监督算法的原理基于贝叶斯定理,我们使用这个定理来计算条件概率。 贝叶斯定理由给定的数学公式表示- P(A|B) = P(B|A)*P(A)/P(B) P(A|B)(后验概率)- 事件 B 已发生时事件 A 发生的概率。 P(B|A)(似然概率)- 事件 A 已发生时事件 B 发生的概率 P(A)(先验概率)- 事件 A 发生的概率。 P(B)(边缘概率)- 事件 B 发生的概率。 情绪分析在了解了先决条件后,让我们详细了解一下情感分析到底是什么,以及如何在 Python 中实现它? 情感分析用于检测或识别文本中包含的情感。 这种分析有助于我们获取文本的参考,这意味着我们可以理解内容是积极的、消极的还是中性的。 纵观当前形势,所有商业巨头都需要清楚地了解他们的产品从客户那里收到了什么样的反馈,以及如何根据不断出现的需求进行改进。 以下是情感分析过程涉及的步骤-
让我们通过一个例子来理解这一点- 在这里,我们在训练数据集 (x_train) 中取了一些句子,在 y_train 中取了值 0 和 1,其中 1 表示积极,0 表示消极。 代码 输出 ![]() 2. 下一步是导入将帮助我们实现自然语言处理中主要过程所需的库。 让我们来理解分词、词干提取和停用词的过程-
代码 输出 ![]() 3. 下一步是创建分词器、停用词和 PortStemmer 的对象。 我们想连接单词,所以我们将使用正则表达式并将 `\w+` 作为参数传递。 由于我们使用的是英语,我们将指定“english”作为停用词中的参数。 代码 输出 ![]() 4. 下一步是创建一个函数来清理我们的数据。 我们将把文本转换为小写,然后实现分词。 在给定的函数中,我们同时执行分词和停用词移除。(token for token in tokens if token not in en_stopwords) 接下来的事情是进行词干提取,然后连接词干化的词。 代码 输出 ![]() 5. 以下是我们将用于清理目的的 x_test 数据。 代码 输出 ![]() 6. 在此步骤中,我们已从 X_train 和 X_test 获取了数据并对其进行了清理。 代码 输出 ![]() 7. 当我们想查看清理后的数据时,可以通过键入 X_clean 来完成- 代码 输出 ![]() 8. 在进行分类之前,执行向量化以获得所需格式很重要。为此,我们需要导入一些库。 代码 输出 ![]() 9. 特征名称有助于我们了解 0 和 1 的值代表什么。可以使用以下方法完成: 代码 输出 ![]() 10. 现在,为了执行文本分类,我们将使用多项式朴素贝叶斯- 代码 输出 ![]() 预测时,它会以数组 [1,0] 的形式给出结果,其中 1 表示测试集中的积极,0 表示消极。 因此,在本文中,我们讨论了理解情感分析的先决条件以及如何在 Python 中实现它。 |
在这个问题中,我们将得到两个已排序的数组。我们的任务是合并这两个给定的数组。然而,限制是,我们必须在不使用任何额外空间的情况下合并它们。因此,在对数组进行排序后,初始元素将位于...
阅读20分钟
在以下教程中,我们将讨论 Apache Kafka 及其在 Python 编程语言中的使用。了解 Apache Kafka Apache Kafka 是一个开源流平台,最初由 LinkedIn 设计。后来,它被移交给 Apache 基金会并于 2011 年开源。根据...
阅读 8 分钟
切比雪夫多项式是正交多项式家族,用于数学的各个分支,例如信号处理、数值分析和近似理论。切比雪夫多项式可用于使用切比雪夫级数近似函数。切比雪夫级数是切比雪夫多项式的集合...
阅读 3 分钟
在下一个教程中,我们将讨论一个名为 LanguageTool 的 Python 包,并了解如何使用 Python 编程语言创建一个简单的语法和拼写检查器。那么,让我们开始吧。了解 Python 中的 LanguageTool 库 LanguageTool 是一个用于语法和拼写检查的开源工具,...
7 分钟阅读
简介:在本文中,我们讨论在 Python 中向函数传递数组。数组是一组相似记录类型,作为连续内存块存储在内存中。这意味着多维数组在内存中也是连续的数据块。在 Python 中,数组...
阅读 4 分钟
在本教程中,我们将编写一个 Python 程序来查找两个给定字符串之间的差异。这个问题可能会在面试中出现。让我们理解问题陈述,然后我们将着手解决。问题陈述 - 给定两个字符串 s……
阅读 3 分钟
众所周知,交通并不总是畅通无阻;然而,汽车完美地穿过十字路口、转弯和在交通信号灯处停车,看起来可能很壮观。这一观察让我们思考交通流量对人类文明的重要性。在下面的教程中,我们将了解...
阅读 33 分钟
从太空观察太阳系会非常有趣。事实上,为什么不使用 Python 来制作太阳系的视觉描绘呢?在这个项目中,太阳系将使用 Python 进行图形表示。什么是太阳系?地球是其中的一员...
阅读 6 分钟
肺炎是由细菌、病毒或真菌引起的一种可能危及生命的肺部感染。肺炎的早期发现和诊断对于有效治疗和改善患者预后至关重要。近年来,卷积神经网络(CNN)等深度学习技术在……
阅读 10 分钟
?在本教程中,我们将学习如何使用 Graphviz 在 Python 中绘制(想象)一个大脑网络。Graphviz 是一个开源图表表示编程的 Python 模块。它在科学家中广为人知,用于进行表示。它将主要数据作为概念图的图表来处理...
11 分钟阅读
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India