使用 TextBlob 进行词形还原和分词2024 年 8 月 29 日 | 阅读 3 分钟 词形还原是将不同的屈折词形式连接起来,使之被视为同一个词。词形还原类似于词干提取。然而,它为词语提供了上下文含义。它还将共享相同含义并被视为同一个词的词语联系起来。文本预处理包括词干提取和词形还原。有时人们会混淆这两个术语,并且它们经常被视为相同。然而,词形还原比词干提取更有优势,因为它允许研究词语的形态学。 词形还原的应用
词形还原的例子 词干提取和词形还原之间的主要区别在于,词形还原需要词性参数“pos”。如果未提供,则默认为“名词”。下面是如何使用 TextBlob 实现词形还原的方法。 代码 输出 painters: painter birds: bird worst: bad 使用 TextBlob 分词TextBlob 模块是一个 Python 库,它提供了一个易于使用的 API 来执行简单的 NLP 任务。该模块基于 NLTK 模块开发。 在终端使用以下命令安装 TextBlob 这将启用 TextBlob,并下载所需的 NLTK 语料库。由于需要下载大量的分词器、分块器、各种算法和整个语料库,因此上述过程可能需要很长时间。 常用的术语包括
代码 输出 Word Tokenize from paragraph: ['There', 'were', 'three', 'friends', 'name', 'Jemmy', 'Jacky', 'Kenny', 'They', 'have', 'been', 'friends', 'forever', 'since', 'pre', 'school.but', 'somehow', 'Jemmy', "'s", 'bestfriend', 'is', 'Jacky', 'and', 'whenever', 'jemmy', 'and', 'kenny', 'lefts', 'alone', 'they', 'endup', 'being', 'quite.One', 'day', 'they', 'all', 'decided', 'to', 'plan', 'a', 'trip', 'together', 'after', 'graduation', 'They', 'all', 'went', 'to', 'KashmireKashmire', 'trip', 'was', 'really', 'good', 'they', 'all', 'created', 'lifetime', 'memories', 'together', 'After', 'that', 'trip', 'they', 'have', 'to', 'focus', 'on', 'there', 'future', 'Which', 'stream', 'they', 'have', 'to', 'choose', 'and', 'career', 'path', 'they', 'should', 'choose', 'for', 'future'] Sentence Tokenize from paragraph: [Sentence("There were three friends name, Jemmy, Jacky, Kenny."), Sentence("They have been friends forever since pre school.but somehow Jemmy's bestfriend is Jacky and whenever jemmy and kenny lefts alone, they endup being quite.One day they all decided to plan a trip together after graduation."), Sentence("They all went to KashmireKashmire trip was really good, they all created lifetime memories together."), Sentence("After that trip they have to focus on there future."), Sentence("Which stream they have to choose and career path they should choose for future.")] 下一个话题如何在 Python 中四舍五入数字 |
在本教程中,我们将使用 Python 学习统计及其组件,解决统计问题,并探索其背后的概念。统计是每个数据科学爱好者都应该很好理解的关键概念。Python 提供了一些统计库,它们...
阅读 8 分钟
Python 是最广泛使用的编程语言之一。凭借其易于理解的语法、高效率和一流的开源库,我们可以用 Python 做任何事情。然而,我们可能已经注意到,有些人喜欢 Python 2,而另一些人则喜欢 Python 3。两者之间的区别是...
阅读 2 分钟
简介:在本教程中,我们将讨论。常量是其值不能更改的特定变量。在Python中,常量通常在模块(包含变量、函数等的新报告,这些报告被导入到主文件中)中声明和赋值。在编程中,一个周期通常是...
阅读 6 分钟
装饰器是 Python 的一个有用工具,因为它们用于修改函数的行为而无需永久更改它。我们在 Python 装饰器教程中详细解释了装饰器。在本教程中,我们将学习分派装饰器及其...
阅读 3 分钟
我们已经讨论过边缘计算及其在 ious 教程中的各种功能。让我们扩展一下在边缘计算项目列表想法第一部分中讨论的想法。用于车辆边缘计算的深度强化学习型卸载调度项目描述:一种新的计算范式,称为车辆云…
阅读 12 分钟
?如果你渴望在机器学习领域获得成功的职业生涯,让我们向你介绍另一个有趣的包,它的功能会让你惊叹不已。那么,让我们看看 statsmodels 是什么以及它有哪些功能?Statsmodels 是 Python 中一个流行的库,它使得...
阅读 3 分钟
1. Kivy的安装 我们需要PyGame才能使用Kivy。PyGame是首批Python游戏开发包之一。注意:我使用Windows操作系统和Python。请查看Kivy在线文档以获取Mac OS的相关信息。我们将首先使用“pip”安装PyGame,然后安装Kivy。如果您有任何构建...
阅读 3 分钟
有各种 Python 程序,我们必须使用密钥、密码短语或密码进行秘密交易或识别有权执行某些活动的用户。在接受密钥时必须注意各种操作,即...
阅读 4 分钟
在本教程中,我们将学习用户如何使用 Python 根据条件在 Pandas DataFrame 中选择行。用户可以使用“>”、“=”、“<=”、“>=”、“!=”运算符根据特定列值选择行。条件:我们将讨论可以应用于...
阅读20分钟
在这个数字时代,实时信息变得至关重要,尤其是在规划旅行时。能够获取火车的实时运行状态和 PNR(乘客姓名记录)信息,无论是您经常旅行还是偶尔旅行,都能极大地改善您的旅行体验……
5 分钟阅读
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India