使用 TextBlob 进行词性标注2024 年 8 月 29 日 | 4 分钟阅读 TextBlob模块用于创建分析文本的程序。TextBlob模块中包含的最强大的功能之一是其词性标注。 首先,我们将安装TextBlob并运行这些命令 然后它将运行TextBlob并下载所需的NLTK语料库。上述安装过程可能需要很长时间,因为需要下载大量的分块器、分词器、其他算法以及所有语料库。 在语料库语言学中,词性标签(POS tagging,也称为PoS tagging或POST)也称为语法标签或词类别消歧。 以下是标签及其含义和一些示例的列表 CC:这是一个并列连词 CD:这是一个基数词 DT:这是限定词 EX:这是存在词there(例如:"there is"……可以理解为“there exists”表示存在) FW:这是一个外来词 IN:这是一个介词/从属连词 JJ:这是一个形容词例如:‘big’ JJR:这是一个形容词,例如:比较级‘bigger’ JJS:这是一个形容词,例如:最高级‘biggest’ LS:这是一个列表标记例如:1) 2) MD:这是一个情态动词例如:could,will NN:这是一个名词,例如:单数‘desk’ NNS:这是一个名词,例如:复数‘desks’ NNP:这是一个专有名词,例如:单数‘Harrison’ NNPS:这是一个专有名词,例如:复数‘Americans’ PDT:这是一个前限定词例如:‘all the kids’ POS:这是一个所有格结尾parent's PRP:这是一个人称代词,例如:I,he,she PRP$:这是一个物主代词,例如:my,his,hers RB:这是一个副词例如:very,silently, RBR:这是一个副词,例如:比较级better RBS:这是一个副词,例如:最高级best RP:这是一个短语动词的一部分give up TO:to go,例如:‘to’ the store. UH:这是一个感叹词例如:errrrrrrrm VB:这是一个动词,例如:基本形式take VBD:这是一个动词,例如:过去式took VBG:这是一个动词,例如:动名词/现在分词taking VBN:这是一个动词,例如:过去分词taken VBP:这是一个动词,例如:单数现在时,非第三人称take VBZ:这是一个动词,例如:第三人称单数现在时takes WDT:这是一个wh-限定词例如:which WP:这是一个wh-代词,例如:who,what WP$:这是一个物主wh-代词例如:whose WRB:这是一个wh-副词例如:where,when 代码 输出 [('Jack', 'NNP'), ('Jill', 'NNP'), ('and', 'CC'), ('Bill', 'NNP'), ('are', 'VBP'), ('living', 'VBG'), ('in', 'IN'), ('America', 'NNP'), ('Jack', 'NNP'), ('use', 'NN'), ('to', 'TO'), ('go', 'VB'), ('for', 'IN'), ('running', 'VBG'), ('every', 'DT'), ('morning', 'NN'), ('but', 'CC'), ('he', 'PRP'), ('got', 'VBD'), ('fever', 'RB'), ('last', 'JJ'), ('night', 'NN'), ('therefore', 'VBD'), ('her', 'PRP$'), ('will', 'MD'), ('not', 'RB'), ('be', 'VB'), ('going', 'VBG'), ('for', 'IN'), ('running', 'VBG'), ('tomorrow', 'NN'), ('this', 'DT'), ('would', 'MD'), ('be', 'VB'), ('his', 'PRP$'), ('first', 'JJ'), ('time', 'NN'), ('of', 'IN'), ('breaking', 'VBG'), ('his', 'PRP$'), ('running', 'VBG'), ('streak', 'NN'), ('jill', 'NN'), ('is', 'VBZ'), ('a', 'DT'), ('school', 'NN'), ('teacher.he', 'NN'), ('believes', 'VBZ'), ('in', 'IN'), ('meditation', 'NN'), ('he', 'PRP'), ('practice', 'NN'), ('mediating', 'VBG'), ('daily', 'RB'), ('for', 'IN'), ('an', 'DT'), ('hour', 'NN'), ('bill', 'NN'), ('is', 'VBZ'), ('a', 'DT'), ('fun', 'NN'), ('guy', 'NN'), ('for', 'IN'), ('him', 'PRP'), ('laughing', 'VBG'), ('is', 'VBZ'), ('the', 'DT'), ('best', 'JJS'), ('medicine', 'NN')] 本质上,POS tagger的目的是为子句子单元分配(主要是与语法相关的)语言细节。它们也称为token,并且大多数时候,它们对应于符号和单词(例如,标点符号)。 |
如果一个数的平方的最后几位与这个数本身相同,那么这个数就被称为自守数。以下是自守数的例子:1. 输入:25 输出 - 是的,它是一个自守数。原因 - 25 的平方是 625,...
阅读 3 分钟
什么是数据框?如果数据以行和列或二维数据的形式存储,那么在 Pandas 中通常称为数据框。在 Pandas 中,我们可以借助 lambda 函数将任何函数添加到任何行或列。语法:lambda_Argument :...
阅读 3 分钟
简介:在本教程中,我们将讨论 pythonping 模块。PythonPing 是一种在 Python 中执行 ping 操作的流畅方式。这允许您像从终端一样向远程设备发送 ICMP 探测。PythonPing 是模块化的,因此您可以将其编写为独立函数或...
阅读 4 分钟
在本教程中,我们将学习如何使用 Python 程序获取国家信息。我们将讨论一个 Python 模块,以获取有关首都、货币、官方语言和许多其他信息。我们还将学习如何从电话号码中获取国家信息...
5 分钟阅读
Python 中的 fabs 方法用于返回数字的绝对值。可以通过导入 math 模块来使用它。Python 中的 math 模块可用于实现不同的基本数学运算,如加法、减法、除法和乘法。它也可以用于...
阅读 3 分钟
Python 是最强大的编程语言。它提供了广泛的工具和库来完成各种任务。主要工具之一是 subprocess 模块。它允许程序员生成新进程,连接到它们的输入/输出/错误管道,并获取它们的返回码……
5 分钟阅读
许多网站会提供关于任何技术的最新新闻,而文章可以通过其收到的评论数量来评估。如果新闻是关于加密货币的,并且文章取自 cointelegraph.com,我们可以轻松地计算并存储每条新闻...
阅读 6 分钟
Flask 是一个流行的 Web 框架,用于构建基于 Python 的 Web 应用程序。它允许开发人员通过提供用于处理路由、渲染模板、管理会话以及处理请求和响应的工具来轻松创建 Web 应用程序。Web 应用程序的一个重要方面是处理用户输入。用户可能需要...
7 分钟阅读
数据分区是 PySpark 中的一种技术,它将大数据分成更小、更易于管理的数据块,称为分区。数据分区使 Spark 能够并行处理数据,从而提高性能并减少处理时间。在本文中,我们将讨论数据...
阅读 4 分钟
Boto3 是一个 Python 模块,允许开发人员以编程方式与亚马逊网络服务 (AWS) 资源进行交互。它提供了一个易于使用的 AWS 服务接口,使开发人员更容易构建与 AWS 服务交互的应用程序。使用 Boto3,开发人员可以在 AWS 上执行各种操作...
阅读 8 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India