Python 中的标记和字符集

2024 年 8 月 29 日 | 阅读 6 分钟

Python 是一种高级、通用的编程语言。其语法允许开发人员用最少的代码行(称为脚本)来表达他们的想法。它注重代码的可读性。字符集和 Token 都包含在这些脚本中。在本教程中,我们将深入了解各种字符集和 Token。

字符集

Python 中的字符集是脚本语言在编写脚本时能够识别的合法字符的集合。在这种情况下,我们指的是 Python 编程语言。因此,Python 中的字符集是 Python 语言可以识别的合法字符集合。这些代表了 Python 脚本语言支持的字符。Python 兼容所有 ASCII 和 Unicode 字符,包括:

  • 字母:包括所有小写字母 (a-z) 和大写字母 (A-Z)。
  • 数字:包括所有单个数字 0-9。
  • 特殊符号:包括所有类型的特殊字符,“ 'l ; : ! ~ @ # $ % ^ ` & * ( ) _ + - = { } [ ] \ .
  • 空格:空格也是字符集的一部分。包括制表符、换行符、空格和回车符。
  • 其他:Python 支持构成 Python 字符集的所有类型的 ASCII 和 UNICODE 字符。

Token

Python 程序中最小的独立元素称为 Token。Token 用于构建程序中的每个短语和命令。不同的 Python Token 包括:

关键字

在计算机语言中,关键字是具有特殊重要性或含义的英文单词。我们不能出于任何任意原因使用它们,包括作为函数或变量的名称。它们因其独特性质而被使用。Python 中的 33 个关键字包括但不限于:try、break、continue、except、or、False、True、class、and、as、assert、print、import、raise、while、for、in、not、if、elif 等。

代码

输出

12
18
21
25
30
32

标识符

为任何变量、类、函数、列表、方法等分配的用于识别它们的名称称为标识符。Python 对命名标识符有一些规则,并且它是一种区分大小写的编程语言。要创建标识符,请遵循以下准则: -

  • 如前所述,Python 区分大小写。因此,在定义标识符时,大小写很重要。因此,“python”和“Python”是不可互换的。
  • 标识符前面可以是大写字母 (A-Z)、小写字母 (a-z) 或下划线 (_)。任何其他字符都不能用作起始点。
  • 数字也可以作为标识符的成员,与字母和下划线一起,但它们不能是第一个字符。
  • 在创建标识符时,必须避免使用任何其他特殊符号或空格。
  • 关键字不能是标识符。

代码

输出

Hello
Javatpoint
World
!!

字面量或值

在源程序中使用的常量值或数据对象称为字面量。Python 支持多种类型的字面量,包括:

字符串字面量:Python 字符串字面量用单引号、双引号或三引号括起来的文本表示。例如,“Computer Programming”、“sigma”等。还可以使用三引号书写多行短语。

代码

输出

Hello
World
Python is a
    high-level and
    general purpose language

字符字面量:另一种字符串字面量称为字符字面量,它将字母括在单引号或双引号中。

数字字面量:这些是写成数字的字面量。Python 支持以下三种数字字面量:

  • 整数字面量:包含 0 以及正数和负数。不包含小数部分。此外,还允许使用二进制、十进制、八进制和十六进制的字面量。
  • 浮点数字面量:它包含正数和负数范围内的实数。它也包含小数部分。
  • 复数字面量:它包含 a+bi 形式的数字,其中 a 代表实部,b 代表虚部。

代码

输出

literal 50 is of type <class 'int'>
literal 13.3 is of type <class 'float'>
literal -14 is of type <class 'int'>

布尔字面量

在 Python 中,布尔 Token 只有两个可能的值。每一个都是 True 或 False。

代码

输出

The Boolean value of v is True
The Boolean value of w is False
The Boolean value of y is True
The value of z is 11

特殊字面量

Python 中存在特殊字面量“None”。它用于表示空、缺乏值或虚无。

代码

输出

None

字面量集合

列表、字典、元组和集合是 Python 字面量集合的示例。

  • 列表:它是一个由方括号括起来的、由逗号分隔的元素列表。这些元素可以是任何数据类型,并且可以被修改。
  • 元组:在圆括号中,它类似于列表,包含逗号分隔的项或值。这些值是固定的,并且可以包含任何 Python 数据类型。
  • 字典:这种数据结构是一组无序的键值对。
  • 集合:它是包含在花括号“{}”中的一组元素。

代码

输出

Literal [23, 'Python', 1.2, 'Character'] is of type <class 'list'>
Literal (1, 3, 6, 'world') is of type <class 'tuple'>
Literal {'a': 1, 'b': 2, 'c': 3} is of type <class 'dict'>
Literal {9, 3, 5, 7} is of type <class 'set'>

运算符

这些代表表达式中负责执行操作的 Token。操作数是执行操作的元素。运算符有二元和一元形式。一元运算符作用于单个参数,例如取反等。同时,二元运算符的操作数需要两个。

代码

输出

x == y = False
x * y = 10
x & y = 0
x | y = 7
x += y = 7
x /= y = 3.5