C/C++ mbrtoc32()

2024 年 8 月 29 日 | 4 分钟阅读

在本文中，您将学习 C++ 中的 mbrtoc32() 函数及其语法、参数和示例。

C/C++ 中的多字节字符序列可以使用标准库中的 mbrtoc32() 函数转换为宽字符（更准确地说，是由 char32_t 表示的 32 位宽字符）。此函数在处理 UTF-8 等字符编码时特别有用，因为这些编码需要多个字节来表示单个字符。

语法

它具有以下语法：

参数

pc32：指向 char32_t 变量目的地的指针，结果将存储在此处。
s：指向要转换的由多个字节组成的字符序列的指针。
n：多字节字符序列中必须考虑进行转换的字节数。
ps：对 mbstate_t 转换状态的引用。此状态在转换跨越多次 mbrtoc32() 调用的多字节序列时存储信息。

返回值

如果“s”指向空字节，则“0”表示多字节序列的结束。
如果 's' 指向无效的多字节序列，它返回 static_cast<size_t>(-1)（表示错误的常量）。
否则，它返回从输入多字节序列中消耗的字节数。

mbrtoc32() 的关键点

C++ 中的 mbrtoc32() 有几个关键点。mbrtoc32() 的一些主要点如下：

1. 区域设置依赖性

mbrtoc32() 的行为受当前区域设置设置的影响。不同区域设置中使用的字符编码可能不同，从而影响转换函数。

2. 错误处理

该函数旨在处理无效的多字节序列。如果遇到无效序列，它将返回一个错误代码 (static_cast<size_t>(-1))，表示转换中存在错误。

3. 有状态转换

可以使用 mbstate_t 参数实现有状态转换。当函数调用时，状态会更新并可以再次使用。

4. UTF-8 和 Unicode 支持

当以 UTF-8 编码时，可以使用 mbrtoc32() 函数将 UTF-8 多字节序列转换为由 char32_t 表示的匹配 Unicode 码点。它使得处理许多不同的字符（包括那些超出基本多语言平面的字符）变得更容易。

5. 多字节字符处理

尽管单个字符可能由多个字节表示，但此函数有助于处理多字节字符。它保证准确转换以及有关所用字节量的信息。

示例

让我们举一个例子来演示 C++ 中的 mbrtoc32() 函数

#include <cstdio>
#include <cstdlib>
#include <iostream>
#include <uchar.h>
#include <wchar.h>
using namespace std;
int main(void)
{
 char32_t hold;
 char str[] = "";
 mbstate_t arr{};
 int len;
 //initializing the function
 len = mbrtoc32(&hold, str, MB_CUR_MAX, &arr);
 if (len < 0)
 {
 perror("conversion failed");
 exit(-1);
 }
 cout << "The String is: " << str << endl;
 cout << "The Length is: " << len << endl;
 printf("32-bit character = 0g%02hd\n", hold);
}

输出

The String is: 
The Length is: 0
32-bit character = 0g00

说明

1. 头文件

代码中包含了所需的头文件，包括 <cstdio>、<cstdlib>、<iostream>、<uchar.h> 和 <wchar.h>。

2. 命名空间

通过使用 using namespace std; 语句将整个 std 命名空间引入作用域，可以使用标准 C++ 标识符而无需 std::前缀。

3. 变量声明

char32_t hold;：声明一个 char32_t 类型的变量 hold 来存储转换后的宽字符。
char str[] = "";：它声明了一个字符数组 str，其初始值为空字符串。
mbstate_t arr{};：它在声明后将 mbstate_t 变量 arr 初始化为默认状态 {}。

4. 函数调用 - mbrtoc32

len = mbrtoc32(&hold, str, MB_CUR_MAX, &arr);：它调用 mbrtoc32() 函数将多字节序列 str 转换为 char32_t 宽字符。MB_CUR_MAX 用于指定当前区域设置中多字节字符的最大字节数。结果存储在 hold 中，消耗的字节数存储在 len 中。

5. 错误检查

它验证转换是否不成功 (len < 0)。如果是，则输出错误代码并使用 perror 输出错误消息，然后退出。

6. 输出

使用 std::cout 函数输出原始字符串 str 及其长度。

'printf' 用于以八进制格式打印 32 位字符。

7. 返回语句

return 0;：它表示程序已成功执行。

输出将表明字符长度为 0，因为提供的 str 是一个空字符串。转换后的 32 位字符将由状态信息决定。根据您的用例，您可以提供非空多字节序列来观察转换。

下一主题C++ 中的 ratio_greater() 函数

C/C++ mbrtoc32()

语法

参数

返回值

mbrtoc32() 的关键点

示例

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C++ 教程

C++ 控制语句

C++ 函数

C++ 数组

C++ 类和对象

C++ 构造函数

C++ 继承

C++ 多态

C++ 抽象

C++ 命名空间

C++ 模板

C++ 字符串

C++ 指针

信号处理

C++ 异常

C++ 文件与流

C++ STL 教程

面试题

选择题

C++ 程序

C++ STL Stack

C++ STL Bitset

C++ STL Deque

C++ STL List

C++ STL Map

C++ STL Math

C++ STL priority_queue

C++ STL Queue

C++ STL Multiset

C++ STL Multimap

C++ STL Set

C++ STD Strings

C++ STL Vector

C++ 操纵符

C++ STL Algorithms

C++ Algorithm

C++ Iterators

C++ 杂项

C/C++ mbrtoc32()

语法

参数

返回值

mbrtoc32() 的关键点

示例

相关帖子

C++ 工厂设计模式

C++ 私有继承

C++ 科学计数法转十进制形式

C++ 迭代快速排序程序

C++ 合并重叠区间

C++ ungetc() 函数

C++ std::numeric_limits::max() 和 std::numeric_limits::min()

C++ 中心二十面体数程序

C++ 静态变量

C++ 查找表

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题