C/C++ mbrlen() 函数

2024 年 8 月 29 日 | 阅读 3 分钟

在本文中，您将了解 C++ 中的 mbrlen() 函数及其语法、参数和示例。

mbrlen() 函数用于多字节字符处理，是 C 和 C++ 编程语言中 <uchar.h> (C) 或 <cuchar> (C++) 头文件的一个组成部分。此函数旨在确定多字节字符序列中下一个多字节字符的字节数。

目的

mbrlen() 方法的主要目的是查找给定多字节字符字符串中完成下一个多字节字符所需的字节数。它有助于处理和解析多字节字符序列。

语法

它具有以下语法：

参数

s：多字节字符序列的指针。
n：可检查的最大字节数。
ps：指向类型为 mbstate_t 的转换状态跟踪对象的指针。

返回值

如果序列中的下一个多字节字符有效，则函数返回构成该字符的字节数。
如果发生错误或多字节字符序列结束，函数返回 0。
如果接下来的 n 个字节不构成完整的多字节字符，函数返回 static_cast<size_t>(-2)。

多字节字符编码

UTF-8、UTF-16 或 UTF-32 等多字节字符编码在国际化中经常用于表示字符。这些编码表示来自不同语言和脚本的各种字符。每个字符可能跨越多个字节，解码此类符号需要特殊处理。

字符编码用于在计算机系统中表示字符。从字符到其二进制表示的映射称为字符编码。在某些字符集（例如 ASCII）中，每个字符使用一个字节。对于像中文、日文或西里尔文这样具有庞大字符集的语言，单个字节是不够的。此类字符通过多字节字符编码利用多个字节来表示。

用例

处理字符串： mbrlen() 函数用于在处理多字节字符字符串时查找每个多字节字符的长度。

国际化和本地化： mbrlen() 函数确保在必须处理多种语言和字符集的程序中正确处理多字节字符。

示例

让我们举一个例子来说明 C++ 中 mbrlen() 函数的使用

#include <bits/stdc++.h> 
using namespace std; 
//Function to find the size of the multibyte character 
void check_(const char* str, size_t num) 
{ 
	// Multibyte conversion state 
	mbstate_t ps = mbstate_t(); 
	// number of bytes to be saved in returnV 
	int return_V = mbrlen(str, num, &ps); 
	if (return_V == -2) 
		cout << "Next " << num << " byte(s) doesn't"
			<< " represent a complete"
			<< " multibyte character" << endl; 

	else if (return_V == -1) 
		cout << "Next " << num << " byte(s) doesn't "
			<< "represent a valid multibyte character" << endl; 
	else
		cout << "Next " << num << " byte(s) of "
			<< str << "holds " << return_V << " byte"
			<< " multibyte character" << endl; 
} 
int main() 
{ 
	setlocale(LC_ALL, "en_US.utf8"); 
	char str[] = ""; 
	// test for first 1 byte 
	check_(str, 1); 
	// test for first 3 byte 
	check_(str, 3); 
	return 0; 
} 

输出

Next, 1 byte(s) holds 0 byte multibyte character
Next 3 byte(s) holds 0 byte multibyte character

说明

1. 头文件和命名空间

代码使用 std 命名空间并提供所需的头文件，例如 <bits/stdc++.h>。

2. check_ 函数

此函数需要一个多字节字符字符串 (str) 和要检查的字节数 (num) 才能工作。
初始化一个多字节转换状态（mbstate_t 对象 ps）。
使用 mbrlen() 函数从字符串中指定点开始计算多字节字符的大小。

然后函数检查 mbrlen() 的返回值

如果返回值为 -2，则接下来的 num 字节不构成完整的多字节字符。
如果返回值为 -1，则接下来的 num 字节不表示有效的多字节字符。
否则，它输出多字节字符的字节大小。

3. main 函数

'setlocale()' 将区域设置设置为 "en_US.utf8"。定义了一个空字符数组 str。

“check_ 函数”被调用两次

首先使用 'num = 1;' 测试第一个字节的大小。
接下来，使用 'num = 3' 确定前三个字节的大小。

4. 输出解释

鉴于 str 是一个空字符串 ("")，结果将显示接下来的 num 字节不构成有效或完整的多字节字符。

下一个主题C/C++ 中的 mbrtoc32()

C/C++ mbrlen() 函数

目的

语法

参数

返回值

多字节字符编码

用例

示例

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C++ 教程

C++ 控制语句

C++ 函数

C++ 数组

C++ 类和对象

C++ 构造函数

C++ 继承

C++ 多态

C++ 抽象

C++ 命名空间

C++ 模板

C++ 字符串

C++ 指针

信号处理

C++ 异常

C++ 文件与流

C++ STL 教程

面试题

选择题

C++ 程序

C++ STL Stack

C++ STL Bitset

C++ STL Deque

C++ STL List

C++ STL Map

C++ STL Math

C++ STL priority_queue

C++ STL Queue

C++ STL Multiset

C++ STL Multimap

C++ STL Set

C++ STD Strings

C++ STL Vector

C++ 操纵符

C++ STL Algorithms

C++ Algorithm

C++ Iterators

C++ 杂项

C/C++ mbrlen() 函数

目的

语法

参数

返回值

多字节字符编码

用例

示例

相关帖子

C++ STL 中的 match_results empty()

在 C++ 中添加向量

C++ 命名约定

C++ 计时器实现

C++ Prim 算法

二元决策树

C++ 迭代快速排序程序

C++ STL 中的 multimap::emplace_hint() 函数

C++ Shell 排序

C++ break 和 continue 的区别

订阅 Tpoint Tech

联系信息

关注我们