<wctype.h>
-- 函数
阅读:0
作者:严长生
iswpunct() 判断一个宽字符是否是标点符号
int iswpunct (wint_t wc);
iswpunct() 函数用来检测一个宽字符是否是标点符号。标点符号必须是图形字符(iswgraph() 返回“真”),但不能是字母,也不能是数字(iswalnum() 返回“假”)。
iswpunct() 是 ispunct()(位于<ctype.h>中)的宽字符版本:如果参数 wc 能够被 wctob() 转换为单个字节的形式,并且转换后的字符使用 ispunct() 检测返回“真”(非零值),那么 iswpunct() 也一定会将 wc 判定为标点符号。
参数
-
wc
要检测的宽字符。它可以是一个有效的宽字符(被转换为 wint_t 类型),也可以是 WEOF(表示无效的宽字符)。
返回值
返回值为非零(真)表示wc
是标点符号,返回值为零(假)表示wc
不是标点符号。
实例
统计一个宽字符串中标点符号的个数。#include <stdio.h> #include <wchar.h> #include <wctype.h> int main () { int i=0; int cx=0; wchar_t str[] = L"C,CPP,Java,Python!"; while (str[i]) { if (iswpunct(str[i])) cx++; i++; } wprintf (L"The sentence contains %d punctuation characters.\n", cx); return 0; }运行结果:
he sentence contains 4 punctuation characters.
关于标点符号
一个宽字符是否是标点符号和程序的语言环境有关。C语言支持全球的语言系统,可以处理英文、中文、日文、韩文、德语、法语、拉丁文、希腊文等。我们可以通过 setlocale() 函数进行地域设置,改变程序的语言环境,让程序使用 ASCII 以外的字符集,它们可能包含了更多的标点符号。
在默认的地域设置(默认为
"C"
)中,C语言通常使用 ASCII 编码,此时,除了字母和十进制数字以外的所有图形字符都会被判定为标点符号;也就是说,是 iswgraph() 但不是 iswalnum() 的字符才是 ispunct() 的字符。在其它地域设置中,程序可能会使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等更加复杂的编码,它们包含了大量的标点符号,例如中文逗号
,
、句号。
、省略号……
等。但是,不管在哪种地域设置下,iswpunct() 都必须是 iswgraph(),但不能是 iswalnum()。【实例】在简体中文环境下检测标点符号。
#include <wchar.h> #include <wctype.h> #include <locale.h> int main () { int i=0; int cx=0; wchar_t str[] = L"C、CPP、Java、Python、Golang!"; setlocale(LC_ALL, "zh_CN.UTF-8"); //设置为简体中文,使用 UTF-8 编码 //在 Windows 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "chs"); //在 Linux 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "zh_CN.UTF-8"); //在 Mac OS 下可以写作 setlocale(LC_ALL, "zh_CN"); 或者 setlocale(LC_ALL, "zh_CN.UTF-8"); while (str[i]) { if (iswpunct(str[i])) cx++; i++; } wprintf (L"The sentence contains %d punctuation characters.\n", cx); return 0; }运行结果:
The sentence contains 5 punctuation characters.