<wctype.h>
-- 函数
阅读:0
作者:严长生
iswspace() 判断一个宽字符是否是空白符
int iswspace (wint_t wc);
iswspace() 函数用来检测一个宽字符是否是空白符。iswspace() 是 isspace()(位于<ctype.h>中)的宽字符版本:如果参数 wc 能够被 wctob() 转换为单个字节的形式,并且转换后的字符使用 isspace() 检测返回“真”(非零值),那么 iswspace() 也一定会将 wc 判定为空白符。
iswspace() 在 C89 标准中就已经存在了,后来的 C99 标准又新增了一个 iswblank() 函数,也用来判断一个宽字符是否是空白符,请猛击这里了解更多细节。
参数
-
wc
要检测的宽字符。它可以是一个有效的宽字符(被转换为 wint_t 类型),也可以是 WEOF(表示无效的宽字符)。
返回值
返回值为非零(真)表示wc
是空白符,返回值为零(假)表示wc
不是空白符。
实例
检测一个宽字符串中是否存在空白字符,如果存在,请替换为换行符。#include <stdio.h> #include <wctype.h> int main () { wchar_t c; int i=0; wchar_t str[] = L"C C++ Java Python Golang JavaScript\n"; while (str[i]) { c=str[i]; if (iswspace(c)) c = L'\n'; putwchar (c); i++; } return 0; }运行结果:
C
C++
Java
Python
Golang
JavaScript
关于空白符
一个宽字符是否是空白符和程序的语言环境有关。C语言支持全球的语言系统,可以处理英文、中文、日文、韩文、德语、法语、拉丁文、希腊文等。我们可以通过 setlocale() 函数进行地域设置,改变程序的语言环境,让程序使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等 ASCII 以外的字符集,它们包含了更多的空白符。
在默认的地域设置(默认为
"C"
)中,程序一般使用 ASCII 编码,此时的空白符包括:字符 | ASCII码值 (十六进制) | 说明 (缩写) |
---|---|---|
' ' | 0x20 | 空格 (SPC) |
'\t' | 0x09 | 水平制表符 (TAB) |
'\n' | 0x0a | 换行符 (LF) |
'\v' | 0x0b | 垂直制表符 (VT) |
'\f' | 0x0c | 换页 (FF) |
'\r' | 0x0d | 回车 (CR) |
在其它的地域设置中,空白符可能不止这些。例如在“简体中文”环境下,有的空格占用一个中文字符的位置,有的占用四分之三个中文字符的位置,有的占用半个中文字符的位置,最小的占用四分之一个字符的位置,它们都是空白符。
请看下面的字符串:
"a b中 文"
a
和b
之间是一个英文空格,它占用一个英文字符的位置;中
和文
之间是一个中文空格,它占用一个中文字符的位置,比英文空格要宽一倍。这个“中文空格”只有在中文环境下才被认为是空白符,在英文环境下(严格来说是默认的"C"
地域设置)不是空白符。
将输入法切换到全角,按下空格键就可以得到中文空格。下面我们通过代码来验证一下:
#include <wctype.h> #include <wchar.h> #include <locale.h> int main () { int i = 0; wchar_t str[] = L"a b中 文"; wchar_t c; setlocale(LC_ALL, "zh_CN.UTF-8"); //设置为简体中文,使用 UTF-8 编码 //在 Windows 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "chs"); //在 Linux 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "zh_CN.UTF-8"); //在 Mac OS 下可以写作 setlocale(LC_ALL, "zh_CN"); 或者 setlocale(LC_ALL, "zh_CN.UTF-8"); while (str[i]) { c = str[i]; if (iswblank(c)) wprintf(L"'%lc' is blank\n", c); else wprintf(L"'%lc' is not blank\n", c); i++; } return 0; }运行结果:
'a' is not blank
' ' is blank
'b' is not blank
'中' is not blank
' ' is blank
'文' is not blank