利用汉字拼音首字母进行快速检索,效率比直接检索汉字高很多。在ASCII编码中,汉字是按拼音首字母的顺序进行编码的,也就是说拼音首字母相同的汉字的编译是连续的、相对集中的。那么就可以通过比较汉字ASCII码的大小来确定其拼音首字母了。例如:如果汉字的ASCII码 n 满足 n >=0xB0A1 && n <=0xB0C4,说明该汉字的拼音首字母是A。
// 判断var的值是否处于两者之间
bool Between(int var, int lower, int upper)
{
assert(upper >= lower);
return (var >= lower) && var <= upper;
}
ASCII用两个char来表示一个汉字,分别作为汉字ASCII值的高低位,因些将两个字符组合成一个ASCII值,就可以与拼音首字母的临界值比较了。
char GetPinyinHead(const char * pszText)
{
assert(strlen(pszText) == 2);
unsigned char hi = static_cast<unsigned char>(pszText[0]);
unsigned char low = static_cast<unsigned char>(pszText[1]);
int val= unsigned short(hi << 8) +low;
if (Between(val, 0xB0A1, 0xB0C4)) return 'A';
if (Between(val, 0XB0C5, 0XB2C0)) return 'B';
if (Between(val, 0xB2C1, 0xB4ED)) return 'C';
if (Between(val, 0xB4EE, 0xB6E9)) return 'D';
if (Between(val, 0xB6EA, 0xB7A1)) return 'E';
if (Between(val, 0xB7A2, 0xB8c0)) return 'F';
if (Between(val, 0xB8C1, 0xB9FD)) return 'G';
if (Between(val, 0xB9FE, 0xBBF6)) return 'H';
if (Between(val, 0xBBF7, 0xBFA5)) return 'J';
if (Between(val, 0xBFA6, 0xC0AB)) return 'K';
if (Between(val, 0xC0AC, 0xC2E7)) return 'L';
if (Between(val, 0xC2E8, 0xC4C2)) return 'M';
if (Between(val, 0xC4C3, 0xC5B5)) return 'N';
if (Between(val, 0xC5B6, 0xC5BD)) return 'O';
if (Between(val, 0xC5BE, 0xC6D9)) return 'P';
if (Between(val, 0xC6DA, 0xC8BA)) return 'Q';
if (Between(val, 0xC8BB, 0xC8F5)) return 'R';
if (Between(val, 0xC8F6, 0xCBF0)) return 'S';
if (Between(val, 0xCBFA, 0xCDD9)) return 'T';
if (Between(val, 0xCDDA, 0xCEF3)) return 'W';
if (Between(val, 0xCEF4, 0xD188)) return 'X';
if (Between(val, 0xD1B9, 0xD4D0)) return 'Y';
if (Between(val, 0xD4D1, 0xD7F9)) return 'Z';
return char(0);
}
字符串中有可能存在非汉字字符,对它们不作任何处理,直接保留。组成汉字ASCII码的两个char值都是小于0的,因此很容易判断字符是不是汉字。
string GetAllPinyinHeads(const char * pszText)
{
string rst, temp;
string strText = pszText;
for (int i = 0; i < strText.length(); i++)
{
if (strText[i] >= 0) // 大于等于0说明非汉字
{
rst += strText[i];
}
else
{
temp += strText[i];
if (temp.length() == 2)
{
rst += GetPinyinHead(temp.c_str());
temp.clear();
}
}
}
return rst;
}
int _tmain(int argc, _TCHAR* argv[])
{
string strTxt;
while (cin>>strTxt)
{
cout<<GetAllPinyinHeads(strTxt.c_str())<<endl;
}
return 0;
}
结果不必截图了吧,非常OK!
分享到:
相关推荐
用PB写的获取汉字拼音首字母函数,也就是汉字拼音的声母.
本程序用C#所写,用来获取汉字拼音首字母。
使用MySQL函数,实现获取汉字拼音首字母。在SQL语句中传入汉字返回对应的首字母
通过输入汉字获取汉字拼音首字母 很好用的奥
oracle获取汉字拼音首字母,用于根据首字母筛选汉字
java 获取汉字拼音首字母 源码 /** * GB 2312-80 把收录的汉字分成两级。第一级汉字是常用汉字,计 3755 个, 置于 16~55 * 区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字, 计 3008 个,置于 56~...
JS获取中文拼音首字母,并通过拼音首字母快速查找页面内的中文内容,效果查看:http://blog.csdn.net/testcs_dn/article/details/25116655
java提取汉字拼音首字母的代码,简体中文的编码范围从B0A1(45217)一直到F7FE(63486),不支持多音字处理
oracle获取汉字拼音拼音首字母的功能函数 oracle 获取汉字拼音
通过汉字获取其拼音首字母,可用于快速检索
一个获取汉字拼音首字母的java程序,简单有效。
案例:自动获取汉字拼音首字母>能够根据输入的中文汉字自动得到该中文汉字的拼音首字母
可以直接调用方法,有需要配合IndexBar-master这个通讯录开源控件使用的可以自己去下载IndexBar这个控件
VB获取汉字拼音首字母并返回大写字母的模块 VB获取汉字拼音首字母并返回大写字母的模块
本文实例讲述了JS实现获取汉字首字母拼音、全拼音及混拼音的方法。分享给大家供大家参考,具体如下: 这里需要用到一个js获取汉字拼音的插件,可点击此处本站下载。 运行效果如下: 完整示例代码: <!DOCTYPE ...
默认支持的是ANSI的字符集,需要使用其他字符集时,只要用记事本将pinyin.txt保存为相应的字符集重新生成即可。做一些字符串处理,用空格或者换行隔开,也可以获取汉字的全拼
java 取出汉语字符串各汉字拼音首字母并大写
VB获取汉字的拼音首字母 支持26000多汉字 可以自己添加汉字库 自动保存没能获取的汉字
支持2万+汉字转拼音首字母
这是我搜索网络资源,然后自己整理的一个输入汉字转拼音及获取首字母的一个示例程序,希望能帮助到兄弟姐妹们。