- 准确的汉字 Unicode 编码范围参考网站 汉字 Unicode 编码范围
- 编码信息存在外部txt文本,程序动态读取解析
- 新建unicode.txt,把所有的编码信息保存进去
4.文件另存为,格式选择ANSI
4. 程序代码
void ParseUnicode(std::string file)
{
std::vector<std::string> data;
ReadFile(file, data);
int startIndex = 0x4E00;
//start 4e00 [0123456789ABCDEF]
int size = data.size();
for(int i = 0; i < size; i++){
int strSize = data[i].size();
for(int j=0;j<strSize;j+=2){
std::string name = data[i].substr(j, 2);
characterForms[name] = startIndex;
startIndex++;
}
}
}
void ReadFile(std::string file, std::vector<std::string>& data)
{
std::fstream fin;
fin.open(file);
if(!fin.is_open())
{
printf("cound open file %s\n", file.c_str());
return;
}
std::string line;
while(std::getline(fin, line))
{
data.push_back(line);
}
fin.close();
}
5.程序运行效果