当前位置:首页|资讯

win32 判断UTF-8无BOM编码的编码格式

作者:大漠孤烟爱长河落日发布时间:2024-10-12

1文本文件的编码有以下几种常用样式

A.ASCII    多字节字符char字符串

B.UNICODE     宽字符 wchar_t字符串

C.UTF-8        无BOM的UTF-8字符编码

D.UTF-8-BOM    有BOM的UTF-8字符编码


2。读取方法

   A.读取ASCII编码就是直接从文件头读取到文件尾

    B。读取UNICODE 是要跳过前2个字节,再读取数据

    C。读取UTF-8-BOM 要跳过前3个字节,再读取数据

    D。读取UTF-8  无BOM的编码,

        因为前面没有BOM标识编码格式,所以无法区分是Ascii还是UTF-8

        在网上找到的方法:

        读取前三个字节用以下方法判断是UTF-8还是ASCII

3。判断编码是AScii还是UTF-8

返回真就是UTF-8无BOM编码格式,返回false为ASCII编码格式


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1