首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > C语言 >

怎么获得某个汉字的二进制代码呢

2013-07-04 
如何获得某个汉字的二进制代码呢?本帖最后由 zhou007jie 于 2013-06-15 23:31:07 编辑因为程序要用到二进

如何获得某个汉字的二进制代码呢?
本帖最后由 zhou007jie 于 2013-06-15 23:31:07 编辑 因为程序要用到二进制编码,
希望能够给出源代码,谢谢了!
最好是能够将任何unicode字符转换成二进制编码。 二进制 源代码 编码 Unicode 转换
[解决办法]

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/stat.h>
#include <fcntl.h>

char *itoa(int num,char *str,int radix)
{
/* 索引表 */
char index[]="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ";
unsigned unum; /* 中间变量 */
int i=0,j,k;
/* 确定unum的值 */
if(radix==10&&num<0) /* 十进制负数 */
{
unum=(unsigned)-num;
str[i++]='-';
}
else unum=(unsigned)num; /* 其他情况 */
/* 逆序 */
do
{
str[i++]=index[unum%(unsigned)radix];
unum/=radix;
}while(unum);
str[i]='\0';
/* 转换 */
if(str[0]=='-') k=1; /* 十进制负数 */
else k=0;
char temp;
for(j=k;j<=(i-k-1)/2;j++)
{
temp=str[j];
str[j] = str[i-1+k-j];
str[i-j-1]=temp;
}
return str;
}

int main(void)
{
int fd[2];
int ret = 0;
unsigned char kk;
char buf[100]="0";
//2.txt中为中文
fd[0] = open("./2.txt",O_RDWR);
if(fd[0] < 0) {
perror("open fail");
exit(1);
}
//3.txt为读取后保存的
fd[1] = open("./3.txt",O_RDWR 
[解决办法]
 O_CREAT);
if(fd[1] < 0) {
perror("open fail");
exit(1);
}
while(!((ret=read(fd[0],&kk,1))==EOF
[解决办法]
ret==0)) {
printf("%x",kk);
itoa(kk,buf,16);
//printf("%s\n",buf);
ret=write(fd[1],buf,2);
if(ret<0) {
perror("write fail");
exit(1);
}
}
printf("\n");
return 0;
}


[解决办法]
“啊”的
GBK
UNICODE(LE)
UNICODE(BE)
BIG5
SHIFT-JIS
UTF8
……
不一样。

推荐使用ConvertZ软件转换汉字编码。
推荐使用WinHex软件查看硬盘或文件或内存中的原始字节内容。

[解决办法]
汉字的直接转成unsigned short 就OK了 如果UTF8编码的话 就不行 utf8是变长编码 GBK和UNICODE可以
比如:
char* str = "汉";
unsigned short code = *((unsigned short*)str);
[解决办法]
引用:
我是想得到文字的二进制代码,
比如从unicode格式的文本中,读取一个“汉”字,
如何能获得这个“汉”字的机器码(二进制)呢?

内存中硬盘上所有的数据都是二进制,所以我真心不理解楼主到底是怎么想的
莫非楼主以为“汉”字在内存中是以非二进制形式存在的?

所有的字符,不管是UNICODE还是ANSII还是UTF,首先是二进制数据
当它们要显示的时候,才会根据编码来选择对应的像素矩阵,才会转化为屏幕上的图形


当然如果编码选错了,那显示出来的就是乱码

楼主问汉字怎么转化为二进制数据?
计算机上的所有字符,在显示到屏幕之前都是二进制数据!
[解决办法]
使用wprintf可以输出。
wchar_t a=L'身';
wprintf(L"%x",a);

结果为:8eab
用word可以查到'身'字符的Unicode编号为8EAB。
[解决办法]

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <locale.h>
int main() {
    int i,v;
    char bs[33];
    char b[33];
    char hs[9];
    char h[9];
    char s[4];
    char *e;

// 十进制整数转二进制串;
    i=1024;
    ltoa(i,b,2);
    sprintf(bs,"%032s",b);
    printf("i=%d,bs=%s\n",i,bs);
// 十进制整数转十六进制串;
    i=1024;
    ltoa(i,h,16);
    sprintf(hs,"%08s",h);
    printf("i=%d,hs=%s\n",i,hs);
// 十六进制字符串转成十进制数
    strcpy(hs,"00000400");
    sscanf(hs,"%x",&i);
    printf("hs=%s,i=%d\n",hs,i);
// 二进制字符串转化为十六进制字符串;
    strcpy(bs,"00000000000000000000010000000000");
    i=strtol(bs,&e,2);
    ltoa(i,h,16);
    sprintf(hs,"%08s",h);
    printf("bs=%s,hs=%s\n",bs,hs);
// 二进制字符串转化为十进制数;
    strcpy(bs,"00000000000000000000010000000000");
    i=strtol(bs,&e,2);
    printf("bs=%s,i=%d\n",bs,i);
// 十六进制字符串转成二进制串
    strcpy(hs,"00000400");
    sscanf(hs,"%x",&i);
    ltoa(i,b,2);
    sprintf(bs,"%032s",b);
    printf("hs=%s,bs=%s\n",hs,bs);
// ASC\GBK字符串转十六进制串
    strcpy(s,"a汉");
    i=0;
    while (1) {
        if (0==s[i]) break;
        sprintf(hs+i*2,"%02X",(unsigned char)s[i]);
        i++;
    }
    setlocale(LC_ALL,"chs");
    printf("s=%s,hs=%s\n",s,hs);
// 十六进制字符串转成汉字(GBK)及字符(ASC)
    strcpy(hs,"61BABA");
    i=0;
    while (1) {
        if (1!=sscanf(hs+i*2,"%2x",&v)) break;
        s[i]=(char)v;
        i++;
    }
    s[i]=0;
    printf("hs=%s,s=%s\n",hs,s);

    return 0;

}
//i=1024,bs=00000000000000000000010000000000
//i=1024,hs=00000400
//hs=00000400,i=1024
//bs=00000000000000000000010000000000,hs=00000400
//bs=00000000000000000000010000000000,i=1024
//hs=00000400,bs=00000000000000000000010000000000
//s=a汉,hs=61BABA
//hs=61BABA,s=a汉

热点排行