多国语言一致性检测!!
怎样去检测一个字符串的语言的一致行,如(纯中文字符串中不能包含日文,日文字符串中不能出现不允许的中文),希望最好能有实现代码,方案也行!!
[解决办法]
在不确定字符串的编码方式之前,这是没办法做到的。
[解决办法]
unicode编码的中文不是有一个区间的吗?就像ascii编码从0~~254一样的意思
[解决办法]
unicode 是大字符集,采用2~4字节的编码,通常我们用的是16bit的,包含了很多国家的语言。
你说的应该就是windows用的16bits的,他的日文和中文编码肯定不能重复的。
要实现你这功能,你需要得到一张中文码表,根据这个码表判断每个字是否是中文。
码表一些unicode的网站上面有,但是你需要根据你的需求自己处理。