C1G军火库

关注互联网、网页设计、Web开发、服务器运维优化、项目管理、网站运营、网站安全…

Categories:

其它
技术
- *bsd
- AI
- AIGC
- Ajax
- Apache
- Cacti
- cpan
- dns/dnsmasq
- Elasticsearch/Logstash/Kibana
- haproxy/Atlas
- HTML/XHTML/CSS
- Imagemagick
- JavaScript/DOM/XML
- Lempelf一键包
- LINUX
- Linux 命令
- linux 维护优化
- Linux游戏
- Lucene
- Mail/Postfix
- Memcached/redis
- Mysql
- Nagios
- Nginx
- Others
- PHP
- RHCE&RHCA
- RRDtool
- saltstack/ansible
- shell
- sphinx
- Squid/varnish
- Subversion
- TinyMce
- Tomcat
- VPN
- Wap
- 备份
- 安全
- 安全通告
- 安装k8s/kubernetes
- 容器
- 日志
- 测试
- 浏览器插件
- 消息rabbitmq
- 爬虫spider
- 编辑器
- 网站架构
- 虚拟化/xen
- 高可用/集群
未分类

GB2UFT8

看到好多人还在用4、5年前的GB – UTF8转换程序，真的很难过。就算不用ICOVN函数，也可以进步一点吧，

上传的文件包含ｇｂ２３１２全集，每行： 1到2字节，GB２３１２码 3字节，空格 4字节，对应utf8码的位数；后面，utf8码+回车(rn);

附件: gb2utf8.txt

http://www.phpx.com/happy/showthread.php?s=&threadid=90509&perpage=15&pagenumber=1

//对照表的使用(一) $filename = “gb2utf8.txt.new”; $fp = fopen($filename,”r”); while(! feof($fp)) { list($gb,$utf8) = fgetcsv($fp,10); $charset[$gb] = $utf8; } fclose($fp); //以上读取对照表到数组备用 function gb2utf8($text) { global $charset; //提取文本中的成分，汉字为一个元素，连续的非汉字为一个元素 preg_match_all(“/(?:[x80-xff].)|[x01-x7f]+/”,$text,$tmp); $tmp = $tmp[0]; //分离出汉字 $ar = array_intersect($tmp, array_keys($charset)); //替换汉字编码 foreach($ar as $k=>$v) $tmp[$k] = $charset[$v]; //返回换码后的串 return join(”,$tmp); } echo gb2utf8(“haha,这是对照表的测试”); ?> //对照表的使用(二) //建立表gb2utf8，二个字段：gb、utf8。把对照表导入到表中（代码略） function gbk2utf8($text) { /* 提取文本中的汉字 */ preg_match_all(“/[x80-xff]./”,$text,$ar); $expr = join(“‘,'”, array_unique($ar[0])); /* 检索文本中所使用的汉字 */ mysql_connect(); mysql_select_db(‘test’); $rs = mysql_query(“select * from gb2utf8 where gb in (‘$expr’)”); while(list($key, $value) = mysql_fetch_row($rs)) $gb[$key] = $value; /* 分解文本的各个成分 */ preg_match_all(“/(?:[x80-xff].)|[x01-x7f]+/”,$text,$ar); $ar = $ar[0]; /* 替换汉字编码 */ foreach($ar as $k=>$v) if(array_key_exists($v,$gb)) $ar[$k] = $gb[$v]; return join(‘ ‘,$ar); } ?>

有人问及逆转换：utf82gb 假定读照表已读到数组charset，则

原贴

http://www.phpx.com/happy/showthread.php?s=&threadid=90509&perpage=15&pagenumber=2

Posted in PHP, 技术.

By C1G – 2005/01/04

No Responses (yet)

Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.

« 文档资源 php发日文邮件 »

Proudly powered by WordPress and Carrington.

GB2UFT8

No Responses (yet)

About C1G军火库

分类

归档

其他操作

近期文章

近期评论

AI

博客互联

安全

我的

技术论坛

收藏夹

架构研发

设计体验

GB2UFT8

No Responses (yet)

Subscribe

About C1G军火库

分类

归档

其他操作

近期文章

近期评论

标签

AI

博客互联

安全

我的

技术论坛

收藏夹

架构研发

设计体验