VC驿站

 找回密码
 加入驿站

QQ登录

只需一步,快速开始

搜索
查看: 1082|回复: 1

gumbo解析html中文乱码

[复制链接]
93_avatar_middle
最佳答案
0 
在线会员 发表于 2017-9-3 15:03:59 | 显示全部楼层 |阅读模式
3驿站币
C++ 使用gumbo解析包含 gb2312中文编码的 html 中文乱码 跪求解决办法    编码是UTF8的则没有问题  


跪求大神指点

最佳答案

查看完整内容

这个库还真没用过,不过是 谷歌出品肯定不错啊 既然对 gb2312 支持的不好,那楼主就先把服务器返回来的 gb2312 的网页源码转换成 utf8 格式的,之后再用 gumbo 进行解析就可以啦




上一篇:python爬虫抓取可用代理IP,然后怎么用呢?
下一篇:老师的一道很简单的题让我无所适从
51_avatar_middle
最佳答案
83 
online_admins 发表于 2017-9-3 15:04:00 | 显示全部楼层
这个库还真没用过,不过是 谷歌出品肯定不错啊
既然对 gb2312 支持的不好,那楼主就先把服务器返回来的 gb2312 的网页源码转换成 utf8 格式的,之后再用 gumbo 进行解析就可以啦
您需要登录后才可以回帖 登录 | 加入驿站 qq_login

本版积分规则

×【发帖 友情提示】
1、请回复有意义的内容,请勿恶意灌水;
2、纯数字、字母、表情等无意义的内容系统将自动删除;
3、若正常回复后帖子被自动删除,为系统误删的情况,请重新回复其他正常内容或等待管理员审核通过后会自动发布;
4、感谢您对VC驿站一如既往的支持,谢谢合作!

关闭

站长提醒上一条 /2 下一条

QQ|小黑屋|手机版|VC驿站 ( 辽ICP备09019393号 )|网站地图wx_jqr

GMT+8, 2020-11-26 06:38

Powered by CcTry.CoM

© 2009-2020 cctry.com

快速回复 返回顶部 返回列表