设为首页收藏本站获取积分奖励

R语言中文网

 找回密码
 立即注册
查看: 3931|回复: 2

[问题求助] R语言爬虫

[复制链接]
发表于 2017-5-27 15:47:04 | 显示全部楼层 |阅读模式
本帖最后由 6爷 于 2017-5-27 15:53 编辑

使用R语言爬虫,使用xml包里的htmlparse函数,返回的结果里原本中文的地方都显示为乱码了,怎么解决??
后来在网上找说,用encoding参数把编码调为utf-8,还是不行,请问应该怎么办

代码如下:
> ur11<-"http://www.creprice.cn/rank/cityforsale.html?type=11&citylevel=1&y=2011&m=09"
> a1<-htmlParse(file=ur11,encoding = "utf-8")



aaaa.jpg aaaa.jpg
回复

使用道具 举报

发表于 2017-6-3 11:38:25 | 显示全部楼层
换成别的编码试试。比如GBK
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Archiver|R语言中文网    

GMT+8, 2024-5-20 13:40 , Processed in 0.027298 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表