设为首页收藏本站获取积分奖励

R语言中文网

 找回密码
 立即注册
查看: 18202|回复: 16

[知识分享] R爬虫示例(小白练手)

[复制链接]
发表于 2017-5-19 17:49:59 | 显示全部楼层 |阅读模式
楼主用rvest包爬取了BOSS直聘网站,关于数据分析的职位信息,权当练手,详见二楼。
回复

使用道具 举报

 楼主| 发表于 2017-6-12 19:26:35 | 显示全部楼层
Endless 发表于 2017-6-12 16:52
感谢楼主分享,但是有个小问题:用R×64打开脚本文件后,注释部分全部乱码是为什么呀?

这个问题我也遇到过,自己打开自己写的本地文件也会乱码,到现在没找到原因。
我的解决方法是:先用记事本打开脚本文件,此时显示的是正常的,复制全部内容,然后在R中新建一个脚本文件,将内容粘贴进去。

回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2017-5-19 17:51:00 | 显示全部楼层
本帖最后由 Rocky_Xin 于 2017-5-19 18:00 编辑



回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-5-19 17:55:39 | 显示全部楼层
附件为源代码及爬取后数据

R爬虫小白实例教程-源代码及爬取后数据.zip

16.61 KB, 下载次数: 119

回复 支持 反对

使用道具 举报

发表于 2017-5-23 15:53:49 | 显示全部楼层
感谢分享!学习了!
回复 支持 反对

使用道具 举报

发表于 2017-6-7 10:21:07 | 显示全部楼层
感谢分享,小白我受教了
回复 支持 反对

使用道具 举报

发表于 2017-6-12 16:52:36 | 显示全部楼层
感谢楼主分享,但是有个小问题:用R×64打开脚本文件后,注释部分全部乱码是为什么呀?
回复 支持 反对

使用道具 举报

发表于 2017-6-16 09:21:35 | 显示全部楼层
Rocky_Xin 发表于 2017-6-12 19:26
这个问题我也遇到过,自己打开自己写的本地文件也会乱码,到现在没找到原因。
我的解决方法是:先用记事 ...

编码格式的问题,在RStudio中依次打开Tools>Global Options>Code>Saving,然后点击Change,在弹出的窗口选择UTF-8编码格式,保存设置;然后关掉打开的脚本,再打开就可以了
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-6-16 14:20:58 | 显示全部楼层
perchanny 发表于 2017-6-16 09:21
编码格式的问题,在RStudio中依次打开Tools>Global Options>Code>Saving,然后点击Change,在弹出的窗口选 ...

感谢回答,我去试一下!
回复 支持 反对

使用道具 举报

发表于 2020-10-20 15:47:29 | 显示全部楼层
请教:请问用rvest时,为什么同一个页面一部分内容能爬出来,有些就不能爬出来呀
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Archiver|R语言中文网    

GMT+8, 2024-4-20 23:01 , Processed in 0.037739 second(s), 26 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表