通过一些 GIF 图理解 dplyr 包的各种 join 函数

tidyverse 系列有很多 join 函数,例如我最常用的 left_join(),很多同学对这个可能很难理解,我找了些动图,大家可以结合着理解下,来自:https://github.com/gadenbuie/tidyexplain

GIS 中的矢量数据和栅格数据(二)

今天我们来看如何在 R 中绘制地图数据,能画地图数据的包很多,如果你熟悉 ggplot2 又不关心是否能交互,那就用 ggplot2;如果你侧重交互性,可以考虑 leaflet;如果仅仅是想在地图上探索地理对象,可以用 mapview;如果上面几种特性都不满足你的要求,try tmap! tmap 可以加载 sf, raster ,Spatial 类的数据。

每天 5 分钟,轻轻松松上手 R 语言(七)

今天的我们继续来看 dplyr 的 arrange 和 mutate。

如何根据经纬度判断该地点所处的省份?

今天我的琼琼小伙伴给我发了一个数据集,是 2001 年到 2018 年所有上市公司的经纬度数据。她想知道每个公司所处的省份,我就帮她计算了一下。

每天 5 分钟,轻轻松松上手 R 语言(六)

今天我们来看如何在 R 中读取和保存数据!

如何绘制一幅漂亮的路网地图? & 绘制阜阳市确诊病例的分布

之前发现过一个很有意思的网站:Draw all roads in a city at once,可以绘制一个城市的路网地图,而且还绘制的很漂亮,就想用 R 画一下。另外我还从一则微信推文里面爬取了阜阳市新冠肺炎确诊病例的分布情况并将他们绘制在路网地图上。

谁在管理我们的国家?——2019年全国人民代表大会数据分析与可视化

本周的小项目作业是一个探索性数据分析的案例。

CGTN 的网站上有一个非常炫酷的项目,是关于 2019 年的全国人民代表大会参会人大代表数据的一个可视化:https://news.cgtn.com/event/2019/whorunschina/index.html ,里面从下面的角度探索了这个数据的一些特征:

每天 5 分钟,轻轻松松上手 R 语言(五)

今天我们依旧利用 msleep 数据集来探讨 dplyr 的列筛选,并在最后补充几个行筛选的例子。

Python 爬取知乎高赞回答并绘制词共现网络

今天我们来看下如何用 Python 爬取知乎指定话题的内容,包括标题、点赞、查看等数据,并存储到 excel 和 Mongo 数据库;

还记得我们的爬虫三部曲吗?对了,就是请求 👉 解析 👉 存储,代码的大部分内容都有详细注释,我们直接上代码吧!

每天 5 分钟,轻轻松松上手 R 语言(四)

上次推文我们通过数字和字符进行了简单的行筛选。今天我们继续来探讨 filter() 的进阶用法。

I Miss You Day and Night!

又是一年情人节,不知道大家有没有找到自己的另一半。今天我们玩一个好玩的:

牛曰:吾日夜思君!

每天 5 分钟,轻轻松松上手 R 语言(三)

今天我们开始学习 R 数据科学中关于 dplyr 的章节,dplyr 是 tidyverse 的核心包,本节我们将使用 nycflights13 包中的数据来阐述 dplyr 的核心用法。

每天 5 分钟,轻轻松松上手 R 语言(二)

今天我们来看一下入门 R 语言的几个小操作。

每天 5 分钟,轻轻松松上手 R 语言(一)

让我们一起开始学习 R for Data Science 这本书吧!本文是我们学习第一章的笔记。

长期投资、资产积累与退休后的预算

本来这篇是想学习这个的:zonination/retirement,但是觉得他的算法难以理解。所以就自己重新设定了一些假定来阐述长期投资与资产积累的关系。

使用 ncov 包获取并分析疫情数据

昨天的推文里,我介绍了开发一个最简单的 R 包的工作流程,相信不少同学已经对 R 包的开发流程有所了解了,今天我们就用这个 ncov 包获取疫情数据然后分析分析吧!

如何编写一个自动获取和展示疫情数据的 R 包?

是不是总觉得会开发 R 包的都是大佬呢?其实你也可以,今天我们就为你揭开 R 包开发的神秘面纱!开发本文介绍的这个 R 包仅仅一些一些 R 语言的基础!

快为你的 R 语言基础绘图系统设定绘图主题吧!

这篇推文是学习 Themes for base plotting system in R 的学习笔记。

basetheme 的魔力就在于,配置好基础绘图系统的主题之后你可能会再次爱上 R 语言的基础绘图系统!

中国夜间灯光数据的处理和展示

在之前的推文:ggplot2 案例:绘制大规模散点图 我展示了处理夜间灯光数据的一种方法,这种方法将 tiff 文件当作图片读入,然后再为每个像素点添加经纬度坐标。这种方法是可行的但是速度慢且不准确。事实上 tiff 文件可以通过 raster 包的 raster 函数读取为 raster 对象再进行处理,本文使用中国夜间灯光数据演示了这种处理方法的使用。

新型冠状病毒的传染性如何?

昨天看到一篇博客,关于计算新型冠状病毒的 R0(基本传染数) 的,感觉很有意思,于是就想复现一遍,原文在这里:Epidemiology: How contagious is Novel Coronavirus (2019-nCoV)?

注意:本文中所有的计算结果仅供演示,请勿作为专业的研究结果。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×