R语言histogram怎么用
这篇文章给大家分享的是有关R语言histogram怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
最近小仙同学很是烦恼,本以为自己已经掌握了ggplot2作图的语法,用read.csv(), ggplot()+geom_point()/boxplot()/violinplot()…就可以画遍天下图表,结果却发现到真正画图的时候,还是会出现不少的小问题。
比如小仙最近要画一个直方图,最开始用hist()函数试了一下,看了下形状, 好像因为数据取值范围跨度太大(最大值104,724,最小值30),这个图画出来有点丑,于是决定用ggplot美化一下。
调整之后好看是好看了,但是大家有没有看出什么不对的地方,明明bins=10但是只画出8个格子,之后调整bins的值,每次都会比我指定的值少2个格子。而且,图中第一个格子(取值范围0-1250)应该有700多个数据,但是图上显示只有不到300个,问题出在哪里呢?小仙同学百思不得其解。在geom_histogram()函数中,bins就是用来指定分组数目(格子),为什么总是会少两个?
小仙同学考虑到自己能力有限,决定量力而行,另辟蹊径。
于是设置另外一个参数breaks,终于找回了丢失的格子
经过此事,小仙同学深刻认识到了自己的有限水平,哈哈。不过还是分享一下,希望能帮助到大家。实际的数据可真是比书上的例子难处理呢。
按照惯例写一下整个作图的过程。
Step1. 绘图数据的准备
首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式。
Step2. 绘图数据的读取
data<-read.csv(“your file path”, header = T)#注释:header=T表示数据中的第一行是列名,如果没有列名就用header=F
Step3.绘图所需package的安装、调用
library(ggplot2)#注释:package使用之前需要调用
Step4.绘图
p<-ggplot(data, aes(x=data$销量)) +geom_histogram(breaks=seq(0,10000,1000))+ xlim(0,10000)p
感谢各位的阅读!关于“R语言histogram怎么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341