如何利用Python读取CSV文件并计算某一列的均值和方差
今天就跟大家聊聊有关如何利用Python读取CSV文件并计算某一列的均值和方差,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据
文件的构成很简单,部分如下所示
总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后利用numpy模块即可求出需要的数据。
这里利用了csv模块来对文件进行处理,最终实现的代码如下:
import csvimport numpy as npwith open('pingan_stock.csv') as csv_file: row = csv.reader(csv_file, delimiter=',') next(row) # 读取首行 price = [] # 建立一个数组来存储股价数据 # 读取除首行之后每一行的第二列数据,并将其加入到数组price之中 for r in row: price.append(float(r[1])) # 将字符串数据转化为浮点型加入到数组之中print(np.var(price)) # 输出均值print(np.mean(price)) # 输出方差
首先利用csv的reader方法,其中delimiter可有可无,它是一个分隔符,原本的值就是逗号,所以加不加无所谓
reader返回的是一个可以迭代的对象,需要使用for循环遍历,row的部分输出值如下:
next(row)的作用是读取第一个列表,也就是['year','price'],因为后面的代码中要将字符型的数据转化为浮点型,便于最后的计算,所以这句代码必须加上,否则在转换时就会报错,在对row进行遍历时,r[1]表示每一行的第二个数据,利用append将每一行的第二列数据存入数组之中,当遍历完成时,第二列的所有数据就成功存入了price数组中,并且都是浮点型的数据,得到了这个数组就算是大功告成了,最后利用numpy模块的mean和var分别计算出均值和方差。
看完上述内容,你们对如何利用Python读取CSV文件并计算某一列的均值和方差有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网行业资讯频道,感谢大家的支持。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341