位置：首页-资讯-后端开发

python数据处理实例分析

2023-06-30 00:20

短信预约 -IT技能 免费直播动态提醒

今天小编给大家分享一下python数据处理实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

一，前言

我们现在拿到了一个十分庞大的数据集。是json文件，里面存储了将近十万个数据，现在要对其中的数据进行清洗处理。

python数据处理实例分析

二，python模块

import jsonimport jieba

我们需要用json模块来处理json文件，和使用jieba库来分析词性，这样可以实现我们的需求。

2.1，增加停用词表

停用词表.txt，把停用词表存入stopwords，原因是：我们的目标分析json里有一些标点符号。

stopwords = [line.strip() for line in open("停用词表.txt",encoding="utf-8").readlines()]

基本如图所示：

python数据处理实例分析

a+str(b)+c这是文件名称，a+b+c=./json/poet.song.0.json b递增，实现动态取值

with open(a+str(b)+c,'r',encoding='utf8')as fp:

因为有将近500个json文件。每个文件里有好几千组数据，我现在尽力的优化代码，现在提取一次，把需要的数据存入文件里面差不多需要五分钟。

2.2，顺序读取

定义一个空的字符串，将json对象转换为python对象。定义一个空的list存放诗句。
循环json_data i为里面的每一个元素。
新的追加到list_paragraphs列表
循环 j为里面的每一句。

代码如图所示：

python数据处理实例分析

使用jieba库，分析str内容的词性【注意是名称，动词。。。。】排行输出都是俩个字是巧合，没有字数限制

words = jieba.lcut(str_s)

现在words为分析完毕的词性列表，遍历。

排除特殊符号

for word in words:            if word not in stopwords:                if len(word) == 1:                    continue                else:                    counts[word] = counts.get(word,0) + 1

出现频率加一。

2.3，lambda函数

使用lambda函数，sort快速排序，遍历输出频率前50的词性。

items.sort(key=lambda x:x[1], reverse=True)

之后赋值word, count。

word, count = items[i]    print ("{:<10}{:>7}".format(word, count))

三，运行

python数据处理实例分析

3.1，存入文件

f=open('towa.txt',"a",encoding='gb18030')            f.writelines("题目:"+textxxx)            f.writelines(word_ping)

python数据处理实例分析

以上就是“python数据处理实例分析”这篇文章的所有内容，感谢各位的阅读！相信大家阅读完这篇文章都有很大的收获，小编每天都会为大家更新不同的知识，如果还想学习更多的知识，请关注编程网行业资讯频道。

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

python数据处理实例分析

下载Word文档到电脑，方便收藏和打印～

下载Word文档

python数据处理实例分析

一，前言

二，python模块

2.1，增加停用词表

2.2，顺序读取

2.3，lambda函数

三，运行

3.1，存入文件

python数据处理实例分析

相关文章

猜你喜欢

python数据处理实例分析

Python Pandas数据处理高频操作实例分析

Python异常处理实例分析

Python函数加速数据分析处理速度的示例分析

Python数据分析matplotlib折线图案例处理

ajax数据处理的示例分析

Python数据处理及可视化的示例分析

Python数据类型实例分析

Spring Boot多数据源处理事务实例分析

VB.NET处理数据行的示例分析

Python中的异常处理实例分析

python数据分析绘图可视化实例分析

【Pandas数据处理100例目录】Python数据分析玩转Excel表格数据

Python数据异常值检测和处理的示例分析

Python中的Selenium异常处理实例分析

Pandas文本数据处理的示例分析

Pytorch中Dataset数据处理的示例分析

python中with和异常处理实例分析

Python异常处理的方法实例分析

Python数据结构的栈实例分析

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复