我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python如何统计字母出现的次数

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python如何统计字母出现的次数

这篇文章给大家分享的是有关Python如何统计字母出现的次数的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。

题目:

统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词。

前言:

这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单词的畅销书,就是根据词频来记单词,深受学生喜欢。这就是一个把编程技能用来解决实际问题的典型场景。另外,在数据分析时,那些词云效果本质上都是基于词频统计来调整字体的大小,如果你能熟练运用Python中的知识来解决问题的话,说明你真的入门Python了。

分析

本题主要考察以下几个方面的知识点:

1、如何正确读写文件

在python中读写文件可以使用内置函数open(),而 open 函数在python2 和 python3 中有一定的区别,比如 Python 中可以指定读写文件的编码格式,而 Python 则不可以,为了同时兼容2和3,我们通常会使用io模块下面的 open 函数,大家可以查文档搞清楚它们之间的区别,培养主动学习能力和查资料的习惯。

另外一点是读写文件完成之后是需要关闭文件描述符的,除了可以使用 try...except...finally的语法之后,我们还可以使用更优雅的 with … as 的语法来自动关闭文件。

2、如何对数据进行排序

sorted函数是一个使用频率很高的内置函数,它的用法也很强大,因为它可以通过指定参数 key 来进行自定义排序,也就意味着你不仅可以对数字排序、对字母排序、还可以对列表、字典、自定义的对象进行排序,你只需要要告诉 sorted 函数的排序规则是什么,比如一个people对象,我既可以根据年龄排序也可以根据身高体重来排序,所以这个函数时非常灵活的,另外,对于列表对象有自带的 sort 方法,如果能区分清楚 list.sort 与 sorted 之间区别那说明你已经能灵活运用了。

3、字典数据类型的运用

做词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。另外,字典最大的特点就是它的查询速度会非常快。理想情况下时间复杂度为O(1),我是说理想情况,如果你想深入了解字典的话,建议看看这篇文章 https://www.laurentluce.com/posts/python-dictionary-implementation/

4、正则表达式的运用

对文本、字符串处理,正则表达式简直是神器,无论是做数据爬虫还是数据清洗使用非常广泛,当然,正则表达式并不是Python特有的东西,所有编程语言都支持,我们要做的除了学习正则表达式还有他的API,只有熟悉了API我们才能运用到实际场景中去。关于正则表达式推荐一篇文章:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html ,另外我还发现有同学引入了jieba分词库,这个库在做中文分词非常有用,感兴趣的可以去了解一下。

实现

分析完之后,我们实现起来其实是非常快的。所以我们在拿到一个需求的时候,首先肯定是把需求弄清楚,想想大概可以用哪些技术来实现,随后才是动手写代码,其实我们在工作上,真正写代码的时间还不到一半。

# -*- coding:utf-8 -*-
import io
import re
class Counter:
 def init(self, path):
 """
 :param path: 文件路径
 """
 self.mapping = dict()
 with io.open(path, encoding="utf-8") as f:
  data = f.read()
  words = [s.lower() for s in re.findall("\w+", data)]
  for word in words:
  self.mapping[word] = self.mapping.get(word, 0) + 1
 def most_common(self, n):
 assert n > 0, "n should be large than 0"
 return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
if name == 'main':
 most_common_5 = Counter("importthis.txt").most_common(5)
 for item in most_common_5:
 print(item)

打印结果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

总结

我在看大家代码的时候,很多代码依然存在有命名不规范(建议读PEP8),代码的排版混乱(阅读起来很困难,建议用Pycharm进行格式化)。还有不少代码的实现方式看起来很复杂(往往越复杂的代码Bug越多)。当然,实现方法不是唯一。

比如Python模块本身就提供了一个collections.Counter的类,它继承自dict类,就是用于做统计的,我发现有部分同学使用的就是这个类来实现的,细心的你可能发现了,我实现的这个Counter和collections下面那个Counter很像,其实这就是造轮子,造轮子可以锻炼我们的编程思维,当然在工作上有现成的东西就没必要自己造轮子了,除非你有信心做得更好。你也可以思考思考,假如Python没有提供Counter这个工具,你该怎么做。

另外,该模块还提供一个有序的字典对象 OrderedDict,使用它可以免去我们手动排序的操作。最后建议大家学习总结上面我提到的所有内容。如果你能坚持100天,相信你对Python的掌握程度是游刃有余的。

感谢各位的阅读!关于Python如何统计字母出现的次数就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到吧!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python如何统计字母出现的次数

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何使用python统计每个数字出现的次数

你可以使用Python中的字典来统计每个数字出现的次数。以下是一个示例代码:```pythonnumbers = [1, 2, 3, 4, 2, 3, 1, 5, 6, 4, 3, 2, 1, 2, 3]# 创建一个空字典用于存储数字和它们
2023-09-16

python怎么统计数字出现的次数

可以使用字典来统计数字出现的次数。首先,遍历数字列表,对于列表中的每个数字,判断它是否已经在字典中存在。如果不存在,则将该数字作为键,初始值为1加入字典;如果已经存在,则将对应的值加1。最后,遍历字典,输出数字和对应的出现次数。下面是一个示
2023-10-12

如何使用python统计字符在文件中出现的次数

在开发过程中很多时候我们有统计单个字符或者字符串在另一个字符串中出现次数的需求,下面这篇文章主要给大家介绍了关于如何使用python统计字符在文件中出现的次数的相关资料,需要的朋友可以参考下
2023-03-08

如何统计字符串中每个字符出现的次数

这篇文章给大家分享的是有关如何统计字符串中每个字符出现的次数的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。统计字符串中每个字符出现的次数的方法:首先创建一个PHP示例文件;然后把出现过的字符记录在array数组中
2023-06-14

ORACLE统计字符串出现的次数

在ORACLE数据库的使用中,有时候我们需要统计某个字符串出现的次数。 但是在11g版本前,我们需要结合translate函数可以完成,比较麻烦,例如统计“/”在字符串中出现的次数: SELECT LENGTHB(TRANSLATE("01/02/03","/
2019-10-26

Python如何统计列表元素出现次数

这篇文章主要介绍了Python如何统计列表元素出现次数,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1. 引言在使用Python的时候,通常会出现如下场景:array = [
2023-06-14

如何用excel统计出现次数

这篇文章主要介绍“如何用excel统计出现次数”,在日常操作中,相信很多人在如何用excel统计出现次数问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用excel统计出现次数”的疑惑有所帮助!接下来,请跟
2023-07-02

怎么用Python找出文本中每个字母出现的次数

这篇文章主要介绍“怎么用Python找出文本中每个字母出现的次数”,在日常操作中,相信很多人在怎么用Python找出文本中每个字母出现的次数问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python找出
2023-06-04

python如何统计列表中元素出现的次数

可以使用`collections.Counter`来统计列表中元素出现的次数。from collections import Counterlst = [1, 2, 3, 1, 2, 3, 1, 2, 3, 4]count = Coun
2023-10-25

PHP怎么统计字符的出现次数

这篇文章主要讲解了“PHP怎么统计字符的出现次数”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“PHP怎么统计字符的出现次数”吧!给出一个字符串“aaabbccqqwweeab”,如何统计出每
2023-06-20

php如何统计数组中出现的次数

要统计数组中元素出现的次数,可以使用`array_count_values()`函数。该函数会返回一个关联数组,其中元素是数组中的值,而键是对应元素在数组中出现的次数。下面是一个示例代码:```php$array = array(1, 2,
2023-09-17

怎么在python中统计字符串中字符出现的次数

怎么在python中统计字符串中字符出现的次数?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面
2023-06-14

Python如何计算子串在字符串中出现的次数

Python中计算子串在字符串中出现次数的方法有三种:count()方法:直接获取子串出现次数,速度最快。find()方法:循环查找子串,较慢。re.findall()方法:返回所有匹配子串,可用于复杂模式匹配。count()方法是大多数情况的最佳选择。对于复杂模式匹配,可以使用re.findall()方法。
Python如何计算子串在字符串中出现的次数
2024-04-02

python技巧 计算字符串中字母出现的

有一个字符串 “aaddfdfdercfghfyttefsfsfewretr123trefg5624sdfcgvfdgte6435234532”,现在需要取出里面出现次数最多的字符第一种方法-装饰器class get_max_count_s
2023-01-30

Golang如何统计字符串中数字字母的数量

今天小编给大家分享一下Golang如何统计字符串中数字字母的数量的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1.需求说明记
2023-06-30

java如何统计数组元素出现次数

可以通过使用HashMap来统计数组元素的出现次数。具体步骤如下:1. 创建一个HashMap对象,用于存储数组元素和其对应的出现次数。2. 遍历数组中的每个元素,如果该元素已经存在于HashMap中,则将该元素对应的次数加1;如果该元素不
2023-10-07

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录