我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python统计前十出现最多的词

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python统计前十出现最多的词

一、描述

     这是一道python面试题:

     “一个可读文件,有一万行,一行只有一个单词,单词可以重复的,求出这一万行中出现频繁次数最多的前10个单词”


二、思路

       先读取文件变为列表,再用集合去重得到一个参照的列表,逆排序取前10(最大即最多的的10个元素),再用参照列表中的每个元素从文件中去统计,把参照列表中的元素作为键,统计到的结果为值,放入字典,打印出来。


三、代码

#!/usr/bin/python
#coding:utf-8
all_C = []
with open("words.txt",'r') as f:
    for line in f.readlines():
        all_C.append(line)
#获取无重复元素
all_set=set(sorted(all_C))
#统计为字典
counts={}
for key in all_set:
     counts[key] = all_C.count(key)
#获取前10个元素的个数变为列表
tens = sorted(counts.values(),reverse=True)[0:11]
print tens
#统计最终前十的元素及出现次数
tendict = {}
for k in counts.keys():
    if counts[k] in tens:
        tendict.setdefault(counts[k],k.strip("\n"))
print("出现最多的10个词为:%s \n") %tendict


#python tens.py

如图:

wKioL1nN5o_xRcELAAGkpo338gw245.png

练习的文件类似 如下10001行,以文件的方式读取还是很快的:

wKioL1nN50vCAnEpAAMEGH1zANI990.png


参考其他人代码二:

#!/usr/bin/python
#coding:utf-8
result= {}
with open("words.txt",'r') as fopen:
    fopen.seek(0,2)
    all = fopen.tell()
    fopen.seek(0,0)
    while fopen.tell() < all:
        lines = fopen.readline().strip()
        if lines in result:
            result[lines] += 1
        else:
            result[lines] = 1
print(sorted(result.items(),key=lambda k:k[1],reverse=True)[:11])

执行结果如图:

wKioL1nbUTCTID2hAAFlGKj6FLM140.png

总结:

        自己写的有点lower完全是练习,方法二高大上!还有更好的方法吗?

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python统计前十出现最多的词

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python统计前十出现最多的词

一、描述     这是一道python面试题:     “一个可读文件,有一万行,一行只有一个单词,单词可以重复的,求出这一万行中出现频繁次数最多的前10个单词”二、思路       先读取文件变为列表,再用集合去重得到一个参照的列表,逆排
2023-01-31

awk脚本统计一组单词中字母出现最多最少频率

目录字母计数打印相对频率最后的完整程序编写一个 awk 脚本来找到一组单词中出现次数最多(和最少)的单词。 近一段时间,我开始编写一个小游戏,在这个小游戏里,玩家使用一个个字母块来组成单词。编写这个游戏之前,我需要先知道常见英文单词中每个字
2022-06-05

Java统计英文句子中出现次数最多的单词并计算出现次数的方法

本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法。分享给大家供大家参考,具体如下:import java.util.*;pub
2023-05-30

Python入门案例之找出文件中出现次数最多的10个单词

这篇文章主要为大家带来一个简单的Python入门案例——找出文件中出现次数最多的10个单词,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-02-01

统计numpy数组中最频繁出现的值

arr = np.array([[1,2,100,4,5,6],[1,1,100,3,5,5],[2,2,4,4,6,6]])方法一:count = np.bincount(arr[:,2]) # 找出第3列最频繁出现的值value =
2023-01-30

awk统计文件中某关键词出现次数的命令

awk -F "" '{for(i=1;i<=NF;++i) if($i=="a") ++sum}END{print sum}' test.c[root@xiaobb 5906]# awk '{for(i=1;i<=NF;++i) if($
2022-06-04

tr命令在统计英文单词出现频率中的妙用

tr命令我们很清楚,可以删除替换,删除字符串。 在英文中我们要经常会经常统计英文中出现的频率,如果用常规的方法,用设定计算器一个个算比较费事,这个时候使用tr命令,将空格分割替换为换行符,再用tr命令删除掉有的单词后面的点号,逗号,感叹号。
2022-06-04

python如何找出列表中出现最多次数的元素

小编给大家分享一下python如何找出列表中出现最多次数的元素,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!找出列表中出现最多次数的元素list1 = [6, 1, 3, 4, 2, 2, 3, 1, 5, 5, 3] p
2023-06-27

python怎么统计数字出现的次数

可以使用字典来统计数字出现的次数。首先,遍历数字列表,对于列表中的每个数字,判断它是否已经在字典中存在。如果不存在,则将该数字作为键,初始值为1加入字典;如果已经存在,则将对应的值加1。最后,遍历字典,输出数字和对应的出现次数。下面是一个示
2023-10-12

Python中如何找出序列中出现次数最多的元素

Python中如何找出序列中出现次数最多的元素,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。前言:有一个元素序列,想知道在序列中出现次数最多的元素是什么?col
2023-06-02

python如何查找列表中出现次数最多的数字

小编给大家分享一下python如何查找列表中出现次数最多的数字,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!查找列表中出现次数最多的数字[1, 2, 3, 4,
2023-06-26

Python如何统计序列中元素的出现频度

本篇内容介绍了“Python如何统计序列中元素的出现频度”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!某随机序列中,找到出现次数最高的三个元
2023-06-02

Python怎么统计序列中元素的出现频度

今天小编给大家分享一下Python怎么统计序列中元素的出现频度的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1、如何统计序列
2023-06-30

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录