我的编程空间,编程开发者的网络收藏夹
学习永远不晚

20190221-文件操作

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

20190221-文件操作

假定一个全英文的文件,读取该文件,请统计多少个不重复的单词,并且在另外一个文件中写上结果每个单词出现的次数,以及一共有多少个不重复的单词分别为哪些

 

注意:文件中可能包含特殊符号

Step1:打开文件,可使用方法如下:

  方法1:fp = open(file,'r',encoding ='utf-8')

  方法2:with open(file,'r',encoding ='utf-8') as fp:

Step2:读取文件,基于该题的需求,我们按行读取,并对每行进行处理如下:

  1.读取每一行,将每一行中的特殊字符替换为空白

  2.将替换后的字符加到一个content里面(content最终用来存储文件里面的所有被去掉特殊字符的单词结果)

Step3:统计每个单词的出现次数:

  1.统计结果使用字典存储格式如下{单词:出现次数}

  2.出现次数为1的单词即为不重复的单词

Step4:将每个单词的出现次数写到一个新的文件中

  1.遍历step产生的字典,将Key:value写入新的文件

代码如下:

def count_file_content(file_dir):
    result =''#存储所有被处理了特殊字符的文件内容
    word_count_result={}#存储单词出现次数
    import string
    with open(file_dir,'r',encoding ='utf-8') as fp:
        for line in fp:
            s = line.strip()
            for i in string.punctuation:
                s = s.replace(i,' ')
            result +=s
#获取不包含特殊字符的文件内容
    word_list = result.split()
    for item in word_list:
       # print(item)
        if item in word_count_result.keys():
            word_count_result[item]+=1
        else:
            word_count_result[item]=1
#获取每个单词出现次数
    count =0
    non_duplicateword=[]
    #统计不重复单词的个数
    for k,w in word_count_result.items():
        if w ==1:
            count+=1
            non_duplicateword.append(k)
#non_duplicateword存储的所有仅出现一次的单词,count 为仅出现一次的单词总数
    with open(file_dir+'result.txt','w',encoding ='utf-8') as fp1:
        fp1.write('一共'+str(count)+'个不重复的单词\n')
        for k,w in word_count_result.items():
            fp1.write(k+"单词出现"+str(w)+"次\n")
#将结果写入另一个文件中

 

 

 

 

  

    

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

20190221-文件操作

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

20190221-文件操作

假定一个全英文的文件,读取该文件,请统计多少个不重复的单词,并且在另外一个文件中写上结果每个单词出现的次数,以及一共有多少个不重复的单词分别为哪些 注意:文件中可能包含特殊符号Step1:打开文件,可使用方法如下:  方法1:fp = op
2023-01-30

python 文件操作api(文件操作函数)

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目录名:os.listdir() 函数用来
2022-06-04

文件操作

文件操作一、关于文件读写的笔记(一) 文件概述文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容文件都是按照2进制进行存储的,但在表现形式上有2种:文本文件和二进制文件。1. 文本文件  文本文件一般由单一特定编码的字符组成,如u
2023-01-31

python 文件操作

python基本的文件操作,包括 open,read,write对文件操作流程:1.打开文件,得到文件句柄并赋值给一个变量2.通过句柄对文件进行操作3.关闭文件新建一个txt文件,内容是《Yesterday When I Was Young
2023-01-30

Python3 文件操作

Python3 文件操作打开方式手动挡open+close自动挡with,自关闭常见操作w, r, a, bwritereadlinereadlinesseektellread相关模块fnmatchglobpickleStringIOshe
2023-01-31
2023-09-05

python文件操作

1. 文件操作 open 打开 f = open(文件路径, mode="模式", encoding="编码格式") 最最底层操作的就是bytes 打开一个文件的时候获取到的是一个文件句柄.
2023-01-30

python 操作文件

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。操作前需要 import os;返回当前目录,不包括文件名: os.getcwd();返回指定目录下的所有文件和目录名:os.listdir("dirn
2023-01-31

python---文件操作

一、对文件操作流程1.打开文件,得到文件句柄并赋值给一个变量2.通过文件句柄对文件进行操作3.关闭文件二、文件打开模式f = open("file_test","r",encoding = "utf-8")    #打开文件,“读模式”,只
2023-01-31

Python3文件操作

打印到屏幕产生输出的最简单方法是使用print语句,可以通过用逗号分隔零个或多个表达式。这个函数传递表达式转换为一个字符串,如下结果写到标准输出 -#!/usr/bin/python3print ("Python is really a g
2023-01-31

python_文件操作

一、文件处理基本形式 # 1. 打开文件,得到文件句柄并赋值给一个变量# 文件句柄 = open('文件路径', '模式', '操作文件的字符编码')f = open('carter', 'r', encoding='UTF-8') #
2023-01-30

python-文件操作

文件操作1.  读 / 写 操作读取: r (read):只能读不能写,文件不存在就报错​#打开文件:    object = open('某txt文件',mode = 'r',encoding = '编码')​#读取文件所有内容到内存:
2023-01-31

python3--文件操作

python文件操作文件以什么编码存储,就以什么编码打开参数:1 文件路劲2 编码方式3 执行动作(打开方式):只读,只写,追加,读写,写读例子现有一个文档,制服护士空姐萝莉联系方式.txt,怎么用python打开?f=open(D:\制服
2023-01-30

Python--文件操作

文件处理流程1.打开文件,得到文件句柄并赋值给一个变量2.通过句柄对文件进行操作3.关闭文件 r模式,默认模式,文件不存在则报错w模式,文件不存在则创建,文件存在则覆盖a模式,文件不存在则创建,文件存在则不会覆盖,写内容会以追加的方式写(写
2023-01-30
2023-10-20

Python12 文件操作

文件操作Pycharm使用UTF-8格式,而Windows默认是GBK格式,所以默认pycharm是处理不了BGK格式的,所以要要定义使用UTF-8格式打开Windows文件的内容。.read():读取文件所有内容。同样是读取文件内容,但是
2023-01-31

3 Python文件操作

open以什么编码方式存储文件,就以什么编码方式打开f = open('d:\模特主妇护士班主任.txt',encoding='utf-8') # 绝对路径打开f.close()f = open('模特主妇护士班主任',encoding=
2023-01-31

Python文件IO操作

文件IO常用操作:open打开read读取write写入close关闭readline行读取readlines多行读取seek文件指针操作tell指针位置打开操作:open(file, mode='r', buffering=-1, enc
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录