我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python入门:文件内容去重操作

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python入门:文件内容去重操作


+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  学习是一种态度,只要你有态度,学习将会是一种乐趣
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

对行与行之间的重复内容进行删除
如:从网上download几个常用的用户名或密码字典文件,但是合并的时候,肯定有很多是重复的,在使用这些内容进行暴力破解的时候,因为重复行,导致破解效率下降,所以需要进行简单修改,去重:

#user.txt

admin 
root

123
user
password 
 admin

administrator

应用代码

#Author:foryouslg
#python3.5
'''
1、对特定文件内容进行去重操作(行与行之间的重复)
2、请输入需要去重文件的绝对路径
3、删除文件中的空行
4、去除字符串前后空行
5、生成一个以当前日期命名的文件
'''

import time

year = time.localtime().tm_year
mon = time.localtime().tm_mon
day = time.localtime().tm_mday
hour = time.localtime().tm_hour
min = time.localtime().tm_min
sec = time.localtime().tm_sec
nowtime = str(year) + str(mon) + str(day) + str(hour) + str(min) + str(sec)

f = input("please entry the file[absolute path]:")

def openThefile():
    '''
    1、打开要去重的文件
    2、删除每行数据前后的无用字符
    :return:
    '''
    ff = open(f,'r')
    l = []
    #for i in ff.readline():     #readline是文件中的第一行内容
    for i in ff.readlines():    #所有内容中的每一行
        if i != '\n' and i != '\r\n':   #删除空行
            ii = i.replace('\t','').strip()
            l.append(ii)
    ff.close()
    return l

def createNewfile(openThefile):
    '''
    去重操作
    :param openThefile:
    :return:
    '''
    l = []
    for i in openThefile:
        if i not in l:
            l.append(i)
    '''
    创建新文件
    '''
    filename = f[:f.find('.')]
    postfix = f[f.find('.'):]
    theNewfile = open(filename + '_' + nowtime + postfix,'a')
    '''
    写入处理过的内容
    '''
    for i in l:
        theNewfile.writelines(i+'\n')
    theNewfile.close()



if __name__ == '__main__':
    createNewfile(openThefile())

执行后的结果

admin
root
123
user
password
administrator

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python入门:文件内容去重操作

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python入门:文件内容去重操作

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++   学习是一种态度,只要你有态度,学习将会是一种乐趣 +
2023-01-31

python操作文件写入内容

[root@bogon ~]# cat file.py #/usr/bin/env python # coding: utf-8ecs="efwefwffrfrer"ipaddrr="192.168.56.10"print type(ecs
2023-01-31

python 文件内容对比操作

#-*-coding:utf-8-*- import ref1 = open('d:/test/mail/bounce_list.txt','r')f2 = open('d:/test/mail/828-820.txt', 'r')ff =
2023-01-31

git入门(3.文件操作)

三、GIT文件操作  版本控制就是对文件的版本控制,对于Linux来说,设备,目录等全是文件,要对文件进行修改、提交等操作,首先要知道文件当前在什么状态,不然可能会提交了现在还不想提交的文件,或者要提交的文件没提交上。文件状态  GIT仓库
2023-01-31

Linux命令行进行文件内容去重

在 Linux 命令行中,可以使用 sort 和 uniq 命令组合来对文件内容进行去重。下面是一个简单的示例:首先,使用 cat 命令查看文件内容:cat input_file.txt然后,将文件内容通过管道传递给 sort 命令进行排序
Linux命令行进行文件内容去重
2024-09-25

Python文件操作,open读写文件,追加文本内容实例

1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object = open('thefile.txt') try:all_the_text =
2022-06-04

Python使用pandas导入xlsx格式的excel文件内容操作代码

这篇文章主要介绍了Python使用pandas导入xlsx格式的excel文件内容,基本导入是在Python中使用pandas导入.xlsx文件的方法是read_excel(),本文结合示例代码给大家介绍的非常详细,需要的朋友可以参考下
2022-12-23

Linux实现文件内容去重及求交并差集

一、数据去重 日常工作中,使用Hive或者Impala查询导出来可能会存在数据重复的现象,但又不想重新执行一遍查询(查询时间稍长,导出文件内容多),因此想到了使用Linux命令将文件的内容重复数据进行去除。 案例如下: 可以看到aaa.tx
2022-06-03

批处理怎么根据文件内容进行重命名操作

小编给大家分享一下批处理怎么根据文件内容进行重命名操作,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!首先,我有个.dat文件,名字是固定的,需要更改这个文件名..
2023-06-09

android文件操作——读取assets和raw文件下的内容

来自Resources和Assets 中的文件只可以读取而不能进行写的操作。assets文件夹里面的文件都是保持原始的文件格式,需要用AssetManager以字节流的形式读取文件。1. 先在Activity里面调用getAssets()
2022-06-06

Python内置文件操作有哪些

这篇文章主要讲解了“Python内置文件操作有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python内置文件操作有哪些”吧!1、创建和打开文件想要操作文件需要先创建或代开指定文件并创
2023-07-06

批处理如何实现根据文件内容进行重命名操作

这篇文章将为大家详细讲解有关批处理如何实现根据文件内容进行重命名操作,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。我想实现以下的目的: 首先,我有个.dat文件,名字是固定的,需要更改这个文件名. .da
2023-06-09

Java 文件操作入门指南:从零到精通

Java 文件操作是 Java 编程中的基本知识,也是很多应用的基础。本文将介绍 Java 文件操作的基本知识,从创建、读取、写入、复制、移动和删除文件开始,到高级操作,如文件锁和元数据操作,以及如何使用文件操作库(如 Java NIO)来提高性能。
Java 文件操作入门指南:从零到精通
2024-02-26

python怎么将列表内容写入文件

要将列表内容写入文件,可以使用Python的内置函数open()来创建一个文件对象,然后使用文件对象的write()方法将列表内容写入文件。具体步骤如下:创建一个列表,假设列表名为my_list。使用open()函数创建一个文件对象,并指
2023-10-25

python基本文件操作(文件输入和输出

文件输入输出中常用的文件对象方法:open : 返回一个新的文件对象,调用该对象的上的方法可对文件进行任何操作readline: 读取一行数据包括结尾的换行符在内write: 将数据写入文件中close: 关闭文件对象; 举例:读取E盘中的
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录