位置：首页-资讯-人工智能

在Linux的命令行中实现字符出现频率统计的方法

2023-06-13 00:45

短信预约 -IT技能 免费直播动态提醒

本篇内容主要讲解“在Linux的命令行中实现字符出现频率统计的方法”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“在Linux的命令行中实现字符出现频率统计的方法”吧!

立刻来到我们脑海的命令，计算字和字符在一个文本文件中出现频率的 Linux 命令是 wc 命令。
在使用的脚本来分析文本文件之前，我们必须有一个文本文件。为了保持一致性，我们将创建一个文本文件，man命令的输出如下所述。

代码如下:

$ man man > man.txt

以上命令是将man命令的使用方式导入到man.txt文件里。

我们希望能得到最平常的单词，对之前我们新建的文件执行如下脚本。

代码如下:

Sample Output

代码如下:

7557
262 the
163 to
112 is
112 a
78 of
78 manual
76 and
64 if
63 be

上面的脚本，输出了最常使用的十个单词。

如何看单个的字母呢？那就用如下的命令。

代码如下:

$ echo 'tecmint team' | fold -w1</p><p>Sample Output</p><p> [code] t
e
c
m
i
n
t
t
e
a
m

注: -w1只是设定了长度

现在我们将从那个文本文件中掰下来的每一个字母，对结果进行排序，得到所需的输出频率的十个最常见的字符。

$ fold -w1 < man.txt | sort | uniq -c | sort -rn | head

Sample Output

代码如下:

8579
2413 e
1987 a
1875 t
1644 i
1553 n
1522 o
1514 s
1224 r
1021 l

如何区分大小写呢？之前我们都是忽略大小写的。所以，用如下命令。

Sample Output

代码如下:

11636
2504 E
2079 A
2005 T
1729 I
1645 N
1632 S
1580 o
1269 R
1055 L
836 H
791 P
766 D
753 C
725 M
690 U
605 F
504 G
352 Y
344 .

请检查上面的输出，标点符号居然包括在内。让我们干掉他，用tr 命令。GO:

代码如下:

Sample Output

代码如下:

11636
2504 E
2079 A
2005 T
1729 I
1645 N
1632 S
1580 O
1550
1269 R
1055 L
836 H
791 P
766 D
753 C
725 M
690 U
605 F
504 G
352 Y

现在，我们有了三个文本，那就让我们用如下命令查看结果吧。

代码如下:

Sample Output

代码如下:

11636
2504 E
2079 A
2005 T
1729 I
1645 N
1632 S
1580 O

下一步我们将会生成那些罕见的至少十个字母长的单词。以下是简单的脚本：

代码如下:

Sample Output

代码如下:

1 ──────────────────────────────────────────
1 a all
1 abc any or all arguments within are optional
1 able see setlocale for precise details
1 ab options delimited by cannot be used together
1 achieved by using the less environment variable
1 a child process returned a nonzero exit status
1 act as if this option was supplied using the name as a filename
1 activate local mode format and display local manual files
1 acute accent

注: 上面的.越来越多，其实，我们可以使用.{10} 得到同样的效果。

这些简单的脚本，让我们知道最频繁出现的单词和英语中的字符。

到此，相信大家对“在Linux的命令行中实现字符出现频率统计的方法”有了更深的了解，不妨来实际操作一番吧！这里是编程网网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

在Linux的命令行中实现字符出现频率统计的方法

下载Word文档到电脑，方便收藏和打印～

下载Word文档

在Linux的命令行中实现字符出现频率统计的方法

在Linux的命令行中实现字符出现频率统计的方法

相关文章

猜你喜欢

在Linux的命令行中实现字符出现频率统计的方法

tr命令在统计英文单词出现频率中的妙用

Java编程实现统计一个字符串中各个字符出现次数的方法

java在linux本地执行shell命令的实现方法

Java案例使用集合方法实现统计任意字符串中字符出现的次数

Golang 统计字符串中数字字母数量的实现方法

MSSQL sqlserver 统计"一个字符串"在"另一个字符串"中出现的次数的方法

shell查找某字符串在某文件中出现行数的方法

win8系统中的管理无线网络工具在哪里?用命令实现无线网络管理方法介绍

热门标签

编程热搜

clickhouse linux安装

linux如何替换文件内容

如何保证Linux服务器的安全

Linux中搭建完整的samba服务器全攻略（centos版）

linux如何重启tomcat

linux如何创建目录文件

linux重启防火墙服务的方法

linux怎么查看系统负载均衡

linux如何删除一个文件

Linux、ubuntu系统下查看显卡型号、显卡信息详解

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

在Linux的命令行中实现字符出现频率统计的方法

在Linux的命令行中实现字符出现频率统计的方法

相关文章

猜你喜欢

在Linux的命令行中实现字符出现频率统计的方法

tr命令在统计英文单词出现频率中的妙用

Java编程实现统计一个字符串中各个字符出现次数的方法

java在linux本地执行shell命令的实现方法

Java案例使用集合方法实现统计任意字符串中字符出现的次数

Golang 统计字符串中数字字母数量的实现方法

MSSQL sqlserver 统计"一个字符串"在"另一个字符串"中出现的次数的方法

shell查找某字符串在某文件中出现行数的方法

win8系统中的管理无线网络工具在哪里?用命令实现无线网络管理方法介绍

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复