Linux脚本练习之script067-统计每个单词出现的个数

TEZNKK3IfmPf 2023年11月13日 35 0

linux shell

script067

题目

题目来源于 SHELL9 统计每个单词出现的个数。

写一个 bash脚本以统计一个文本文件 nowcoder.txt 中每个单词出现的个数。

为了简单起见，你可以假设：

nowcoder.txt 只包括小写字母和空格。
每个单词只由小写字母组成。
单词间由一个或多个空格字符分隔。

示例，假设 nowcoder.txt 内容如下：

welcome nowcoder
welcome to nowcoder
nowcoder

你的脚本应当输出（以词频升序排列）：

to 1
welcome 2
nowcoder 3

说明：不要担心个数相同的单词的排序问题，每个单词出现的个数都是唯一的。

脚本一

通过 tr 命令将文件中所有的单词单独一行显示，即将空格分隔的单词使用换行符替换；然后通过 sort 命令将所有相同的单词相邻排序显示；再使用 uniq -c 命令统计每个单词的出现次数；由于要求按词频升序排列，所以需要通过 sort -n 进行数字排序；由于 uniq 命令显示是词频在前，单词在后，所以需要通过 awk 命令将单词显示在前，词频显示在后。

Linux脚本练习之script067-统计每个单词出现的个数

cat nowcoder.txt | tr -s ' ' '\n' | sort | uniq -c | sort -n | awk '{print $2,$1}'

脚本二

通过 awk 编程实现，原理是将每个单词存储到关联数组中，键是单词，键值是该单词的出现次数。在 {} 中将文本中所有单词的出现次数存放到关联数组中；再通过 END{} 循环遍历关联数组，输出每个单词的出现次数；最后通过 sort -n -k 2 将 awk 命令的输出结果按词频升序排列。

awk '{ for(i=1;i<=NF;i++) map[$i]++; } END{ for(key in map) printf("%s %d\n", key, map[key]); }' nowcoder.txt | sort -n -k 2

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： Linux命令之日历cal 下一篇： Linux命令之查找进程pgrep

分享：

最后一次编辑于 2023年11月13日 0

暂无评论

推荐阅读

【Linux】线程池 | 自旋锁 | 读写锁

TEZNKK3IfmPf 2024年05月31日 38 0 0 linux 服务器

tftp文件服务（udp端口：69）

TEZNKK3IfmPf 23天前 39 0 0 UDP linux 网络

Linux下使用SSH、Crontab、Rsync三工具实现数据自动备份

TEZNKK3IfmPf 23天前 35 0 0 linux ssh

谷歌Linux 运维工程师面试真题

TEZNKK3IfmPf 2024年05月31日 38 0 0 linux 运维

linux根据进程名称，查看后台任务的运行目录

TEZNKK3IfmPf 23天前 44 0 0 linux 服务器

【Linux】IO多路转接

TEZNKK3IfmPf 2024年05月31日 52 0 0 linux 服务器

Linux cp命令覆盖文件文件夹不提示

TEZNKK3IfmPf 2024年05月31日 41 0 0 linux 服务器

Ansible-06-模板

TEZNKK3IfmPf 2024年05月31日 30 0 0 linux 服务器 centos

Linux查看是否有受到DDoS攻击及缓解方法（netstat、iptables ）

TEZNKK3IfmPf 2024年05月31日 25 0 0 linux 网络

OSCP-Postfish（postfix、smtp、根据页面生成字典、pop3）

TEZNKK3IfmPf 2024年05月31日 32 0 0 linux 服务器 ubuntu

linux篇-图解cacti监控安装

TEZNKK3IfmPf 23天前 36 0 0 linux 运维 php

shell脚本if中判断大于、小于、等于、不等于的符号

TEZNKK3IfmPf 2024年05月31日 44 0 0 shell 脚本

linux篇-linux 下tomcat服务每天定时启动

TEZNKK3IfmPf 23天前 34 0 0 linux 服务器 tomcat

linux篇-rpm包安装mysql数据库

TEZNKK3IfmPf 23天前 38 0 0 linux 数据库 mysql

linux系统必备软件

TEZNKK3IfmPf 2024年05月31日 29 0 0 linux bind

自动杀死yarn 中运行的程序

TEZNKK3IfmPf 23天前 29 0 0 shell bash

shell脚本面试题

TEZNKK3IfmPf 23天前 31 0 0 shell

iostat命令安装及详解《性能监控工具》

TEZNKK3IfmPf 23天前 33 0 0 linux 服务器运维

为什么python-office自动化办公不支持mac和linux？

TEZNKK3IfmPf 23天前 35 0 0 linux python

【Shell】基础语法(一)

TEZNKK3IfmPf 2024年05月31日 40 0 0 linux shell

TEZNKK3IfmPf

作者其他文章更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

最新推荐更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

使用面向对象重构之-从过程式设计到面向对象

2024-06-14

nodejs部署神器pm2的使用体验

2024-06-14

java虚拟机启动过程解析

2024-06-14

mysql-忘记密码时重置操作

2024-06-14

Callable和runnable的区别

2024-06-14

python的粘包和分包

2024-06-14

tftp文件服务（udp端口：69）

2024-06-14

C语言反汇编 - 流程控制与循环结构

2024-06-14

python-列表包字典-根据字典的某一个键的值来进行排序

2024-06-14

使用面向对象重构之-使用接口抽象完成不同维度的扩展

2024-06-14