python中jieba库用法详解-摩杜云开发者社区

python中jieba库用法详解

TEZNKK3IfmPf 2023年11月14日 18 0

python

jieba分词

示例代码：

import jieba

s = '我爱你伟大的中华人民共和国！人生苦短，我爱python！'

# 精确匹配 默认模式
ret1 = jieba.lcut(s, cut_all=False)  # 默认是False
print(ret1)

# 全匹配
ret2 = jieba.lcut(s, cut_all=True)
print(ret2)

# 精确匹配
ret3 = jieba.lcut_for_search(s)
print(ret3)

运行结果：

python中jieba库用法详解

词性标注

示例代码：

import jieba.posseg as pseg

s = '我爱你伟大的中华人民共和国！人生苦短，今天我要好好学习python！'

# 默认匹配
ret1 = pseg.lcut(s)
print(ret1)

ret2 = pseg.lcut(s, use_paddle=True)  # 看源码似乎需要安装
print(ret2)

运行结果：

python中jieba库用法详解

paddle模式的词性对照表如下：

python中jieba库用法详解

关键字提取

基于 TF-IDF 算法进行关键词提取，也可以基于TextRank 算法。 TF-IDF 算法与 elasticsearch 中使用的算法是一样的。

示例代码：

import jieba.analyse

s = '我爱你伟大的中华人民共和国！人生苦短，今天我要好好学习python！'
topk = 3

# 使用tf-idf算法提取关键词
tags = jieba.analyse.extract_tags(s, topk)
print(tags)

# 使用textrank算法提取关键词
tags2 = jieba.analyse.textrank(s, topk, withWeight=True)
print(tags2)

运行结果：

python中jieba库用法详解

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： centos7系统查看防火墙状态下一篇：【小沐学Python】Python实现Web图表功能（Dash之安装）

分享：

最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读

解决pandas读取文件报错ValueError: Invalid file path or buffer object type: ＜class ‘tuple‘＞

TEZNKK3IfmPf 21天前 32 0 0 python 开发语言

python的粘包和分包

TEZNKK3IfmPf 21天前 31 0 0 python

Python 中 assert的使用位置及源码解析

TEZNKK3IfmPf 2024年05月31日 18 0 0 python assert

生成一个文件保存在指定的文件夹中思路 python

TEZNKK3IfmPf 21天前 37 0 0 python 路径

安装pyspark kernel

TEZNKK3IfmPf 21天前 64 0 0 java spark python

Python——break、continue、pass语句作用

TEZNKK3IfmPf 21天前 40 0 0 python 开发语言

python进阶之内存模型

TEZNKK3IfmPf 21天前 28 0 0 python 内存

python3中，//、/ 的区别

TEZNKK3IfmPf 21天前 30 0 0 python

实验四、格子世界（Grid World）

TEZNKK3IfmPf 21天前 32 0 0 numpy python

python-函数-变量的作用域-全局变量

TEZNKK3IfmPf 21天前 30 0 0 python 函数

python subprocess阻塞

TEZNKK3IfmPf 2024年05月31日 36 0 0 python 开发语言

python界面开发--pyqt 小用

TEZNKK3IfmPf 21天前 29 0 0 python

Python输出带颜色字体

TEZNKK3IfmPf 2024年05月31日 27 0 0 python

python 写 Excel

TEZNKK3IfmPf 2024年05月31日 35 0 0 excel python

python vars() 函数用法及实例

TEZNKK3IfmPf 2024年05月31日 28 0 0 python

python-列表包字典-根据字典的某一个键的值来进行排序

TEZNKK3IfmPf 21天前 33 0 0 数据 python

python3中，isinstance() 函数

TEZNKK3IfmPf 21天前 36 0 0 字符串 python

python语句如何换行和字符串太长如何换行

TEZNKK3IfmPf 21天前 42 0 0 python 开发语言

为什么python-office自动化办公不支持mac和linux？

TEZNKK3IfmPf 21天前 35 0 0 linux python

loguru分离特定级别的日志到不同文件（TRACE/DEBUG/INFO/SUCCESS/WARNING/ERROR/CRITICAL）

TEZNKK3IfmPf 21天前 37 0 0 日志 python

TEZNKK3IfmPf

作者其他文章更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

最新推荐更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

使用面向对象重构之-从过程式设计到面向对象

2024-06-14

nodejs部署神器pm2的使用体验

2024-06-14

java虚拟机启动过程解析

2024-06-14

mysql-忘记密码时重置操作

2024-06-14

Callable和runnable的区别

2024-06-14

python的粘包和分包

2024-06-14

tftp文件服务（udp端口：69）

2024-06-14

C语言反汇编 - 流程控制与循环结构

2024-06-14

python-列表包字典-根据字典的某一个键的值来进行排序

2024-06-14

使用面向对象重构之-使用接口抽象完成不同维度的扩展

2024-06-14