首页>>后端>>Python->python统计文本有多少个单词(2023年最新分享)

python统计文本有多少个单词(2023年最新分享)

时间:2023-12-12 本站 点击:0

导读:今天首席CTO笔记来给各位分享关于python统计文本有多少个单词的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

如何用python统计一个txt文件中各个单词出现的次数

1、首先,定义一个变量,保存要统计的英文文章。

2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。

3、从文章中分割出所有的单词,保存在数组中。

4、然后,计算文章中单词的总数,保存在变量中。

5、用for循环,统计文章中各单词的词频。

6、最后,输出文章中各单词的词频。

7、运行程序,电脑会自动统计输入文章中各单词的词频。

python统计个单词数目

楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等。

请问楼主要区分大小写吗?如果区分的话,就按照下面的来:

import re

def get_word_frequencies(file_name):

dic = {}

txt = open(filename, 'r').read().splitlines()

#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中。

txt = re.sub(r'[^\u4e00-\u94a5\w\d\-]', ' ', txt)

#替换单独的'-'

txt = re.sub(r' - ', ' ', txt)

for line in :

for word in line.split():

#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(), 0)

dic.setdefault(word, 0)

dic[word] += 1

print dic

if __name__ = '__main__':

get_word_frequencies('test.txt')

有问题继续追问吧

用python统计一段文本中单词出现的次数

python有个特别简单的方法就可以实现,直接用str的count方法就可以了,如下

python统计字符串中单词数量

使用比较基本的方法写的参考代码:

#!/usr/bin/env python

#  -*- coding: utf-8 -*-

#python 2.7

import re

print u'请输入字符串:'

wz = raw_input()

s = wz.lower()

#小写单词的正则表达式

r='[a-z]+'

#找到所有单词

ws = re.findall(r,s)

#定义一个字典来存储单词和次数

dt = {}

for w in ws:

dt[w] = dt.setdefault(w,0)+1

#wd来存储单词集合,可能有几个,比如2个单词,都出现30次

wd = []

#max用来存储单词出现的最多的次数

max = 0

for word,times in dt.items():

if timesmax:

wd = []

wd.append(word)

max = times

elif times == max:

wd.append(word)

print u'有%s个单词,出现频率最高:'%len(wd)

for x in wd:

print "%s\t%s"%(x,max)

测试

请输入字符串:

A good beginning makes a good ending!!!

有2个单词,出现频率最高:

a       2

good    2

python,字符串怎么统计单词个数

如果你是指一串单词,空格隔开的,统计词频,就用列表和字典来。

比如输入的是这样:this one ok this one two three go end at end

dic1={}

n=input().split()

for i in n:

缩进if i in dic1:dic1[i]+=1

缩进else:dic1[i]=1

print(dic1)

python中怎么样统计一篇文章中的单词个数

你好,楼主,可以使用字符串的统计函数来完成。

详细代码如下:

w = 'python,我爱python,hello python。'

print("python出现了%s次"%w.count('python'))

结语:以上就是首席CTO笔记为大家整理的关于python统计文本有多少个单词的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于python统计文本有多少个单词的相关内容别忘了在本站进行查找喔。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/Python/27942.html