python查看文件有多少行(linux中查看文件有多少行数)

时间：2023-12-20 本站点击：0

导读：今天首席CTO笔记来给各位分享关于python查看文件有多少行的相关内容，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

python 检查两个文件夹的内容是否相同，里面有很多文件夹和文件，最主要的是不知道文件夹有几层！！！

我在公司写过一模一样的程序。我的方法是先用os.walk遍历所有文件，把两个文件夹的所有文件名弄在一个list里面。然后比较两个list元素，再对比每个文件的内容。如果lz是妹子的话欢迎加我QQ探讨，汉子就照着我的思路自己写吧。。。

Python文件操作，看这篇就足够!

文件的存储方式

在计算机中，文件是以二进制的方式保存在磁盘上的文本文件和二进制文件

文本文件可以使用文本编辑软件查看本质上还是二进制文件

二进制文件保存的内容不是给人直接阅读的，而是提供给其她软件使用的二进制文件不能使用文件编辑软件查看

文件基本操作

在计算机中要操作文件一共包含三个步骤：1.打开文件2.读、写文件

读将文件内容读入内容写将内存内容写入文件

模式描述

t文本模式 (默认)。

x写模式，新建一个文件，如果该文件已存在则会报错。

b二进制模式。

+打开一个文件进行更新(可读可写)。

U通用换行模式（不推荐）。

r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。

r+打开一个文件用于读写。文件指针将会放在文件的开头。

rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。

w打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

wb以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。

w+打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

wb+以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。

a打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

ab以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

a+打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。

ab+以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

文件打开模式有很多，但是我们实际用到的就只有六种。

我们总结一下主要用到的是下面六种

模式可做操作若文件不存在是否覆盖文件原来内容

r只读报错——

r+可读、可写报错是

w只写创建是

w+可读、可写创建是

a只写创建否，追加写

a+可读、可写创建否，追加写

只读模式打开文件——只读（r）

文件若不存在报错：

读写模式打开文件——读写模式（r+）

数据写入之前：

数据写入之后：

会替换掉相同长度的内容

文件若不存在报错：

写模式打开文件——写模式（w）

数据写入之前：

数据写入之后：

这种操作会删除原来的文件内容，重新写入Python，

并且把光标放在文件最开始。

若文件不存在，系统会创建该文件夹并重新写入内容

读写模式打开文件——读写模式（w+）

数据写入之前：

数据写入之后：

这种操作会删除原来的文件内容，重新写入Python，

并且把光标放在文件最开始。

若文件不存在，系统会创建该文件夹并重新写入内容

利用这个原理所以文件写模式(w)、读写模式(w+)还可以用作删除文件内容。

因为他们整个工作原理就是把文件原来的内容删除，然后写入新的内容。

如果我们写入的内容为空，那么不就是删除文件内容。

数据写入之前：

数据写入之后：

写模式打开文件（追加内容）——写模式（a）

数据写入之前：

数据写入之后：

可以看到是在原先内容的基础上在文末追加新的内容！

若文件不存在，系统会创建新的文件夹并写入内容

读写模式打开文件（追加内容）——读写模式（a）

数据写入之前：

数据写入之后：

可以看到是在原先内容的基础上在文末追加新的内容！

若文件不存在，系统会创建新的文件夹并写入内容

二进制模式打开文件

我们看到了在文件打开模式中有以下模式：rb、wb……有这种带 b 的。

什么意思呢？

就是用二进制的方式打开文件。

很明显，我们出现了以下错误：

主要原因是因为编码的问题，可能是因为0x82这个字节在gbk编码中没有这个字符，

可能原字符是两个字节，在gbk里被解析成了一个字节，导致字符不存在。

这就是我们文件打开方式需要使用二进制读取的原因。

文件操作

open 函数负责打开文件，并且返回文件对象

read /write / close 三个方法都需要通过文件对象来调用

文件和文件夹的操作

在Python中⽂件和⽂件夹的操作要借助os模块⾥⾯的相关功能，

具体步骤如下：

导⼊os模块

使⽤ os 模块相关功能

1、文件重命名

2、删除文件

3、创建文件夹

4、删除文件夹

5、获取当前目录

6、改变默认目录

7、获取目录列表

python 文件内容操作，如一个文件100万条数据，查询相同行数

使用open函数逐行读取文件，依次对比，如包含要求字符串，则数量累加1，读取完成后可统计出行数，代码如下：

n = 0

for line in open('filename','r'):

if '固定字符串' in line:

n += 1

print(n)

说明：

使用 for line in open这种方式可以提高代码效率，如需要更复杂统计，例如重复行，则可以使用hash函数，把行hash值存入列表，再做统计。

Python 文件操作

open(filename[,mode,encoding="编码"]) ：第一个参数文件名如果不加路径，默认在该py文件目录下（路径举例： E:/XXX或E:\\xxx ），第二个是模式，默认为 'r' ——只读，举例： f = open('E:/abc.txt') ，如果要转编码并写入模式：

f = open('E:/abc.txt','w',encoding='utf-8')

1. 模式

2. 方法

(1) close() : 关闭文件，因为文件写入时是写在内存，只有关闭时才写入硬盘，所以写完记得关闭

(2) read(size = -1) ：读取文件size个字符，不写默认是-1，此时读取所有内容（换行按\n来表示，很不好看），并作为字符串返回，一定要注意读完以后文件指针将会指向末尾，所以下一次在用read方法时会发现读取不出内容了，所以这个就要用seek移动指针或者关闭文件重新定义

(3) tell() ：返回当前文件指针指向的位置

(4) seek(offset,from) ：移动文件指针，代表从from参数开始偏移offset个字节，0代表起始位置，1代表当前位置，2代表文件末尾

(5) readline() ：按序列读取一行内容，默认\n为边界

(6) write() ：写入内容，但必须要有写入权限才行，否则报错，写完会返回写入的长度，例如： len1 = f.write('abc') ，此时len1就为3

(7) truncate() ：删除内容，把当前指针以后的内容全删了，举例：

注：

1.文件还可以转化为 list 之类的，例如： list1 = list(f) ，此时文件内容的按\n被隔开，然后可以用for语句读取文件所有内容，举例：

2.上面输出文件内容方法相对低效，所以一般都直接用for输出整个文件，举例：

通过 fileno 函数，我们可以查看一个文件对应的文件描述符，对应的是程序中打开的文件序号，举例：

可以看出python在启动时会先启动标准流的文件（文件描述符分别为：0/1/2），所以之后打开的文件就从3开始递增，当释放一个文件资源时，该描述符序号被释放，之后打开的文件可以继续使用该序号的文件描述符

python中的 print 的本质是通过 sys.stdout 来进行内容输出，而 sys.stdout 的本质是一个"文件"，相当于我们所有的输入输出的本质都是在对 sys.stdin / sys.stdout / sys.stderr 这些文件来进行读写操作，举例：

open 函数不仅可以打开本地文件，也可以打开文件描述符，而该参数默认为 True ，代表 close 后会将对应的文件资源释放，而对于一些文件描述符，我们只是希望 close 时将打开文件描述符的对象释放，而不释放对应的文件资源，那么则可以设置 closefd=False ，举例：

需要使用到 chardet 模块，按二进制可读打开文件，然后通过 detect() 方法查看，举例：

所以就可以根据文件来设置编码了：

有时候使用文件的编码解码也可能会出现无法解析的情况，例如两种编码混在同一个文件里的时候，此时可以设置 errors 参数为 ignore 来避免该问题，示例：

可用 os 模块下的 chmod() 函数，具体参考：

使用 os 模块下的 remove() 函数可以实现删除文件，举例：

可以使用自带的 zipfile 模块来进行操作，举例：

可以使用自带的 tarfile 模块来进行操作，举例：

python读取文本内每行指定内容

可以参考下面的代码：

f=file(yourpath)

for line in f:

t = line.split("==")

part_1 = t[0] + "=="

(part_2,part_3) = t[1].split("--")

del t

print "第一段:%s\t第二段:%s\t第三段:%s" %(part_1,part_2,part_3)

扩展资料：

python参考函数

callable(obj) 查看一个obj是不是可以像函数一样调用

repr(obj) 得到obj的表示字符串，可以利用这个字符串eval重建该对象的一个拷贝

eval_r(str) 表示合法的python表达式，返回这个表达式

hasattr(obj,name) 查看一个obj的name space中是否有name

setattr(obj,name,value) 为一个obj的name space中的一个name指向vale这个object

参考资料来源：百度百科-Python

Python其实很简单第十五章文件操作

在各种变量中保存的数据都是临时的，随着程序运行结束都会丢失。要做到数据长期有效，必须建立在磁盘中建立文件，将数据输入到文件中并保存。需要获取数据时需要打开文件读取。

而我们自己建立的程序都是应用程序，从本质上讲，应用程序是无法直接操作计算机的硬件的，譬如读写磁盘中文件，这就需要调用操作系统中的相应命令。接下来我们使用的Python内置函数open()、write()都是通过调用操作系统的相关命令才实现文件读写的，至于其中的细节，我们就不需要考虑了。

15.1创建和打开文件

在Python 中创建或打开文件，实际上是建立一个对象，该对象通过调用内置的open()函数创建或打开一个文件。

语法：

file object = open(filename [, mode][, buffering])

参数说明如下：

filename：file_name变量是一个包含了你要访问的文件名称的字符串值；

mode：mode决定了打开文件的模式：只读，写入，追加等。所有可取值见如下的完全列表。这个参数是非强制的，默认文件访问模式为只读(r)。

Buffering：如果buffering的值被设为0，就不会有寄存；如果buffering的值取1，访问文件时会寄存行；如果将buffering的值设为大于1的整数，表明了这就是的寄存区的缓冲大小；如果取负值，寄存区的缓冲大小则为系统默认。

mode参数的参数值及说明

对于其中最难区别的r、r+、w、w+、a、a+几个参数的区别总结如下，要特别注意指针的位置：

下面举例说明open( )函数的使用方法。

例1：

file=open('1.py')

如果文件“1.py”存在，则可以打开此文件；如果文件“1.py”不存在，则会出现如下提示：

Traceback (most recent call last):

File " ", line 1, in

file=open('1.py')

FileNotFoundError: [Errno 2] No such file or directory: '1.py'

例2：

file=open('4.py',’a+’)

虽然文件“4.py”不存在，但运行并未出现错误，参见上表，“a+”的含义是以读写模式打开文件，如果该文件已经存在，新内容将以追加方式写入；如果该文件不存在，则新建文件用于写入。查看文件夹，发现已经生成了一个新的文件4.py。

例3：

file=open('python.png','rb')

print(file)

运行结果：

这就是说，虽然Python可以打开一个图片格式的文件，但print()并不能将其输出，还需要第三方库中模块的相应方法去处理，如PIL中的open()f方法。

例4：

file = open("f.txt", "w",encoding='utf-8')

# 以只写模式打开文件f.txt，编码方式为utf-8

print( "文件名: ", file.name) # 输出文件名

print( "是否已关闭 : ", file.closed) # 文件是否打开

print( "访问模式 : ", file.mode) # 文件访问模式

运行结果：

文件名: f.txt

是否已关闭 : False

访问模式 : w

例5：

15.2关闭文件

打开文件使用后要及时关闭，以免造成不必要的破坏，同时也可以释放内存。在Python中使用close()方法可以关闭文件。

语法格式：

file.close()

其中，file为文件对象。

15.3 with语句

with 语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭、线程中锁的自动获取和释放等。

with语句的语法格式如下：

with expression as target:

with-body

其中，expression用于指定一个表达式，譬如打开文件的open()函数。target用于指定一个变量，并且将expression的结果保存到该变量中，譬如文件对象file。with-body用于指定with语句体，譬如一些文件操作的相关语句，如果没有要执行的语句体，则直接用pass语句代替。

假设python当前目录下存在一个test.txt文件，其内容如下：

Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。

Python是交互式语言：这意味着，您可以在一个 Python 提示符后直接执行代码。

Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。

Python是初学者的语言：Python 对初级程序员而言，是一种伟大的语言，它支持广泛的应用程序开发。

举例如下：

with open('test.txt','r',encoding='utf-8') as file:

line=file.readline() # readline()方法可以读取文件一行数据，接下来就会讲到。

print(line)

运行结果如下：

Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。

而此时，我们给该段代码with语句之外再增加一个读取文件的语句，代码如下：

with open('test.txt','r',encoding='utf-8') as file:

line=file.readline()

print(line)

line2=file.readline()

print(line2)

发现出现了如下错误提示：

Traceback (most recent call last):

File "C:/Users/zym/AppData/Local/Programs/Python/Python39/3.py", line 5, in

line2=file.readline()

ValueError: I/O operation on closed file.

意思是要读取的文件已经被关闭了。

由此可知，当with语句运行结束后，被打开的test.txt文件就自动关闭了。

15.4读取文件

在Python 中读取文件的方法有：

1、读取指定个数的字符

格式如下：

File.read([size])

其中，file为打开的文件对象。size为可选参数，可以指定要读取的字符个数，省缺表示读取所有内容。

在调用read()方法读取文件内容时，文件必须是以r（只读）或者r+(读写）方式打开。

如：

with open('test.txt','r',encoding='utf-8') as file:

txt=file.read() （或txt=file.read(10)）

print(txt)

将读取、输出test.txt文件的全部内容（或前10个字符）。

2、移动文件的指针

对于刚打开的文件，文件指针总是指向文件头的。也可以通过seek()方法将文件的指针移动到新的位置。

格式如下：

file.seek(offset[,whence])

其中，file表示已经打开的文件对象；offset用于指定移动的字符个数；whence表示从哪个位置起始计算个数，其值为0表示从文件头开始计算，其值为1表示从当前位置开始计算，其值为2表示从文件尾开始计算，默认值为0。

例如：

with open('test.txt','r',encoding='utf-8') as file:

string=file.read(9)

print('取9个字符： '+string)

file.seek(2) #指针从文件头开始移动2个字符

string=file.read(9) #从当前位置读取10个字符

输出结果：

取9个字符：

Python是一种

取9个字符：

thon是一种解释

而下面的代码会抛出错误：

with open('test.txt','r',encoding='utf-8') as file:

file.seek(2,1) #指针从当前位置开始移动2个字符

string=file.read(10) #从当前位置读取10个字符

print('取10个字符： '+string)

错误提示为：

Traceback (most recent call last):

File "C:UserszymAppDataLocalProgramsPythonPython393.py", line 7, in

file.seek(2,1) #指针从当前位置开始移动2个字符

io.UnsupportedOperation: can't do nonzero cur-relative seeks

原因在于，必须使用b模式（即rb）打开文件，才能使用whence参数。但是，b模式（二进制）不适合文本文件。对于test.txt这样的文本文件，为了解决通过改变指针读取任意位置字符，可以采用加一个位置变量的方法来存储指针的值。

例如：

with open('test.txt','r',encoding='utf-8') as file:

#utf-8汉字与英文字符都占一个字符

string='' #设置一个空字符串

pointer=0 #当前指针为0

str1=file.read(6) #读取6个字符

pointer+=6 #指针变量后移6个字符

string+=str1 #string用来存放已读取的字符

print('取6个字符： ',str1)

file.seek(pointer) #指针从文件头开始移动2个字符

str1=file.read(8) #从当前位置读取10个字符

pointer+=8 #指针跳过已读取的字符

string+=str1

print('再取8个字符： ',str1)

print('所有读取的字符： ',string)

print('当前指针所处的位置： ',pointer)

str1=file.read(1)

print('当前指针所处的字符： ',str1)

运行结果如下：

取6个字符：

Python

再取8个字符：

是一种解释型语言

所有读取的字符：

Python是一种解释型语言

当前指针所处的位置：

当前指针所处的字符：

：

3、读取一行数据readline()方法

语法格式：

file.readline()

例：

with open('test.txt','r',encoding='utf-8') as f:

string=f.read(1) # 读取文件的第一个字符

if string != '': # 防止文件为空文件

lineno=0

while True:

line=f.readline()

if line != '':

lineno+=1

print('第'+str(lineno)+'行：'+line,end='')

# 因为每行都有自带的分行符，print()语句不允许换行

else:

break # 出现空行时停止读取

else:

print('要读取的文件为空文件！')

运行结果：

第1行：ython是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。

第2行：Python是交互式语言：这意味着，您可以在一个 Python 提示符后直接执行代码。

第3行：Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。

第4行：Python是初学者的语言：Python 对初级程序员而言，是一种伟大的语言，它支持广泛的应用程序开发。

4、读取全部行命令readlines()方法

语法格式：

File.readlines()

该方法与read()方法一样，在调用read()方法读取文件内容时，文件必须是以r（只读）或者r+(读写）方式打开。

例：

with open('test.txt','r',encoding='utf-8') as f:

txt=f.readlines()

print(txt)

运行结果：

['Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。 ', 'Python是交互式语言：这意味着，您可以在一个 Python 提示符后直接执行代码。 ', 'Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。 ', 'Python是初学者的语言：Python 对初级程序员而言，是一种伟大的语言，它支持广泛的应用程序开发。 ']

从上面的运行结果可以看出，readlines()方法的返回值为一个字符串列表。所以，也可以以读取列表元素的方法输出。如下所示：

with open('test.txt','r',encoding='utf-8') as f:

txt=f.readlines()

for line in txt:

print(line,end='')

运行结果：

Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。

Python是交互式语言：这意味着，您可以在一个 Python 提示符后直接执行代码。

Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。

Python是初学者的语言：Python 对初级程序员而言，是一种伟大的语言，它支持广泛的应用程序开发。

15.5 写入文件内容

语法格式如下：

file.write(string)

其中，file为打开的文件对象，string为要写入的字符串。

写入文件内容时，文件必须以w（可写）或a（追加）模式打开。否则，会抛出如下异常提示：

Traceback (most recent call last):

File "C:UsersAdministratorAppDataLocalProgramsPythonPython383.py", line 2, in

f.write('人生苦短，我用Python！')

io.UnsupportedOperation: not writable

关于write()方法的用法举例如下：

with open('test.txt','a',encoding='utf-8') as f:

f.write('人生苦短，我用Python！')

with open('test.txt','r',encoding='utf-8') as f:

txt=f.read()

print(txt)

运行结果：

Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。

Python是交互式语言：这意味着，您可以在一个 Python 提示符后直接执行代码。

Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。

Python是初学者的语言：Python 对初级程序员而言，是一种伟大的语言，它支持广泛的应用程序开发。

人生苦短，我用Python！

可以看出，由于文件的打开方式为a模式（追加模式），写入的内容被写入到文件的末尾。

在Python中，文件操作方法里没有类似于字符串内的计算长度、查找、替换、截取、分隔等方法，为什么没有？原因可能是文件的类型太复杂，譬如说二进制文件，上述操作的意义不大。如果仅仅要对文本文件进行上述操作，完全可以先把文件的内容读取到字符串中，再用相应的字符串函数或方法去操作就可以了。譬如，要将test.txt文件中的字符串‘Python’替换为’PHP’，则可以用如下代码完成：

txt1=''

with open('test.txt','r',encoding='utf-8') as f:

txt1=f.read() #先将文件内容存入字符串txt1中

txt2=txt1.replace('Python','PHP') #将txt1中的'Python'替换为'PHP'，并存入txt2

with open('test.txt','w',encoding='utf-8') as f:

f.write(txt2) #将字符串txt2的内容写回到文件中

这里之所以分两步打开文件（第一次为r模式，第二次为w模式），而没有采用一次读写（r+、w+方式），因为那样比较容易出错。实践证明，将文件的读操作和写操作分开其实是非常正确的选择。

结语：以上就是首席CTO笔记为大家介绍的关于python查看文件有多少行的全部内容了，希望对大家有所帮助，如果你还想了解更多这方面的信息，记得收藏关注本站。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/Python/46134.html

python查看文件有多少行(linux中查看文件有多少行数)

python 检查两个文件夹的内容是否相同，里面有很多文件夹和文件，最主要的是不知道文件夹有几层！！！

Python文件操作，看这篇就足够!

python 文件内容操作，如一个文件100万条数据，查询相同行数

Python 文件操作

python读取文本内每行指定内容

Python其实很简单 第十五章 文件操作

最新文章

Python其实很简单第十五章文件操作