python提取具有某种特定字符串的行数据-摩杜云开发者社区

今天又帮女朋友处理了一下，她的实验数据，因为python是一年前经常用，最近找工作，用的是c，c++，python的有些东西忘记了，弄的慢了一点，哈哈哈

好的，数据是这样的，我截个图 python提取具有某种特定字符串的行数据_f5

我用红括号括起来的，就是我所要提取的数据

其中lossstotal.txt是我要提取的原始数据，考虑两种方法去提取，前期以为所要提取行的数据是有一定规律的，后来发现，并不是，所以，我考虑用正则来提取，经过思考以后，完成了数据的提取，如下午所示，数据变的非常好看
python提取具有某种特定字符串的行数据_其他_02

代码如下：

#coding:utf-8
#__author__ ='dell'

import re

f1=file('losstotal.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
f2 = open('loss2.txt', 'w')

# # 按照特定行提取，发现后面的行并无规律
# i = 0
# for line in data1:
# 	i+=1
# 	# print line
# 	if((i-1)%3==0):
# 		f2.write(line)
# 		print line


# 利用正则表达式

for line in data1:
	data2=line.split()
	# print data2
	for i in data2:
		n = re.findall(r"Iteration", i)
		# m=re.findall(r"loss", i)
		if n:
			# print line
			f2.writelines(line)
f2.close()


f3=file('loss2.txt','r')
data3=f3.readlines()
# print data1
f3.close()
f4 = open('loss3.txt', 'w')

for line in data3:
	data4=line.split()
	# print data2
	for i in data4:
		n = re.findall(r"loss", i)
		# m=re.findall(r"loss", i)
		if n:
			print line
			f4.writelines(line)
f4.close()


# 去掉逗号
f5=open('loss3.txt','r')
data5=f5.read()
f5=data5.replace(',',' ')
f6=file('lossfinal.txt','w')
f6.write(f5)
f6.close()

# # 去掉等号=
f7=open('lossfinal.txt','r')
data7=f7.read()
f7=data7.replace('=',' ')
f8=file('lossfinal.txt','w')
f8.write(f7)
f8.close()
				# data3=lin.split()
				# for j in data3:
				# 	m=re.findall(r"loss",i)
				# 	if m:
				# 		print lin

		# # m=re.findall(r"sgd_solver.cpp",i)
		# n=re.findall(r"Iteration",i)

我在同样的目录下，还建立了 python提取具有某种特定字符串的行数据_数据_03

这几个txt文件，要不然，代码跑不通的哟。

解释：我连续用了两个正则，各自把含有特定字符串的行进行提取，两个写一起，发现还是不太会，所以分开写了，但是结果还是完成的不错