likes
comments
collection
share

[python] 文件夹所有文件读取,正则化,json使用

作者站长头像
站长
· 阅读数 41

今天做了把参数文件和对应的图片文件结合,进行处理的工作,用到了读取文件名、正则化(名字对应)、json。

读取文件下文件

os.listdir(path)是得到在path路径下所以文件的名称列表。

open(path)是打开某个文件。

import os
path = "D:/Python34/news" #文件夹目录
files= os.listdir(path) #得到文件夹下的所有文件名称
s = []
for file in files: #遍历文件夹
     if not os.path.isdir(file): #判断是否是文件夹,不是文件夹才打开
          f = open(path+"/"+file); #打开文件
          iter_f = iter(f); #创建迭代器
          str = ""
          for line in iter_f: #遍历文件,一行行遍历,读取文本
              str = str + line
          s.append(str) #每个文件的文本存到list中
print(s) #打印结果

正则表达式匹配

import re
# re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
re.match(pattern, string, flags=0)
# 参数    描述
# pattern    匹配的正则表达式
# string    要匹配的字符串。
# flags    标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。参见:正则表达式修饰符 - 可选标志


# re.search 匹配成功re.search方法返回一个匹配的对象,否则返回None。
re.search(pattern, string, flags=0)
# pattern    匹配的正则表达式
# string    要匹配的字符串。
# flags    标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。

json.loads V.S. json.load

json.loads()解码python json格式json.load()加载python json格式文件