Python是一种广泛使用的编程语言,在数据挖掘、人工智能等领域有着广泛的应用。在日常的工作中,我们可能需要同时读取大量的文本数据,这时候就可以使用Python中的批量读取方法。
import os folder = 'path/to/folder' files = os.listdir(folder) for file in files: if file.endswith('.txt'): with open(os.path.join(folder, file), 'r') as f: data = f.read() # 对读取到的文件内容进行处理
以上代码中,我们首先通过os模块中的listdir方法读取指定文件夹下的所有文件名,并将其存储在列表files中。在循环中,我们使用文件名的endswith方法筛选出所有以.txt结尾的文件,并打开它们。通过os模块中的join方法可以方便地将文件夹路径与文件名进行拼接。在打开文件后,我们可以使用read方法读取文件的全部内容,并对其进行处理。
除了可以使用os模块中的listdir方法批量读取文件外,我们还可以使用glob模块:
import glob folder = 'path/to/folder' files = glob.glob(folder + '/*.txt') for file in files: with open(file, 'r') as f: data = f.read() # 对读取到的文件内容进行处理
通过glob.glob函数,我们可以指定路径及通配符,快速地获取所有符合条件的文件。对于读取大量数据来说,这种方法更加高效。