250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- mro()
- items()
- 오버라이딩
- count()
- View
- __sub__
- __len__
- 파이썬
- shutil
- JS
- glob
- choice()
- __getitem__
- inplace()
- MySqlDB
- HTML
- Database
- node.js
- locals()
- shuffle()
- fnmatch
- randrange()
- fileinput
- zipfile
- remove()
- discard()
- __annotations__
- MySQL
- decode()
- CSS
Archives
- Today
- Total
흰둥이는 코드를 짤 때 짖어 (왈!왈!왈!왈!왈!왈!왈!왈!왈!왈!왈!)
(파이썬) 폴더 관리 프로그램 실습 본문
728x90
반응형
1. 압축 파일 정리하기
In [1]:
import os
os.getcwd()
Out[1]:
'C:\\LeeCoding\\Python\\Jupyter'
In [2]:
# 정리 대상 폴더 경로를 설정
target_path = './고라니'
In [3]:
# 압축 파일 확인
import glob
zipfile_path = []
for filename in glob.glob(os.path.join(target_path, '**/*.zip'), recursive=True):
zipfile_path.append(filename)
print(zipfile_path)
['./고라니\\데이터저장_물류.zip']
In [4]:
# 압축 파일 해제
import zipfile
for filename in zipfile_path:
with zipfile.ZipFile(filename) as myzip:
zipinfo = myzip.infolist() # zip파일 정보
for info in zipinfo:
decode_name = info.filename.encode('cp437').decode('euc-kr') # 한글 때짐 방지
info.filename = os.path.join(target_path, decode_name)
myzip.extract(info)
2. 파일명 정리하기
In [7]:
!pip install openpyxl
Collecting openpyxl
Downloading openpyxl-3.1.2-py2.py3-none-any.whl (249 kB)
Collecting et-xmlfile
Downloading et_xmlfile-1.1.0-py3-none-any.whl (4.7 kB)
Installing collected packages: et-xmlfile, openpyxl
Successfully installed et-xmlfile-1.1.0 openpyxl-3.1.2
WARNING: You are using pip version 20.2.1; however, version 23.0.1 is available.
You should consider upgrading via the 'c:\users\acer\appdata\local\programs\python\python38\python.exe -m pip install --upgrade pip' command.
엑셀 파일을 파이썬과 연동하기 위한 라이브러리를 다운 받았다.
In [8]:
import openpyxl as opx
In [21]:
# 폴더별 파일명을 입력 받아 액셀파일에 저장하는 함수
def getFileName(target_path):
wb = opx.Workbook()
ws = wb.active # 새로 생성한 WorkBook의 활성화 시트를 ws로 정의
ws.cell(row=1, column=1).value = '파일경로'
ws.cell(row=1, column=2).value = '파일명(변경전)'
ws.cell(row=1, column=3).value = '파일명(변경후)'
i = 2
current_dir = target_path
filelist = os.listdir(current_dir)
for filename in filelist:
ws.cell(row=i, column=1).value = current_dir + '/'
ws.cell(row=i, column=2).value = filename
i = i + 1
wb.save(os.path.join(target_path, 'filelist.xlsx'))
In [22]:
getFileName(target_path)
3. 파일명 변경하기
먼저 엑셀에서 변경할 파일명들을 직접 입력한다.
In [23]:
def excelRead(filepath : str) -> list:
wb = opx.load_workbook(filepath)
ws = wb.active
dirpath = [r[0].value for r in ws]
file_before = [r[1].value for r in ws]
file_after = [r[2].value for r in ws]
len_num = len(dirpath)
datalist = []
for i in range(1, len_num):
temp_tuple = (dirpath[i], file_before[i], file_after[i])
datalist.append(temp_tuple)
return datalist
In [24]:
rename_list = excelRead(os.path.join(target_path, 'filelist.xlsx'))
print(rename_list)
[('./고라니/', 'A_2022_01_13_부서로그_인사_001.pdf', 'A_2022_01_13_부서로그_인사_001.pdf'), ('./고라니/', 'A_2022_01_13_부서로그_인사_002.pdf', 'A_2022_01_13_부서로그_인사_002.pdf'), ('./고라니/', 'A_2022_01_13_부서로그_인사_003.pdf', 'A_2022_01_13_부서로그_인사_003.pdf'), ('./고라니/', 'A_2022_04_10_생산로그_생산_001.pdf', 'A_2022_04_10_생산로그_생산_001.pdf'), ('./고라니/', 'A_2022_04_10_생산로그_생산_002.pdf', 'A_2022_04_10_생산로그_생산_002.pdf'), ('./고라니/', 'A_2022_04_10_생산로그_생산_003.pdf', 'A_2022_04_10_생산로그_생산_003.pdf'), ('./고라니/', 'A_2022_04_10_생산로그_생산_004.pdf', 'A_2022_04_10_생산로그_생산_004.pdf'), ('./고라니/', 'A_2022_06_30_생산로그_생산_001.pdf', 'A_2022_06_30_생산로그_생산_001.pdf'), ('./고라니/', 'A_2022_06_30_생산로그_생산_002.pdf', 'A_2022_06_30_생산로그_생산_002.pdf'), ('./고라니/', 'A_2022_07_20_부서로그_인사_001.pdf', 'A_2022_07_20_부서로그_인사_001.pdf'), ('./고라니/', 'A_2022_07_20_부서로그_인사_002.pdf', 'A_2022_07_20_부서로그_인사_002.pdf'), ('./고라니/', 'A_2022_07_20_부서로그_인사_003.pdf', 'A_2022_07_20_부서로그_인사_003.pdf'), ('./고라니/', 'A_2022_07_20_부서로그_인사_004 (1).pdf', 'A_2022_07_20_부서로그_인사_004.pdf'), ('./고라니/', 'B_2022_02_20_상반기_클래스설계_001.xlsx', 'B_2022_02_20_상반기_클래스설계_001.xlsx'), ('./고라니/', 'B_2022_02_20_상반기_클래스설계_002.xlsx', 'B_2022_02_20_상반기_클래스설계_002.xlsx'), ('./고라니/', 'B_2022_06_20_하반기_클래스설계_001.xlsx', 'B_2022_06_20_하반기_클래스설계_001.xlsx'), ('./고라니/', 'B_2022_06_30_하반기_클래스설계_002.xlsx', 'B_2022_06_30_하반기_클래스설계_002.xlsx'), ('./고라니/', 'C_2022_03_30_데이터베이스_ERD_001.xlsx', 'C_2022_03_30_데이터베이스_ERD_001.xlsx'), ('./고라니/', 'C_2022_03_30_데이터베이스_ERD_002.xlsx', 'C_2022_03_30_데이터베이스_ERD_002.xlsx'), ('./고라니/', 'C_2022_03_30_데이터베이스_ERD_003.xlsx', 'C_2022_03_30_데이터베이스_ERD_003.xlsx'), ('./고라니/', 'C_2022_09_10_데이터베이스_ERD_001 (1).xlsx', 'C_2022_09_10_데이터베이스_ERD_001.xlsx'), ('./고라니/', 'C_2022_09_10_데이터베이스_ERD_002.xlsx', 'C_2022_09_10_데이터베이스_ERD_002.xlsx'), ('./고라니/', 'C_2022_09_10_데이터베이스_ERD_003.xlsx', 'C_2022_09_10_데이터베이스_ERD_003.xlsx'), ('./고라니/', 'D_20220110_데이터저장_물류_001.pdf', 'D_20220110_데이터저장_물류_001.pdf'), ('./고라니/', 'D_20220110_데이터저장_물류_002.pdf', 'D_20220110_데이터저장_물류_002.pdf'), ('./고라니/', 'D_20220723_데이터저장_물류_001.pdf', 'D_20220723_데이터저장_물류_001.pdf'), ('./고라니/', 'D_20220723_센터가동현황_물류_002.pdf', 'D_20220723_센터가동현황_물류_002.pdf'), ('./고라니/', '내사진.jpg', '내사진.jpg'), ('./고라니/', '데이터저장_물류.zip', '데이터저장_물류.zip'), ('./고라니/', '새파일1_복사본.txt', '새파일1_복사본.txt'), ('./고라니/', '점심시간.txt', '저녁시간.txt'), ('./고라니/', '주피터노트북.txt', '주피터노트북.txt')]
In [26]:
import shutil
def fileRename(datalist : list):
for data in datalist:
print(data[1] + '의 파일 명을 ' + data[2] + '로 변경합니다')
shutil.move(data[0]+data[1], data[0]+data[2])
In [27]:
fileRename(rename_list)
A_2022_01_13_부서로그_인사_001.pdf의 파일 명을 A_2022_01_13_부서로그_인사_001.pdf로 변경합니다
A_2022_01_13_부서로그_인사_002.pdf의 파일 명을 A_2022_01_13_부서로그_인사_002.pdf로 변경합니다
A_2022_01_13_부서로그_인사_003.pdf의 파일 명을 A_2022_01_13_부서로그_인사_003.pdf로 변경합니다
A_2022_04_10_생산로그_생산_001.pdf의 파일 명을 A_2022_04_10_생산로그_생산_001.pdf로 변경합니다
A_2022_04_10_생산로그_생산_002.pdf의 파일 명을 A_2022_04_10_생산로그_생산_002.pdf로 변경합니다
A_2022_04_10_생산로그_생산_003.pdf의 파일 명을 A_2022_04_10_생산로그_생산_003.pdf로 변경합니다
A_2022_04_10_생산로그_생산_004.pdf의 파일 명을 A_2022_04_10_생산로그_생산_004.pdf로 변경합니다
A_2022_06_30_생산로그_생산_001.pdf의 파일 명을 A_2022_06_30_생산로그_생산_001.pdf로 변경합니다
A_2022_06_30_생산로그_생산_002.pdf의 파일 명을 A_2022_06_30_생산로그_생산_002.pdf로 변경합니다
A_2022_07_20_부서로그_인사_001.pdf의 파일 명을 A_2022_07_20_부서로그_인사_001.pdf로 변경합니다
A_2022_07_20_부서로그_인사_002.pdf의 파일 명을 A_2022_07_20_부서로그_인사_002.pdf로 변경합니다
A_2022_07_20_부서로그_인사_003.pdf의 파일 명을 A_2022_07_20_부서로그_인사_003.pdf로 변경합니다
A_2022_07_20_부서로그_인사_004 (1).pdf의 파일 명을 A_2022_07_20_부서로그_인사_004.pdf로 변경합니다
B_2022_02_20_상반기_클래스설계_001.xlsx의 파일 명을 B_2022_02_20_상반기_클래스설계_001.xlsx로 변경합니다
B_2022_02_20_상반기_클래스설계_002.xlsx의 파일 명을 B_2022_02_20_상반기_클래스설계_002.xlsx로 변경합니다
B_2022_06_20_하반기_클래스설계_001.xlsx의 파일 명을 B_2022_06_20_하반기_클래스설계_001.xlsx로 변경합니다
B_2022_06_30_하반기_클래스설계_002.xlsx의 파일 명을 B_2022_06_30_하반기_클래스설계_002.xlsx로 변경합니다
C_2022_03_30_데이터베이스_ERD_001.xlsx의 파일 명을 C_2022_03_30_데이터베이스_ERD_001.xlsx로 변경합니다
C_2022_03_30_데이터베이스_ERD_002.xlsx의 파일 명을 C_2022_03_30_데이터베이스_ERD_002.xlsx로 변경합니다
C_2022_03_30_데이터베이스_ERD_003.xlsx의 파일 명을 C_2022_03_30_데이터베이스_ERD_003.xlsx로 변경합니다
C_2022_09_10_데이터베이스_ERD_001 (1).xlsx의 파일 명을 C_2022_09_10_데이터베이스_ERD_001.xlsx로 변경합니다
C_2022_09_10_데이터베이스_ERD_002.xlsx의 파일 명을 C_2022_09_10_데이터베이스_ERD_002.xlsx로 변경합니다
C_2022_09_10_데이터베이스_ERD_003.xlsx의 파일 명을 C_2022_09_10_데이터베이스_ERD_003.xlsx로 변경합니다
D_20220110_데이터저장_물류_001.pdf의 파일 명을 D_20220110_데이터저장_물류_001.pdf로 변경합니다
D_20220110_데이터저장_물류_002.pdf의 파일 명을 D_20220110_데이터저장_물류_002.pdf로 변경합니다
D_20220723_데이터저장_물류_001.pdf의 파일 명을 D_20220723_데이터저장_물류_001.pdf로 변경합니다
D_20220723_센터가동현황_물류_002.pdf의 파일 명을 D_20220723_센터가동현황_물류_002.pdf로 변경합니다
내사진.jpg의 파일 명을 내사진.jpg로 변경합니다
데이터저장_물류.zip의 파일 명을 데이터저장_물류.zip로 변경합니다
새파일1_복사본.txt의 파일 명을 새파일1_복사본.txt로 변경합니다
점심시간.txt의 파일 명을 저녁시간.txt로 변경합니다
주피터노트북.txt의 파일 명을 주피터노트북.txt로 변경합니다
4. 폴더 생성하기
In [28]:
import fnmatch
In [33]:
def categoryList(target_path : str) -> list:
file_list = []
for filename in os.listdir(target_path):
if fnmatch.fnmatch(filename, '*_[0-9][0-9][0-9].*'):
file_list.append(filename)
category = []
for file in file_list:
temp_list = file.split('_')
category.append(temp_list[-2])
temp_set = set(category)
result = list(temp_set)
return result
In [34]:
categoryList(target_path)
Out[34]:
['물류', 'ERD', '클래스설계', '인사', '생산']
In [36]:
categorylist = categoryList(target_path) + ['기타']
print(categorylist)
['물류', 'ERD', '클래스설계', '인사', '생산', '기타']
In [37]:
import pathlib
In [42]:
new_path = './new_dir'
def makeDir(new_path:str, categorylist:list):
for category in categorylist:
new_dir = pathlib.Path(os.path.join(new_path, category))
new_dir.mkdir(parents=True, exist_ok=True)
In [43]:
makeDir(new_path, categorylist)
5. 파일 분류 및 이동하기
In [44]:
import shutil
In [49]:
def moveFile(new_path, target_path, categorylist):
dirlist = os.listdir(new_path) # 이동시킬 경로에 생성된 분류 디렉토리 리스트
filelist = os.listdir(target_path) # 이동시킬 파일명 리스트
categorydic = {}
for file in filelist:
try:
temp_list = file.split('_')
assert temp_list[-2] in categorylist # 카테고리가 맞지 않으면 에러 발생
categorydic[file] = temp_list[-2] # {'파일명':'분류명'}
except:
categorydic[file] = '기타' # {'파일명':'기타'}
# print(categorydic)
for key, value in categorydic.items():
shutil.copy(target_path+'/'+key, new_path+'/'+value)
In [50]:
moveFile(new_path, target_path, categorylist)
728x90
반응형
'파이썬 기초' 카테고리의 다른 글
(파이썬) 파이썬과 MySQL 연동 (0) | 2023.03.22 |
---|---|
(파이썬) DAO, DTO, VO 와 MVC 패턴 (0) | 2023.03.21 |
(파이썬) 파일 입출력 라이브러리 (0) | 2023.03.14 |
(파이썬) 변수 타입 어노테이션 (0) | 2023.03.13 |
(파이썬) 클로저와 데코레이터 (0) | 2023.03.13 |
Comments