본문 바로가기
Python

[AWS, Colab]코드 써서 zip 파일 풀기

by 전봇대파괴자 2020. 7. 13.

Python 게시판인데 왜 이걸 여기에 쓰냐고 하면 저걸 빼면 다 python 써야 하니까......그리고 저 코드 한 줄 갖고는 암것도 못하니까라고 하겠습니다. 

 

기본적으로 큰 데이터들은 zip되어 있는 경우가 많습니다. 이미지는 당연하고 10만 20만을 넘어가는 겁나 큰 엑셀 데이터들도 그렇습니다. 그 데이터를 확인하고 이리저리 잘라서 분석해내려면 일단 압축을 풀어야 됩니다. 근데 마우스 우클릭하고 압축풀기 버튼 누르기가 너무 귀찮습니다. 라기보단 번거롭고 시간 아깝습니다.

 

압축 풀고 나면 자동으로 뜨는 폴더 창 닫아줘야 하고, 또 주피터 노트북 같은 거 창 끌어와서 다시 코드 창 클릭해야 하잖아요. 그것도 짜증나는데 용량이 큰 zip은 압축 풀리는 시간도 겁나 오래걸립니다. 고화질 이미지 데이터셋을 담은 압축 파일의 경우 더 이상 자세한 설명은 생략합니다. 

 

아 좀 더 간단한 방법 없나? 이것저것 클릭할 필요 없이 바로 주피터 노트북에서 코드 쳐서 압축푸는 방법 없나?

있습니다. 

 

# 코드로 zip 압축 풀기
!unzip -uq "zip 파일 경로(확장자 포함)" -d "압축 푼 파일 저장할 경로"

요 한 줄이면 끝입니다. 엑셀 데이터일 경우 바로 pandas 라이브러리를 써서 데이터 불러오면 됩니다. 무용한 클릭은 이제 그만! 

 

해당 코드는 AWS나 Colab에서도 유용하게 쓸 수 있으니 참고해주시면 좋습니다.

 

특히 Colab에서 저 코드는 제 구세주였습니다. AWS는 한번 업로드해 놓으면 없어지지라도 않지 Colab은.....지멋대로 세션 종료될 때마다 데이터는 웹이라는 현세를 벗어나 사바세계로 사라집니다.

 

조금이나마 도움이 되었기를 바랍니다!