Python 게시판인데 왜 이걸 여기에 쓰냐고 하면 저걸 빼면 다 python 써야 하니까......그리고 저 코드 한 줄 갖고는 암것도 못하니까라고 하겠습니다.
기본적으로 큰 데이터들은 zip되어 있는 경우가 많습니다. 이미지는 당연하고 10만 20만을 넘어가는 겁나 큰 엑셀 데이터들도 그렇습니다. 그 데이터를 확인하고 이리저리 잘라서 분석해내려면 일단 압축을 풀어야 됩니다. 근데 마우스 우클릭하고 압축풀기 버튼 누르기가 너무 귀찮습니다. 라기보단 번거롭고 시간 아깝습니다.
압축 풀고 나면 자동으로 뜨는 폴더 창 닫아줘야 하고, 또 주피터 노트북 같은 거 창 끌어와서 다시 코드 창 클릭해야 하잖아요. 그것도 짜증나는데 용량이 큰 zip은 압축 풀리는 시간도 겁나 오래걸립니다. 고화질 이미지 데이터셋을 담은 압축 파일의 경우 더 이상 자세한 설명은 생략합니다.
아 좀 더 간단한 방법 없나? 이것저것 클릭할 필요 없이 바로 주피터 노트북에서 코드 쳐서 압축푸는 방법 없나?
있습니다.
# 코드로 zip 압축 풀기
!unzip -uq "zip 파일 경로(확장자 포함)" -d "압축 푼 파일 저장할 경로"
요 한 줄이면 끝입니다. 엑셀 데이터일 경우 바로 pandas 라이브러리를 써서 데이터 불러오면 됩니다. 무용한 클릭은 이제 그만!
해당 코드는 AWS나 Colab에서도 유용하게 쓸 수 있으니 참고해주시면 좋습니다.
특히 Colab에서 저 코드는 제 구세주였습니다. AWS는 한번 업로드해 놓으면 없어지지라도 않지 Colab은.....지멋대로 세션 종료될 때마다 데이터는 웹이라는 현세를 벗어나 사바세계로 사라집니다.
조금이나마 도움이 되었기를 바랍니다!
'Python' 카테고리의 다른 글
[python]Windows 10에 pygraphviz 설치하기(conda) (0) | 2021.04.25 |
---|---|
[Python]virtualenv의 파이썬 버전 변경하기 (0) | 2021.03.27 |
[Python] kernel에 설치된 라이브러리 조회 및 버전 확인하기 (0) | 2020.10.08 |
[Python, django]WebDriverException 오류 해결법 (2) | 2020.09.18 |
[Python]웹 크롤링 중 chrome driver 작동이 중지될 때 해결법 (0) | 2020.09.08 |