[Python] 리스트 안의 이스케이프 문자 일괄 소거하기
웹 크롤링으로 텍스트를 긁어오거나, 로컬 경로 내 파일을 불러올 때, 문자열 안에 이스케이프 문자(\n)가 들어있을 때가 있습니다. 그냥 문자열이라면 replace를 쓸 수 있지만, 리스트 안에 들어있는 값마다 이런 이스케이프 문자들이 들어있다면 골치가 아파지죠. 리스트 안의 문자열이 많을수록 더욱. # 샘플 리스트 sample_list = ['\n일상의새벽\n', '\n회자정리(會者定離)\n', '\nIf The World Was Ending\n', '\n무제 (11)\n', '\nBlood//Water\n', '\n인因(5)\n', '\n2020-03 백업 05\n', '\nOur Shining Days\n', '\n난파선\n', '\n놀이터\n'] 위의 리스트는 실제로 제가 크롤링한 데이터 중 일부..
2021. 8. 20.
[Python]리스트 값들 카운트하고 가장 빈도수 높은 값 찾기
이번에는 리스트를 구성하는 값(item)을 카운트하고, 그 중에서 가장 중복이 많은 값을 찾는 방법을 알아보겠습니다. 아래의 샘플 리스트를 볼까요? # 1. 샘플 리스트 만들기 sample_li = ['사과', '배', '수박', '딸기', '배', '배', '사과'] 여러 개의 중복값들을 확인할 수 있습니다. 이 값들을 보기 좋게 item별로 카운트해 보고 싶을 때 collections 라이브러리의 Counter를 사용합니다. # 라이브러리 불러오기 from collections import Counter # 2. item별 카운트하기 count_items = Counter(sample_li) print(count_items) >> Counter({'배': 3, '사과': 2, '수박': 1, '딸기'..
2021. 8. 19.