DOC1 hwp파일 python3로 불러오기 대부분의 텍스트 데이터는 txt 파일이나 html에서 크롤링하여 인식한다. 그렇지만 기존 문서들을 작업하기 위해서는 hwp, doc의 파일에서 텍스트를 갖고 와야 한다. 기존 python2에서는 'pyhwp'로 hwp의 파일을 읽어들일 수 있다고 한다. 하지만 현재 pyhwp은 python3에서는 구동이 안된다. 방법은 2개, pyhwp를 python3에서 사용할 수 있도록 개조하거나, 새로운 라이브러리를 찾는다. 오늘은 python3에서도 ole 파일을 읽을 수 있는 'olefile'을 활용한다. 1. 패키지 설치 cmd에서 'pip install olefile' 2. 소스 만들기http://olefile.readthedocs.io/en/latest/Howto.html 위의 olefile 문서를 참조하.. 2018. 7. 26. 이전 1 다음 반응형