본문 바로가기

programmer/컴퓨터 정보

pdf 텍스트 추출 방법 1분 해결

pdf 텍스트 추출 방법 1분 해결


안녕하세요. 이번 글에서는 pdf 텍스트 추출 방법에 대해 알아보겠습니다. 


pdf를 이용하다보면 읽는데는 좋지만 문서 편집하거나 내용을 복사해서 활용하는데는 조금 어렵고 불편한 점이 있습니다. 그래서 pdf 파일에 존재하는 텍스트들을 손쉽게 다룰 수 있는 텍스트로 변환할 필요가 가끔 있는데요.


.



그래서 이번 글에서 pdf 텍스트 추출 방법에 대해 알아보겠습니다. 굉장히 쉽기 때문에 금방 하실 수 있을 겁니다.



먼저 아크로뱃 리더를 이용하여 pdf 파일을 실행합니다. 그러면 위와 같이 Adobe Acrobat Reader에 의해 pdf가 열리는데요. 



왼쪽 위의 메뉴 탭들 중에 파일->다른 형식으로 저장->텍스트를 차례로 선택하시면 텍스트 파일로 저장하는 다른이름으로 저장 창이 뜨면서 pdf 파일을 텍스트로 추출하여 저장할 수 있게 됩니다.



이런 식으로 저장하시고 저장한 파일을 실행하시면 다음과 같이 나타나게 됩니다.



위와 같이 pdf 텍스트 추출이 되었습니다.


이 방법은 아크로뱃 pdf 리더만 설치되어 있다면 빠르게 할 수 있는 방법인데요. 만약 설치가 되어있지 않고 별로 설치하고 싶지 않다면, 구글 드라이브를 웹 상에서 접속하셔서 pdf 파일을 구글 드라이브에 드래그 앤 드롭합니다. 즉, 구글 드라이브에 복사하시고, 실행시킬 때 구글 문서로 실행하시면 pdf 파일에 존재하는 텍스트들이 복사되어 텍스트 파일로 열리게 됩니다. 


지금까지 pdf 텍스트 추출 방법에 대해 알아보았습니다. 도움이 되셨으면 좋겠습니다.