1. 책 자르기
일단 책 내용을 이미지화하려면 여러 방법이 있지만..
양면 + ADF 스캔을 쓰려면 각 페이지를 낱장으로 만들어야 됩니다.
열 제본기 (책 뜯는 용도의 경우 판이 넓고, 저렴한 종류로 사면 됩니다) 또는 다리미를 사용해서 책의 접착제가 발라진 부분을 녹입니다.
일반적으로 책은 글루건 (핫멜트풀)으로 접합되어 있어서 일정 온도에서 녹습니다. 1분에서 1분 30초 가량 열을 가해서 표지와 페이지를 뜯어냅니다.
(제단기를 사용해서 잘라내도 되는데, 추가 비용도 아깝고 제단기가 위험하다고 생각되서 손으로 –_- 뜯었습니다)
일단 표지를 뜯고나서는 각 페이지를 10~20장씩 뜯고, 하나씩 분리해서 낱장으로.. 수작업을 합니다.
2. 스캔하기
표지는 24비트 컬러 + 600DPI 로 스캔합니다. (iBook 등의 서재에 나오는 페이지가 될 것 이므로)
일반 페이지는 그레이스케일 (4비트) + 600DPI 로 스캔합니다.
(인식률은 모노가 좋지만 책에 예제 그림 등을 살리기 위해 그레이스케일을 사용했습니다.)
손실율을 줄여보려고 TIFF 포맷으로 각 이미지를 저장했는데 용량이 꽤 큽니다.
JPG 고화질도 괜찮은 선택이 될 듯 합니다.
3. 가독성 보정
포토샵의 액션을 사용하여 보정합니다.


New Set 으로 새로운 액션 그룹을 하나 만들고

New Action 에 액션을 추가합니다.
보정할 이미지 하나를 열고 (글씨가 있는 이미지로 해서 가독성을 확인하는게 좋음)

Level 을 조정합니다

Auto 를 눌러보고 적정한 값을 찾아봅니다.
레인지를 너무 좁게하면 이미지가 날아가고 너무 넓게하면 조절하는 의미가 없습니다;

다음은 밝기를 추가합니다.

책에 따라 10~20정도 밝기를 추가하면 망점 등이 줄어듭니다.

샤픈 한방

대충 저렇게 액션이 만들어집니다.


Source 와 Destination 을 적절히 지정해주고 스캔 이미지 파일들을 돌려주면 됩니다.
가독성 향상 참고 http://cafe.naver.com/booksfree/4254
4. 개별 페이지 OCR 작업


보정한 스캔 이미지 파일들을 추가

pdf 로 출력된 폴더를 따로 지정하면 편합니다~
Specific Folder 로 출력 폴더 지정

클리어 스캔으로 처리합니다.
그럼 각 이미지 파일 이름.pdf 파일로 OCR 된 pdf 가 생성됩니다.
5. 하나의 PDF 파일로 합치기

이미지 파일을 하나의 PDF로 만들고, OCR 작업을 해도 되는데, 각 페이지 별로 OCR하고 파일을 합치는 이유는 OCR – 클리어스캔시 로딩이 느려지는 현상을 줄이기 위해서입니다.
참고 http://cafe.naver.com/booksfree/4077
작업 시간이랑 결과물을 어느 정도 타협선으로 만들 수 있는 방법을 더 모색해봐야겠습니다 –_ –);