오픈소스 Tesseract 를 사용해서 쉽고 간편하게 text추출 하는 애플리케이션을 구현했다. 해당 라이브러리를 활용한 코딩은 구글링하면 많이 나온다. 그래도 내가 한 것을 기록하자면. gradle, java17, springBoot3.2.4 환경으로 개발했다. 1. 아래와 같이 tesseract 라이브러리를 추가. dependencies { implementation 'net.sourceforge.tess4j:tess4j:5.3.0' } 2. 서비스단에 소스. tesseract.setHocr(true);//결과를 String이 아닌 html 형태로도 받을 수 있다. tesseract.doOCR(imageFile, new Rectangle(1200, 200)); // jav..