본문 바로가기
728x90
반응형

1인 프로젝트/나만의 도서관16

Tesseract OCR 라이브러리 설치 스캔된 이미지 PDF에서 텍스트를 추출하려면 OCR(Optical Character Recognition) 기술을 사용해야 합니다. PyMuPDF는 기본적으로 PDF에서 텍스트를 추출하지만, 이미지에서 텍스트를 인식하는 기능은 없습니다 tesseract설치와 python tesseract라이브러리 설치는 둘 다 해야 1. Tesseract OCR 설치:    - 이는 실제 OCR 엔진입니다.     - 운영 체제에 직접 설치하는 소프트웨어입니다. 2. Python Tesseract 라이브러리 (pytesseract) 설치:    - 이는 Python에서 Tesseract OCR을 사용할 수 있게 해주는 Python 라이브러리입니다.    - pip를 통해 설치합니다. 이 두 가지는 서로 다른 목적을 가지.. 2024. 7. 31.
Elasticsearch 서버 연결 아래는 기본적인 설정이 포함된 완전한 `elasticsearch.yml` 파일입니다. ```yaml # ======================== Elasticsearch Configuration ========================= # # NOTE: Elasticsearch comes with reasonable defaults for most settings. #       Before you set out to tweak and tune the configuration, make sure you #       understand what are you trying to accomplish and the consequences. # # The primary way of configuring.. 2024. 7. 31.
Elasticsearch에서 Exit 코드 1이 발생하는 일반적인 이유 1. 메모리 부족: JVM(Java Virtual Machine)에 할당된 메모리가 부족한 경우 발생할 수 있습니다[1]. 1. 메모리 설정 조정:   - JVM 힙 크기를 조정합니다. `config/jvm.options` 파일에서 `-Xms` 및 `-Xmx` 값을 시스템 리소스에 맞게 조정하세요# 메모리 설정 조정`config/jvm.options` 파일에서 `-Xms` 및 `-Xmx` 값을 시스템 리소스에 맞게 조정합니다. 일반적으로 이 두 값은 동일하게 설정하며, 시스템 메모리의 50% 정도를 할당하는 것이 좋습니다.2. 권한 문제: Elasticsearch가 필요한 파일이나 디렉토리에 접근할 수 있는 권한이 없는 경우 발생할 수 있습니다[1]. 2. 권한 문제 해결:   - Elasticsearc.. 2024. 7. 31.
`E: Unable to locate package elasticsearch` 오류 s****k@DESKTOP-1QGBFC1:~$ sudo apt-get install elasticsearch Reading package lists... Done Building dependency tree... Done Reading state information... Done E: Unable to locate package elasticsearch s****k@DESKTOP-1QGBFC1:~$ `E: Unable to locate package elasticsearch` 오류는 Elasticsearch 패키지를 찾을 수 없다는 의미입니다. 이 문제는 보통 Elasticsearch의 공식 패키지 저장소를 추가하지 않았기 때문에 발생합니다. 다음 단계에 따라 Elasticsearch를 설치해보세요: .. 2024. 7. 31.
728x90
반응형