본문 바로가기
728x90
반응형

전체 글116

드디어... elasticsearch랑 tesseract가 잘 작동한다! tesseract(PDF OCR) + elasticsearch(고급 검색 기능 지원) ## 결과물(일부){took: 15,timed_out: false,_shards: {total: 1,successful: 1,skipped: 0,failed: 0},hits: {total: {value: 2,relation: "eq"},max_score: 1,hits: [{_index: "library",_id: "UhSbCJEB_1TVpDRMDzOb",_score: 1,_source: {title: "pdf24_images_merged.pdf",content: ""}},{_index: "library",_id: "UxSOCZEB_1TVpDRM6zM7",_score: 1,_ignored: ["content.keyword.. 2024. 8. 1.
Elasticsearch가 왜 웹페이지에서 작동하지 않나... 이해해주셔서 감사합니다. 이전에 제시한 해결 방법이 도움이 되지 않았고, 상황이 명확하지 않았던 점 사과드립니다. Elasticsearch와 Tesseract를 설치한 후 발생한 문제를 해결하기 위해 구체적인 조치를 제안하겠습니다. ### 문제 해결 단계 1. **Elasticsearch 로그 파일 다운로드**:    - 제공된 링크에서 Elasticsearch 로그 파일을 다운로드할 수 있습니다. 하지만 "Access Denied" 오류가 발생하여 접근할 수 없는 상황이므로, 로그 파일을 직접 확인할 수 없습니다. 2. **Elasticsearch 상태 확인**:    - Elasticsearch가 정상적으로 실행되고 있는지 확인하기 위해 웹 브라우저에서 다음 URL을 입력하여 상태를 확인합니다:   .. 2024. 8. 1.
Elasticsearch와 Flask 애플리케이션을 시스템 서비스로 설정 매번 나만의 도서관을 사용 할 때마다 elasticsearch도 켜야 하고 app.py도 켜야 하는 건가? 뭔가 번거롭고 잊어버리기 쉬운데? 내가 최종적으로 원하는 건 아이콘을 누르면 따로 서버를 수동으로 켤 필요 없이 서비스를 이용하는 거야. 매번 "나만의 도서관" 애플리케이션을 사용할 때마다 Elasticsearch와 Flask 애플리케이션(app.py)을 수동으로 실행하는 것은 번거로울 수 있습니다. 이를 자동화하거나 더 쉽게 관리하는 방법이 있습니다. 각 방법의 장단점을 비교한 표를 제시하고, 귀하의 요구사항에 가장 적합한 방법을 추천해 드리겠습니다.서비스로 설정- 시스템 부팅 시 자동 시작- 백그라운드에서 실행- 시스템 관리 도구로 쉽게 관리 가능- 초기 설정이 복잡할 수 있음- 시스템 리소스를.. 2024. 7. 31.
Tesseract OCR 라이브러리 설치 스캔된 이미지 PDF에서 텍스트를 추출하려면 OCR(Optical Character Recognition) 기술을 사용해야 합니다. PyMuPDF는 기본적으로 PDF에서 텍스트를 추출하지만, 이미지에서 텍스트를 인식하는 기능은 없습니다 tesseract설치와 python tesseract라이브러리 설치는 둘 다 해야 1. Tesseract OCR 설치:    - 이는 실제 OCR 엔진입니다.     - 운영 체제에 직접 설치하는 소프트웨어입니다. 2. Python Tesseract 라이브러리 (pytesseract) 설치:    - 이는 Python에서 Tesseract OCR을 사용할 수 있게 해주는 Python 라이브러리입니다.    - pip를 통해 설치합니다. 이 두 가지는 서로 다른 목적을 가지.. 2024. 7. 31.
Elasticsearch 서버 연결 아래는 기본적인 설정이 포함된 완전한 `elasticsearch.yml` 파일입니다. ```yaml # ======================== Elasticsearch Configuration ========================= # # NOTE: Elasticsearch comes with reasonable defaults for most settings. #       Before you set out to tweak and tune the configuration, make sure you #       understand what are you trying to accomplish and the consequences. # # The primary way of configuring.. 2024. 7. 31.
Elasticsearch에서 Exit 코드 1이 발생하는 일반적인 이유 1. 메모리 부족: JVM(Java Virtual Machine)에 할당된 메모리가 부족한 경우 발생할 수 있습니다[1]. 1. 메모리 설정 조정:   - JVM 힙 크기를 조정합니다. `config/jvm.options` 파일에서 `-Xms` 및 `-Xmx` 값을 시스템 리소스에 맞게 조정하세요# 메모리 설정 조정`config/jvm.options` 파일에서 `-Xms` 및 `-Xmx` 값을 시스템 리소스에 맞게 조정합니다. 일반적으로 이 두 값은 동일하게 설정하며, 시스템 메모리의 50% 정도를 할당하는 것이 좋습니다.2. 권한 문제: Elasticsearch가 필요한 파일이나 디렉토리에 접근할 수 있는 권한이 없는 경우 발생할 수 있습니다[1]. 2. 권한 문제 해결:   - Elasticsearc.. 2024. 7. 31.
`E: Unable to locate package elasticsearch` 오류 s****k@DESKTOP-1QGBFC1:~$ sudo apt-get install elasticsearch Reading package lists... Done Building dependency tree... Done Reading state information... Done E: Unable to locate package elasticsearch s****k@DESKTOP-1QGBFC1:~$ `E: Unable to locate package elasticsearch` 오류는 Elasticsearch 패키지를 찾을 수 없다는 의미입니다. 이 문제는 보통 Elasticsearch의 공식 패키지 저장소를 추가하지 않았기 때문에 발생합니다. 다음 단계에 따라 Elasticsearch를 설치해보세요: .. 2024. 7. 31.
UNIX user account: password? 이 문제는 사실 문제가 아닙니다. UNIX 시스템에서는 보안상의 이유로 비밀번호를 입력할 때 화면에 아무런 표시가 나타나지 않습니다. 이는 입력한 비밀번호가 화면에 노출되지 않도록 하기 위함입니다. 따라서 비밀번호를 입력할 때 커서가 움직이지 않거나 별표(*)가 표시되지 않는 것이 정상입니다. 다음 단계를 따라 비밀번호를 설정해 보세요: 1. **비밀번호 입력**:    - 비밀번호를 입력합니다. 화면에 아무런 표시가 나타나지 않더라도 계속 입력하세요. 2. **Enter 키 누르기**:    - 비밀번호 입력이 완료되면 Enter 키를 누릅니다. 3. **비밀번호 확인**:    - 비밀번호 확인을 위해 동일한 비밀번호를 다시 입력하라는 메시지가 나타납니다. 동일한 방식으로 비밀번호를 입력하고 Ente.. 2024. 7. 31.
728x90
반응형