ndlocr-lite-ocr-correct
日本語の画像・PDF(古書、和文資料、名刺、請求書、見積書、納品書、領収書、 契約書、帳票など)を国立国会図書館製 OCR エンジン NDLOCR-Lite で抽出し、 AWS Bedrock LLM で誤認識補正と帳票種別ごとの JSON 構造化を行うワークフロー。 図書館・アーカイブ・バックオフィスでの実務 OCR を対象とする。
파일 업로드
和文の画像やPDFをアップロード
제작자: songlin she · GitHub