ndlocr-lite-ocr-correct
日本語の画像・PDF(古書、和文資料、名刺、請求書、見積書、納品書、領収書、 契約書、帳票など)を国立国会図書館製 OCR エンジン NDLOCR-Lite で抽出し、 AWS Bedrock LLM で誤認識補正と帳票種別ごとの JSON 構造化を行うワークフロー。 図書館・アーカイブ・バックオフィスでの実務 OCR を対象とする。
Subir archivos
和文の画像やPDFをアップロード
Creado por: songlin she · GitHub