🔍 OCR PDF

OCR PDF オンライン — 無料、スキャンしたPDFを検索可能に、登録不要

光学式文字認識 (OCR) を使用して、スキャンされたPDFに検索可能なテキストレイヤーを追加します。任意の画像ベース文書からテキストを選択してコピーします。無料、Tesseractを採用。

TesseractOCRエンジン
100%無料
いいえ登録が必要

› OCR PDF

📄
🔍
ファイルをここにドロップ
または デバイスから選択
PDF
アップロード中...

✅ ファイルのダウンロード準備ができました!


🔒 ファイルは 2 時間後に自動削除されます
🔑 256 ビット SSL 暗号化
🚀 ソフトウェアのインストール不要
アカウント不要

PDFでOCRを実行する方法 —

スキャンした PDF は単なる画像であり、テキストを検索、選択、コピーすることはできません。 PdfDocShift は、最も広く使用されているオープンソース OCR エンジンである Tesseract OCR を使用して各ページを分析し、非表示で検索可能なテキスト レイヤーを追加します。その結果、オリジナルとまったく同じように見える、完全に検索可能な PDF が作成されます。

🔍
Tesseract OCR エンジン Tesseract を利用しています。Google が管理し、世界中で信頼されているオープンソース OCR エンジンです。
🌍
多言語対応 英語、ドイツ語、フランス語、スペイン語をサポートしており、印刷テキストの精度が高くなります。
📄
非表示のテキストレイヤー テキストは透明なレイヤーとして追加されます。PDF の外観は変わりません。
🔒
安全な処理 ページは隔離されたコンテナーで処理され、2 時間後に削除されます。
🔍
検索可能なアーカイブ
スキャンした文書アーカイブを文書管理システムで検索できるようにします。
📋
テキストをコピー&ペースト
再入力することなく、スキャンしたレポートから引用、データ、または文章を抽出します。
アクセシビリティ
OCR 処理された PDF はスクリーン リーダーと連携してアクセスできるようになります。
🆓
100%無料
サインアップや Acrobat ライセンスは不要で、複数ページのドキュメントをサポートします。

その他のPDFツール、

必要なすべてのPDF操作 — ワンクリックで。

🗜️
PDF を圧縮
品質を損なうことなくPDFファイルサイズを縮小。低、中、高の圧縮を選択できます。
✂️
PDF を分割
PDFを個別のページに分割するか、カスタムページ範囲を抽出します。
🔗
PDF を結合
複数のPDFファイルを1つの文書にまとめます。
📝
Word を PDF に変換
Wordドキュメント (.docx, .doc) をPDFに変換します。
📄
PDF を Word に変換
PDFを編集可能なWord文書 (.docx) に変換します。
📊
PowerPoint を PDF に変換
PowerPointプレゼンテーション (.pptx, .ppt) をPDFに変換します。
🖼️
PDF を PowerPoint に変換
PDFページを編集可能なPowerPointスライドに変換します。
📈
Excel を PDF に変換
Excelスプレッドシート (.xlsx, .xls) をPDFに変換します。
📋
PDF を Excel に変換
PDFからExcelに表とデータを抽出します。
🖼️
画像を PDF に変換
JPG、PNG、WEBP、HEIC、またはGIF画像をPDFに変換します。
📷
PDF を画像に変換
PDFページを高解像度JPGまたはPNG画像としてエクスポートします。
🔐
PDF を保護
強力な暗号化でPDFにパスワード保護を追加します。
💧
PDF に透かしを追加
すべてのページにカスタムテキストの透かしを追加します。
🔍
OCR PDF
光学式文字認識を使用してスキャンしたPDFを検索可能にします。
🔄
PDF ページを回転
ページを90°、180°、または270°回転させます。横向きのスキャンを修正します。
🔓
PDF のロックを解除
所有しているPDFからパスワード保護を解除します。
✍️
PDF に署名
任意のPDF文書に署名を追加します。入力、描画、またはアップロードできます。
🔢
PDF にページ番号を追加
カスタム形式と位置でPDFにページ番号を追加します。
✂️
PDF をトリミング
余白を削除し、ミリメートル精度でPDFページをトリミングします。
🌐
PDF を翻訳
PDFの内容を別の言語に自動的に翻訳します。
🌐
HTML を PDF に変換
URL を貼り付けてページを PDF に変換します。
🩹
PDF を修復
3 段階の修復パイプラインで破損または不正な PDF を復元します。
PDF を編集(墨消し)
PDF から機密テキストを完全に削除します。語句を入力し、墨消し済みファイルをダウンロード。
🗂️
PDF を整理
色分けされたサムネイルでページを視覚的に並べ替え、削除、再配置します。
⚖️
PDF を比較
並べて表示する PDF 比較とダウンロード可能な変更レポート。
✏️
PDF を編集
PDFページに直接テキスト、画像、図形、描画を追加します。
🧹
空白ページを削除
PDFから空白またはほぼ空白のページを自動的に検出して削除します。
📝
PDFフォーム入力ツール
テキストフィールド、チェックボックス、ドロップダウン、ラジオボタンを入力。
🧊
PDFフラット化
フォームと注釈を静的で編集不可のページにロックします。
🏛️
PDF/A 変換ツール
PDF を保存用標準 PDF/A-1b、2b、3b に変換します。
🔢
ベイツ番号付け
各ページに法的なベイツラベルを押印します。

3 ステップ、

サインアップ不要。ファイルは転送中に暗号化され、2時間後に自動削除されます。

ステップ 01
ファイルをアップロード
ドラッグ&ドロップまたは選択。ファイルは暗号化されたクラウドストレージに直接送られます。
ステップ 02
ツールを選択
操作を選択 — 圧縮、変換、分割、結合、保護など。
ステップ 03
変換してダウンロード
処理には5〜30秒かかります。ファイルをすぐにダウンロード — アカウント不要。
ステップ 04
自動削除
ファイルは2時間後にサーバーから完全に削除されます。プライバシーは保証されています。

OCRとは何か、なぜ必要なのか?

OCRは光学式文字認識の略です。物理的な文書をスキャンすると、結果は基本的に写真のPDFです — テキストは画像であり、実際の選択可能な文字ではありません。検索したり、テキストをコピーしたり、スクリーンリーダーで使用したりすることはできません。OCRは画像をピクセル単位で分析し、文字、単語、段落を識別してから、表示される画像の背後にテキストレイヤーを埋め込みます。結果は元のスキャンと同じに見えますが、完全に検索可能でコピーペースト可能、アクセシブルです。これは、スキャンされた契約書、アーカイブされた記録、スキャンされた書籍、歴史的文書、プログラムで作業する必要があるデジタル化された書類に不可欠です。

OCRの精度に影響を与えるものは何ですか?

3つの要因がOCR精度を支配します。第一に、scan resolution:300 DPIは優れた結果を生み出します。150 DPIは通常かろうじて許容範囲です。それ以下では文字が失われます。第二に、contrast:黒白のコントラストが最もよく機能します。黄ばんだページやかすんだページは精度を下げます。第三に、font clarity:Times Romanのような標準的なセリフフォントはほぼ完璧に認識されます。手書きや筆記体のフォントは人間にも読めない場合があります。

OCR後 — 検索と編集

OCRが完了すると、出力PDFは任意のPDFビューアで完全に検索可能になります — Ctrl+F(MacではCmd+F)を使用して任意の単語またはフレーズを検索します。認識されたテキストは選択してコピーすることもできます。完全に編集可能な形式でテキストが必要な場合は、その直後にPDF to Wordツールを使用してOCR済みPDFをWordに変換してください。OCRは100%完璧ではないことに留意してください — 固有名詞、専門用語、特殊な書式は、文書がプロフェッショナルな文脈で使用される前に手動の修正が必要になる場合があります。

OCR PDF

OCR PDFをオンラインで無料で使用するために知っておくべきすべて。

OCR (光学文字認識) は画像からテキストを読み取り、検索可能なテキスト レイヤーを PDF に追加します。スキャンされた PDF は単なる画像です。OCR 後、テキストを検索、コピー、編集できます。

PdfDocShift の OCR ツールは、英語、ドイツ語、フランス語、スペイン語をサポートしています。 OCR エンジン (Tesseract) は言語に関係なくテキストを自動的に検出しますが、精度はサポートされている言語で最高です。

OCR 時間は、ページ数とスキャン品質によって異なります。一般的な 10 ページのドキュメントのスキャンは 15 ~ 30 秒で完了します。非常に大きなドキュメント (100 ページ以上) の場合は、最大 2 分かかる場合があります。

いいえ、OCR は既存のページ画像の下に非表示のテキスト レイヤーを追加します。各ページの外観はまったく同じままで、検索機能とテキストの選択のみが追加されます。