ブログ

スキャンしたPDFをWordに変換する方法(そして、スキャンが他と違う理由)

要点正直にお答えします:/convert/pdf-to-word では、スキャンしたPDFを編集可能なWordファイルに変換することはできません。なぜなら、スキャンとはページを撮影した画像であり、その中に選択可能なテキストが存在しないからです。当社の無料・ブラウザ内で動作するPDF→Word変換ツールは、PDFの中に存在する実際のテキストを.docxに再構築します。しかし、スキャンには読み取るべき実際のテキストがなく、あるのはピクセルだけです。それらのピクセルを再び文字に戻すにはOCR(光学文字認識)が必要ですが、このツールはまだそれに対応していません。良いお知らせもあります:Word、Googleドキュメント、あるいはほとんどのアプリからエクスポートされたPDFには実際のテキストがたっぷり含まれており、うまく変換できます。このガイドでは、お持ちのPDFがどちらのタイプかを見分ける方法と、それぞれの場合に何を期待できるかをご説明します。すべてはお使いのデバイス上で動作し、ファイルがアップロードされることは一切ありません。

ツールを試す

手短な答え:スキャンしたPDFはOCRなしには編集可能なWordにならない

通常のPDFはテキストを実際の文字として保存しています。文字、単語、フォント、位置情報がファイルの中に保存されているのです。/convert/pdf-to-word の変換ツールはそれらの文字を読み取り、編集可能なWord文書に再構築します。PDFリーダーで文章をハイライトしてコピーできるなら、そのテキストは本物であり、変換できます。

スキャンしたPDFは別物です。紙のページをスキャンしたり、書類を写真に撮ったりすると、結果は画像になります。あなたの目にはテキストのように見えても、実際の文字をひとつも含まないピクセルの格子なのです。読み取るべきものも、再構築すべきものも何もないため、変換結果は空になります。

スキャンから編集可能なテキストを取り出すには、まずOCRが必要です。OCRは画像を解析し、一文字ずつ推測します。これは当社がまだ対応していない別の工程であるため、現時点ではスキャンしたPDFをここで編集可能なWordに変換することはできません。空の文書をお渡しするよりも、最初に正直にお伝えしたいのです。

お持ちのPDFがスキャンかどうかを5秒で見分ける方法

変換する前に、この簡単なテストを1つやってみてください。任意のリーダー(またはブラウザ)でPDFを開き、コピーするつもりでマウスを使ってテキストを1行選択してみましょう。

  • テキストが単語ごとにハイライトされ、コピーできるなら、それは実際のテキストを持つPDFです。Wordに変換できます。
  • カーソルがページ全体に青い枠を描くだけで、テキストとしてハイライトされるものが何もないなら、それはスキャン(画像)であり、OCRが必要です。
  • もう1つの見分け方:拡大して近づけてみましょう。実際のテキストはどんな倍率でもくっきりしたままですが、スキャンは写真のようにぼやけたり、ピクセルが粗くなったりします。
  • 出所のかんたんチェック:Word、Googleドキュメント、Pages、または「PDFに印刷」コマンドから出力されたPDFは、ほぼ必ず実際のテキストです。スキャナー、コピー機、スマホのスキャンアプリから出たPDFは、ほぼ必ず画像です。

変換結果が空になることについて、当社が正直である理由

スキャンしたPDFを /convert/pdf-to-word に与えると、ツールは選択可能なテキストを探しますが見つからず、空の.docxを渡す代わりに、はっきりとしたメッセージを表示して停止します。そのメッセージは、ファイルがスキャンのように見えること、そしてOCRがまだサポートされていないことをお伝えします。

これは意図的にそうしています。多くのツールは、スキャンを平気で「変換」して、空白のページや、編集できないページ全体の画像が1枚だけ入ったWordファイルを返してきます。それはあなたの時間を無駄にします。当社は「これではうまくいきません、その理由はこちらです」とお伝えし、あなたが正しい次のステップを見つけられるようにしたいのです。

うまく変換できるもの、できないもの

PDFに実際のテキストがある場合、ツールは各行を読み取り、フォントサイズを保ち、埋め込まれたフォントから太字と斜体を検出し、段落をきれいで編集可能な.docxに再構築します。これはWord、Googleドキュメント、Pagesで開くことができます。

  • うまく変換できるもの:手紙、履歴書、報告書、契約書、エッセイなど、ワープロからエクスポートされたテキストベースの文書。
  • まずまず変換できるもの:見出しと段落のあるシンプルな1段組レイアウト。
  • 完璧ではない場合があるもの:複雑な多段組レイアウト、込み入った表、精密な間隔。単語は通りますが、レイアウトが元のとおりに正確には揃わない場合があります。
  • サポート対象外:スキャン/画像のみのPDF(OCRが必要)、および画像や入り組んだ表の確実な再現。

レイアウトについて正直に期待値を設定する

実際のテキストを持つPDFであっても、これはテキストに忠実な変換であり、ピクセル単位で完全に再現するクローンではありません。目的は、適切な段落構造とフォントサイズとともに編集可能な単語をお返しすることであり、すべての段組、表の罫線、図版を正確に再現することではありません。

ふつうの手紙や報告書なら、結果は通常、元のとてもよく似た見た目になります。3段組、サイドバー、データ表のある雑誌風のページの場合は、テキストは正しく通りますが、レイアウトはWordでの手直しが必要になると考えてください。送信する前に、必ず.docxを開いてざっと目を通してください。

今、スキャンしたPDFをお持ちの場合にすべきこと

ここでOCRが利用できるようになるまで、スキャンに対しては正直な選択肢がいくつかあります:

  • 元のファイルを探す。文書がデジタルソースから来たものなら、元のWord、Googleドキュメント、またはテキストベースのPDFを入手しましょう。それならOCRなしできれいに変換できます。
  • スキャンする代わりに再エクスポートする。元のアプリを操作できるなら、印刷物をスキャンするのではなく「PDFとしてエクスポート」または「PDFに印刷」を使いましょう。そうすればテキストが本物のまま保たれます。
  • 短い文書は打ち直す。1ページのフォームや手紙なら、いずれにせよOCRの誤りを直すよりも、自分で打ち直したほうが速いことが多いです。
  • 今のところは専用のOCRツールを使い、その結果できた実際のテキストを持つPDFをここに戻して、Wordに変換しましょう。

プライベートで無料、アップロードは一切なし

PDFが変換できてもできなくても、ファイルがあなたのコンピューターから出ることはありません。変換はローカルのコードを使って完全にブラウザ内で動作するため、ファイルはあなた自身のデバイス上で読み取られ、処理され、保存されます。サーバーにアップロードされることは決してありません。これは契約書、明細書、そして他人のマシンに置いておきたくないあらゆるものにとって重要です。

登録は不要、出力にウォーターマークもなく、1日の利用回数の制限もありません。/convert/pdf-to-word を開き、テキストベースのPDFをドロップして、編集可能な.docxをダウンロードしてください。

スキャンしたPDFをWordに変換する方法(そして、スキャンが他と違う理由)

エディターを開く

よくある質問

スキャンしたPDFをここで編集可能なWord文書に変換できますか?

まだできません。スキャンしたPDFはページの画像であり、選択可能なテキストがないため、Wordに再構築すべきものが何もありません。変換するにはOCR(光学文字認識)が必要ですが、このツールはまだ対応していません。実際の選択可能なテキストを含むPDFは、/convert/pdf-to-word で問題なく変換できます。

自分のPDFがスキャンか実際のテキストか、どうやって見分けますか?

任意のリーダーで開き、マウスでテキストを1行選択してみてください。個々の単語がハイライトされてコピーできるなら、それは実際のテキストであり、変換できます。ページの上に枠を描くことしかできず、テキストとしてハイライトされるものが何もない場合、または拡大するとぼやけて見える場合は、スキャンした画像であり、OCRが必要です。

変換したWordファイルが空になってしまいました。何が起きたのですか?

そのPDFはほぼ間違いなくスキャン(ページの画像)であり、読み取るべきテキストがありません。当社のツールはこれを検出し、空白の文書を渡す代わりにメッセージを表示して停止します。Word、Googleドキュメント、または類似のアプリからエクスポートされたPDFをお使いください。それらには変換可能な実際のテキストが含まれています。

Wordファイルは元のPDFとまったく同じ見た目になりますか?

手紙や報告書のようなふつうのテキストベースの文書なら、通常はとてもよく似た見た目になります。テキスト、フォントサイズ、太字/斜体は保たれ、段落が再構築されます。複雑な多段組レイアウトや込み入った表の場合は、単語は通りますが正確なレイアウトはずれることがあるので、送信する前にWordで.docxを確認して整えてください。

PDFからWordへの変換は無料でプライベートですか?

はい。100%ブラウザ内で動作するため、ファイルがサーバーにアップロードされることは一切なく、ずっとあなたのデバイス上にとどまります。登録不要、ウォーターマークなし、1日の利用回数の制限もありません。

記事をもっと見る