WordやPowerPoint、画像文字からデザインしなければいけない時は

クライアントから頂いたデータがWordやPowerPoint形式だった、あるいはテキストだと思って頂いたデータが画像文字だったということは残念ながらあるかもしれません。

この記事では、どうすればWordやPowerPoint形式のデータから画像を取り出したり、画像文字をテキストに変換できるかということについて書いています。

WordやPowerPoint形式のデータから画像を取り出す

例えば作業しているPCにWordやPowerPointが入っていないという場合はどうやって画像を取り出せば良いのでしょうか?

拡張子を.docxから.zipに変換

実は、それらのファイルの拡張子を .zip に変換してからダブルクリックするだけで画像を取り出すことができます。

※画像は一般的にZIPを展開してできたフォルダー内の[word>media]フォルダー内にあるはずです。

なぜこのようなことができるかというと、.docx や .pptx 型式は「XMLと画像が一緒にZIPで圧縮されたファイル形式」になっているためです。

拡張子が表示されない場合は

Windows 10の場合、エクスプローラーで[表示]タブ内の[ファイル名拡張子]にチェックを入れます。

Macの場合、Finderの環境設定(メニューの[Finder>環境設定])の[詳細]内の[すべてのファイル名拡張子を表示]にチェックを入れます。

画像文字をテキストに変換する

画像文字や手書きの画像をテキストに変換するには、「OCRソフト」などと呼ばれるアプリケーションを使用することが一般的です。

しかし、OCRソフトがインストールされていない場合、Free Online OCR などのWebサービスに画像をアップロードしてテキストにすることができます。

Free Online OCR

Free Online OCR にアクセスし、[Select file…]をクリックして画像を選択し、[JAPANESE][Text Plain (txt)]を選択し、[CONVERT]をクリックするとテキストに変換されます。

OCR前との比較

difff というWebサービスを使用し、画像文字にする前のテキストと比較したところ、行末に半角スペースが入っていたことと漢字が1文字違った以外に差はありませんでした。

この方法は、例えばスマートフォンのスクリーンショットからテキストを取り出したいときなどにも使えます。

追記: Googleドライブで画像をテキストに変換する

WebブラウザーなどでGoogleドライブに画像をドラッグ&ドロップしてアップロードします。

画像を右クリックし[アプリで開く>Googleドキュメント]でしばらく待てば、画像の下にテキストが表示されます。

最近の記事

Web制作関連動画

メルマガ会員向けの「コーダーにも役立つ補完AI『Codeium』の使い方」の動画を期間限定で公開しています。
CodeiumはGitHub Copilotと似ていますが、CSSなども補完できて、今登録すれば無料で使えます。

メルマガでは、Web制作者のためのAI活用やWordPress関連の動画など、さまざまな特典があります。ご興味ある方は、ぜひメルマガにご登録ください。