
画像処理
画像処理ツールを使用して、画像にさまざまなアクションを実行します。これらのツールでは、画像の位置合わせ、閾値処理、スケール、シフト、トリミングなどを行うことができます。また、輝度バランスの調整やグレースケールへの変換も可能です。
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designer のライセンスとアドオンインストーラーが別途必要です。Designer をインストール後、Intelligence Suite をインストールし、無料トライアルを開始 します。
ツールコンポーネント
画像処理ツールには、3 つのアンカーがあります (入力が 2 つ、出力が 1 つ)。
- 入力アンカー: 入力アンカーを使用して、処理する画像に接続します。
- オプションの入力アンカー: 画像テンプレートツールからの注釈を接続します。これらの注釈は、[シフト] ステップのアンカーポイントとして使用できます。
- 出力アンカー: 出力アンカーは、処理された画像をダウンストリームに渡す際に使用します。
- 注記: 「image_processed」列には、処理済みの画像が格納されます。
ツールの設定
-
キャンバスに画像処理ツールを追加します。
-
入力アンカーを使用して、処理する画像に接続します。
-
画像 フィールドから、処理する画像を選択します。
-
ステップを追加 ボタンを選択してドロップダウンを開きます。ここから次のいずれかの手順を追加できます。
このツールは、各ステップを上から下へと順番に処理します。すでに追加したステップをドラッグして、順序を変更できます。個々のステップを削除するには、ゴミ箱アイコンを選択します。
-
アラインメント
-
閾値処理
-
スケール
-
トリミング
-
輝度バランス
-
グレースケール
-
OCR の最適化
-
シフト
-
-
ワークフローを 実行 します。
詳細
画像処理のステップごとに、高度な設定オプションがあります。
アラインメント
[カスタム] オプションを使用すると、スライダーを使用して、画像に適用する回転の角度と方向を指定できます。スライダーをリセットするには、更新アイコンを選択します。[アラインメント] を使用すると、歪んだスキャン文書の OCR 結果を改善できます。
閾値処理
閾値を設定して、各チャネルの画像を白黒などのバイナリに変換します。
画像の閾値処理に使用できるアルゴリズムがいくつか用意されています。ほとんどの場合、書籍のスキャンページのようなテキストの画像には 適応型ガウシアン を使用し、写真などのその他の画像には バイナリ を使用することをお勧めします。閾値処理の詳細については、「OpenCV の閾値処理に関するドキュメント(Image Thresholding)」を参照してください。
注記: 適応的閾値処理法では、画像がシングルチャネル (つまりグレースケール) であることが必要です。閾値処理 ステップの前に グレースケール ステップがない場合、グレースケール処理は実行されますが、設定ウィンドウにグレースケールステップは追加されません。
スケール
画像のサイズを変更します。
作成する画像のサイズを選択します。幅と高さは、ピクセル単位または元の画像のサイズを基準にしたパーセンテージで指定できます。
また、画像のアスペクト比を固定することもできます。これにより、高さや幅を変更しても比率は変わらなくなります。
トリミング
画像の一部を削除します。
画像をトリミングするには、保持する画像の大きさを選択します。この選択では、幅と高さをピクセル単位またはパーセンテージで指定できます。次に、アンカーグリッドを使用して、トリミング後に保持する画像部分を選択します。
輝度バランス
画像の輝度を自動または手動で調整します。
マルチチャネルの画像をシングルチャネルに変換します。自動 オプションを使用すると、ツールが自動的に画像の輝度を調整します。カスタムオプションを選択した場合は、スライダーを使用して、画像の明るさまたは暗さを任意に指定できます。
グレースケール
マルチチャネルの画像をシングルチャネルに変換します。何も設定する必要はありません。
OCR の最適化
スキャンした PDF ファイルを光学文字認識 (OCR) 用に最適化します。OCR 最適化 は、加工品、印刷された背景テクスチャ、白以外の背景をスキャンしたノイズの多いドキュメントの場合にだけ使用してください。ノイズのないドキュメントに OCR 最適化 を使用することはお勧めしません。
OCR 最適化 には次の 3 つのモードがあります。
- 自動: ドキュメントごとに 濃いめ 処理と 薄め 処理のどちらを適用するのか自動的に決定します。
- 濃いめ: より密度の高いドキュメントやノイズの多いドキュメントに使用します。
- 薄め: 比較的ノイズの少ないドキュメントに使用します。
ドキュメントの背景が白以外になっている部分がある場合は、[背景が白ではないテキストがあります] を選択します。たとえば、ドキュメントの背景が青色で文字が白い場合は、このオプションを選択します。
シフト
スキャン時に位置がずれた文書を自動的にシフトします。[シフト] を使用すると、スキャン文書の OCR 結果を改善できます。[シフト] を使用するには、次の手順に従います。
- 画像テンプレートツールに、アンカーとして機能する注釈を作成します。[シフト] は、アンカーを使用して、他のスキャンした文書を整列させます。注記: [シフト] は [テーブル検出]を使用している場合機能しません。手動注釈モードで追加される注釈のみを使用してください。
- 画像テンプレートツールを、オプションの入力アンカーに接続します。
- [シフト] ステップを追加します。
- スキャンした文書を自動的にシフトするには、[シフト] の下の [アンカー] を選択します。
- ステップ 1 で作成した注釈から [アンカー名] を選択します。
- ワークフローを 実行 します。