Skip to main content

Text Summary under Text Mining_256baa0.png テキストサマリー

テキストサマリーツールは、テキストの本文を要約します。テキストの本文をよりよく理解したり、大量のテキスト本文を含む、さらなる下流のタスクを支援したりするには、テキストサマリーツールを使用します。このツールは、 Summa - Textrank のテキスト要約機能を活用します。

Alteryx Intelligence Suiteが必要です

このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designerに加え、別途のライセンスとアドオンインストーラーが必要です。Designerをインストール後、Intelligence Suiteをインストールし、 無料トライアルを開始 します。

言語サポート

テキストサマリーツールは、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語に対応しています。

ツールコンポーネント

テキストサマリーツールには、2 つのアンカーがあります (入力が 1 つ、出力が 1 つ):

  • 入力アンカー: 入力アンカーを使用して、集計するテキストデータを接続します。

  • 出力アンカー: 出力アンカーを使用して、集計されたテキストをダウンストリームに渡します。

ツールの設定

  1. テキストサマリーツールをキャンバスに追加します。

  2. 入力アンカーを使用して、テキストサマリーツールをワークフローで使用するテキストデータに接続します。

    1. テキストデータを Designer に取り込むには、 データ入力 ツールまたは テキスト入力 ツールを使用します。

    2. 文中の特別なマークは削除することをお勧めします。たとえば、[番号]、(番号)、 番号 など、文の最後にある引用数字を削除します。このようなテキストは、 正規表現ツール で削除できます。

  3. 入力テキスト 言語 を選択します。テキストに複数の言語が含まれている場合は、最も優勢な言語を選択します。

  4. 集計する テキストを含む列 を選択します。

  5. 要約の長さ の文の数を入力します。テキストサマリーの文は、テキストよりも少なくする必要があります。

  6. 要約メソッド を選択してください。

  7. ワークフローを 実行 します。

要約メソッド

テキストサマリー出力は、選択したアルゴリズムまたはモデルによって変動することがあります。既定の TextRank をお勧めします。現在サポートされている要約メソッドはこのリストにあります。

  • TextRank:重要な文からテキストサマリーを作成するグラフベースのアルゴリズムです。TextRank は、 抽出による要約メソッド を使用します。この方法では、重要な文を識別し、重要度の高い順に逐語的に返します。サマリーは、人間によるサマリーほど明確ではない場合があります。TextRank は、テキストのブロックで最適に実行されます。テキストの本文に含まれないドキュメントの見出し、脚注、および他の部分を削除します。複数の言語が含まれているテキストの場合、TextRank は最も優勢な言語に最大の効果を発揮します。

出力

出力には、テキストサマリーを含む 1 つの列が含まれています。 レポートテキストツール を接続して、元のテキストとテキストサマリーを比較します。