テキストサマリー

バージョン:
2022.3
Last modified: January 30, 2023

テキストサマリーツールは、テキストの本文を要約します。テキストの本文をよりよく理解したり、大量のテキスト本文を含む、さらなる下流のタスクを支援したりするには、テキストサマリーツールを使用します。このツールは、Summa - Textrank のテキスト要約機能を活用します。

このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designer のライセンスとアドオンインストーラーが別途必要です。Designer をインストール後、Intelligence Suite をインストールし、無料トライアルを開始 します。

言語サポート

テキストサマリーツールは、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語に対応しています。

ツールコンポーネント

テキストサマリーツールには、2 つのアンカーがあります (入力が 1 つ、出力が 1 つ):

  • 入力アンカー: 入力アンカーを使用して、集計するテキストデータを接続します。
  • 出力アンカー: 出力アンカーを使用して、集計されたテキストをダウンストリームに渡します。

ツールの設定

  1. テキストサマリーツールをキャンバスに追加します。
  2. 入力アンカーを使用して、テキストサマリーツールをワークフローで使用するテキストデータに接続します。
    1. テキストデータを Designer に取り込むには、データ入力ツールまたはテキスト入力ツールを使用します。
    2. 文中の特別なマークは削除することをお勧めします。たとえば、[番号]、(番号)、番号など、文の最後にある引用数字を削除します。このようなテキストは、正規表現ツールで削除できます。
  3. 入力テキスト言語を選択します。テキストに複数の言語が含まれている場合は、最も優勢な言語を選択します。
  4. 集計する テキストを含む列 を選択します。
  5. 要約の長さの文の数を入力します。テキストサマリーの文は、テキストよりも少なくする必要があります。
  6. 要約メソッドを選択してください。
  7. ワークフローを 実行 します。

要約メソッド

テキストサマリー出力は、選択したアルゴリズムまたはモデルによって変動することがあります。既定の TextRank をお勧めします。現在サポートされている要約メソッドはこのリストにあります。

  • TextRank:重要な文からテキストサマリーを作成するグラフベースのアルゴリズムです。TextRank は、抽出による要約メソッドを使用します。この方法では、重要な文を識別し、重要度の高い順に逐語的に返します。サマリーは、人間によるサマリーほど明確ではない場合があります。TextRank は、テキストのブロックで最適に実行されます。テキストの本文に含まれないドキュメントの見出し、脚注、および他の部分を削除します。複数の言語が含まれているテキストの場合、TextRank は最も優勢な言語に最大の効果を発揮します。 

出力

出力には、テキストサマリーを含む 1 つの列が含まれています。レポートテキストツールを接続して、元のテキストとテキストサマリーを比較します。

このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。