DataGrip 2024.1 ヘルプ

データファイルを操作する

リモートストレージへの接続を確立したら、データファイルを操作できるようになります。リモートファイルシステムプラグインを使用すると、バケットの管理、基本的なファイル操作の実行、ファイルの迅速な検索とそのファイルへの移動などを行うことができます。

大きな構造化ファイル (Parquet、ORC、Avro、CSV) を表形式でプレビューすることもできます。この機能はビッグデータファイルビューアー(英語)によって提供され、リモートファイルシステムプラグインとともに自動的にインストールされます。

サーバーディレクトリの管理

  1. サーバーノードを展開して、その構造をプレビューします。

  2. ディレクトリを右クリックして、コンテキストメニューを開きます。

    Context menu in the Big Data Tools tool window

    ディレクトリのコピー、貼り付け、名前の変更、場所の変更、パスのコピー、新しいファイルとディレクトリの追加を行うことができます。ディレクトリにさらにファイルを追加するには、ディスクからアップロードを選択します。ディレクトリとそのファイルをローカルドライブに保存することもできます。

  3. 新しいファイル、ディレクトリ、接続をすばやく作成するには、Alt+Insert を押します。

    Create New

ビッグデータツールツールウィンドウを使用すると、ストレージ内のファイルとディレクトリをすばやく見つけることができます。多くのネストされたディレクトリがあり、ファイルを探すときに各ディレクトリをクリックして展開したくない場合に便利です。代わりに、パスの入力を開始して、DataGrip に使用可能なファイルを表示させ、パスを自動補完することができます。

  1. ストレージへの接続を選択し、ビッグデータツールツールウィンドウの上部にある Find icon をクリックするか、Ctrl+F を押します。その中のファイルを検索する場合は、特定のバケットまたはディレクトリを選択できます。

  2. 移動ウィンドウで、ファイルまたはディレクトリへのパスの入力を開始します。Tab を押して、パスを自動補完します。または、バケットの名前を入力してすばやく見つけることもできます。

    Navigate in window
  3. Enter を押します。

これにより、ビッグデータツールツールウィンドウで選択したファイルが検索されます。

データファイルを管理する

  1. ターゲットディレクトリを展開し、ファイルを選択します。

  2. ファイルを右クリックして、コンテキストメニューを開きます。

    Context menu to work with the data files
  3. ファイルのコピー、貼り付け、名前の変更、パスのコピー、場所の変更、削除を行うことができます。

  4. CSV、Parquet、ORC、Avro などの構造化ファイルの詳細を簡単にプレビューするには、エディターまたはビッグデータツールツールウィンドウでファイルを展開します。列とそのタイプを確認できるはずです。

    Expanded data file

    コンテキストメニューから情報を表示を選択して、ファイルの詳細を取得します。

    File info
  5. ファイルを表示するには、ファイルをダブルクリックするか、コンテキストメニューからプレビューコマンドを選択します。ファイルがエディターで開きます。編集はできませんが、表またはテキストとしてプレビューできます。

    Table view of the csv file
    Text view of the csv file

    テーブルビューでは、テーブル要素を操作できます。右クリックしてコンテキストメニューを開き、コマンドを選択して raw または列をコピーするか、テーブル全体をクリップボードまたはファイルにコピーします。

    Table-specific commands

    列ヘッダーをクリックして、列のデータを並べ替えることもできます。

    .parquet ファイルを開くと、プラグインはファイルコンテンツの最初の部分のみを表示します。これは、非常に大きなファイルを扱うときに特に役立ちます。

エディターでファイルを表示する

  1. エディターの別のタブでストレージまたはディレクトリを開くには、ビッグデータツールツールウィンドウでアイテムを選択し、Open in Editor button をクリックします。

    Open a directory in editor
  2. 選択したディレクトリがエディターの別のタブで開きます。

    Preview a directory

    ビッグデータツールツールウィンドウで開いたサーバーやディレクトリとファイルを交換できます。ビューアーのツールバーアイコンを使用して、ファイルをコピー、貼り付け、切り取ります。

  3. ストレージの外観をカスタマイズできます。

    • File info をクリックして、ファイル情報の詳細の可視性を管理します。

    • ビューの列を除外するには、Show and hide columns icon をクリックします。デフォルトでは、すべての列がビューアーに表示されます。

  4. Refresh をクリックして、選択したディレクトリのコンテンツを更新します。

More actions を使用して、他のコマンドにアクセスします。

ファイルのドラッグアンドドロップ

DataGrip を使用すると、ファイルを必要なバケット、コンテナー、ディレクトリにドラッグすることで、異なるリモートファイルシステム間または同じストレージ内でファイルを簡単にコピーおよび移動できます。プロジェクトツールウィンドウからエディターまたはビッグデータツールツールウィンドウで開くことができるエディターにファイルをドラッグすることで、ローカルファイルシステムからリモートファイルシステムにファイルをすばやくアップロードすることもできます。

  1. ファイルを必要なバケット、コンテナー、ディレクトリにドラッグします

  2. 開いたウィンドウで、ファイルの名前と宛先ディレクトリを確認します。

    Dragging a file to storage

同じ接続内でファイルをドラッグすると、DataGrip は元の場所からファイルを削除します。プロジェクトから、またはある接続から別の接続にファイルをドラッグすると、DataGrip はファイルのコピーを作成します。

ファイルの編集

リモートストレージへの接続が確立されると、Zeppelin ノートブックと CSV などの区切り記号で区切られたファイルを除く、このストレージ内のテキストファイルを編集できます。

  1. ファイルをダブルクリックしてエディターで開きます。

  2. ファイルを変更します。ファイルの上部にアイコンが表示され、次のことが可能になります。

    • 差分を表示 (the Diff icon)

    • ファイルの内容を、開いたときの初期状態に戻す (the Revert icon)

    • サーバーから最新のファイル変更を取得する (the Reload icon)

    • ファイルの変更をサーバーに送信する (the Save icon)

    Editing a remote file

ファイルのバージョンを表示する

バージョニングにより、ストレージ内に同じオブジェクトの複数のバリアントを持つことができます。バケットのバージョニングが有効になっている場合は、オブジェクトのバージョンを DataGrip で直接表示できます。特定のバージョンをアップロード、ダウンロード、削除、復元、比較することもできます。

  1. ビッグデータツールツールウィンドウでストレージを選択し、Open in Editor button をクリックしてエディターで開きます。

  2. バージョニングが有効になっているバケットを展開し、バケット内のファイルを選択します。

  3. 詳細ペインで、バージョンタブを開きます。

このタブには、選択したファイルの使用可能なすべてのバージョンが表示されます。

Versions tab

バージョンを選択すると、次のアイコンが使用可能になります。

  • Upload は、ローカルドライブから新しいバージョンのファイルをアップロードします。

  • Download は、選択したバージョンのファイルをダウンロードします。

  • Delete は、ファイルの選択されたバージョンを削除します。

  • Restore は、ファイルの選択されたバージョンを復元します。

  • Show Diff は、ファイルの選択したバージョンと以前のバージョン間の差分を表示します (または、それらの間の差分を表示する場合は、2 つのバージョンを選択できます)。

新規バケツの作成

  1. 新しいバケットをデータストレージに追加するには、ビッグデータツールツールウィンドウでストレージ接続を右クリックし、コンテキストメニューからバケットを作成するを選択します。

  2. 新しいバケット名を指定し、OK をクリックしてタスクを完了します。

バケットのリストをフィルタリングする

ストレージ全体ではなくストレージの一部を操作する場合は、ビッグデータツールツールウィンドウとエディターに表示するバケット (または Microsoft Azure の観点からはコンテナー) をフィルター処理できます。

バケットとディレクトリへのカスタムパスを指定するか、バケットを名前でフィルタリングできます。新しい接続を構成するときに行うか、以前に構成した接続設定を微調整できます。

  1. ビッグデータツールツールウィンドウでサーバーを選択し、ウィンドウツールバーの connection settings をクリックします。

  2. バケットをフィルタリングする方法を選択します。

    • カスタムルートを選択し、ルートフィールドで、バケットの名前またはバケット内のディレクトリへのパスを指定します。複数の名前またはパスをコンマで区切って指定できます。

    • アカウント内のすべてのバケット (または Azure の場合はアカウント内のすべてのコンテナー ) を選択します。その後、バケットフィルターを使用して、特定の名前のバケットのみを表示できます。

    • AWS S3 接続の場合、選択したリージョンのバケットのみを選択して特定のリージョンからバケットを取得することもできます。他のストレージの場合、バケットは接続用に選択されたリージョンに基づいて常にフィルタリングされます。

    Filtering the list of buckets

サーバー接続が失われた場合、対応するアイコンはサーバー Server connections got lost の切断ステータスを示します。

Disconnected server

Refresh connections をクリックして、サーバーへの接続を再確立します。