入門
DataSpell は、探索的データ分析と機械学習(ML)モデルのプロトタイピングといった特定のタスクに特化した統合開発環境(IDE)です。https://www.jetbrains.com/dataspell/ からダウンロードできます。

準備が整っていることを確認
開始する前に、必要なすべてのソフトウェアが環境で使用可能であり、マシンにインストールされているかどうかを確認してください。
サポートされる言語
DataSpell で開発を開始するには、python.org(英語) から Python を、https://cran.r-project.org/(英語) から R をダウンロードしてインストールする必要があります。
DataSpell は次のバージョンをサポートしています。
Python 2 : バージョン 2.7
Python 3 : バージョン 3.9 からバージョン 3.15 まで
R : 3.4 以降。
サポートされるプラットフォーム
DataSpell は、Windows、macOS、Linux で動作するクロスプラットフォーム IDE です。システム要件を確認してください。
要件 | 最小 | 推奨 |
|---|---|---|
RAM | 2 GB の空き RAM | 8 GB の総システム RAM |
CPU | 最新の CPU | マルチコア CPU。DataSpell は、さまざまな操作やプロセスのマルチスレッドをサポートしているため、使用できる CPU コアが多くなります。 |
ディスク容量 | 3.5 GB | 5 GB 以上の空き容量がある SSD ドライブ |
モニターの解像度 | 1024 × 768 | 1920 × 1080 |
オペレーティングシステム | 以下の公式リリースバージョン:
プレリリース版はサポートされていません。 | 以下の最新バージョン:
|
DataSpell のインストールに関してサポートが必要な場合は、インストール手順を参照してください。
Conda をインストールする
Conda 環境を使用する予定の場合:
Anaconda(英語) をダウンロードしてください。
インストール手順(英語)に従って Anaconda をインストールします。
はじめに
DataSpell を実行すると、IDE での作業の開始点となるウェルカム画面が表示され、その設定が構成されます。
DataSpell を初めて実行するときは、次のいずれかのオプションを選択できます。
クイックスタート
DataSpell ワークスペースが開きます。ディレクトリやプロジェクト、Jupyter 接続をワークスペースに追加できます。
詳細は、クイックスタートを参照してください。
プロジェクト
プロジェクトを操作する場合は、このオプションを選択してください。ディスクまたは VCS から既存のプロジェクトを開くか、新しいプロジェクトを作成することができます。
詳細は、DataSpell のプロジェクトに取り組むを参照してください。
ローカルノートブックとデータセットをワークスペースに追加したり、ディレクトリをアタッチしたり、バージョンコントロールシステムからプロジェクトを複製したりできます。
主な UI 要素について説明します。

詳細は、ユーザーインターフェースを参照してください。
ノートブックで作業
DataSpell では、ストリームデータ、イメージ、その他のメディアを含む実行出力を簡単に編集、実行、検証できます。典型的なワークフローは以下のとおりです。
セルを実行すると結果を評価する
コードセルのデバッグ(必要に応じて)
ノートブックファイルを作成する
以下のいずれか 1 つを実行します:
ワークスペースツールウィンドウでターゲットディレクトリを右クリックして、コンテキストメニューから新規を選択します。
ボタン Alt+Insert
Jupyter Notebook を選択します。
開いたダイアログで、ファイル名「example」を入力します。

ノートブックドキュメントの拡張子は *.ipynb で、対応するアイコン
が付いています。新しく作成されたノートブックがエディターで開きます。このノートブックにはコードセルが 1 つ含まれています。ノートブックツールバーのセルタイプセレクターでセルの種類を変更できます。

ノートブックを編集する
セルを編集するには、セルをクリックするだけです。
最初のコードセルに pandas(英語) コードをいくつか入力します。
import pandas as pd kernel_stats = pd.read_csv('libraries_by_python_version.csv') kernel_statspandasパッケージを事前にインストールする必要はありません。ハイライト表示された行をクリックし、Alt+Enter を押して、不足しているインポート文の修正候補を選択してください。この例では libraries_by_python_version.csv データセットを使用します。libraries_by_python_version.csv からダウンロードし、プロジェクトディレクトリ(英語)に保存してください。
ノートブックにコードセルまたは Markdown セルを追加します。最後のセルの後にコードセルを追加したり、選択したセルの直後にコードセルまたは Markdown セルを追加したり、選択したセルの実行後に新しいセルを挿入したりできます。これらの操作は、メインメニュー項目にあります。
最初のコードセルのデータフレームを視覚化するために、
matplotlibコードをいくつか配置してみましょう。import matplotlib.pyplot as plt plt.pie(kernel_stats['total_count'], labels=kernel_stats['library']) plt.show()
繰り返しになりますが、
matplotlibとnumpyを事前にインストールする必要はありません。インポートを修正するには Alt+Enter を使用してください。
構文のハイライト、コード補完などのコードインサイトを使用して、コードセルを編集できます。

ノートブックを実行する
Jupyter ノートブックツールバーのアイコン、コードセルのコンテキストメニューのコマンド (コードセルを右クリックして開く)、およびメインメニューのコマンドを使用して、さまざまな方法でノートブックセルのコードを実行できます。
セルを実行すると、その出力がコードに表示されます。新規タブで開くをクリックすると、エディターの別のタブで表形式のデータをプレビューできます。

ローカルノートブックで作業する場合は、事前に Jupyter サーバーを起動する必要はありません。任意のセルを実行するだけでサーバーが起動します。
Jupyter ツールウィンドウには実行ステータスが表示されます。変数タブには変数の現在の値が表示されます。Jupyter 変数ツールウィンドウでは、コード内で宣言された変数をプレビューできます。
次に、2 番目のセルを実行します。このコードは 1 番目のセルの変数に依存しているため、セルの実行順序が重要です。

作成したプロットはコピーするか、イメージとして保存できます。すべてのセルを実行するには、ノートブックのツールバーで
をクリックしてください。
デバッグ
選択したセルにブレークポイントを設定するには、ガター (エディターの左端のスペース) をクリックします。
Windows の場合は Shift+Alt+Enter、Linux の場合は⌥⇧⏎を押します。macOS の場合は⌥⇧⏎を押します。ノートブック全体をデバッグするには、メインメニューからを選択します。

ステップツールバーボタンを使用して、次に停止する行を選択し、デバッガーツールウィンドウに切り替えて変数の値をプレビューします。

接続の管理
ノートブックは、異なるサーバーやカーネル上で実行できます。Jupyter サーバーには、構成済みサーバーと管理サーバーという 2 種類があります。
管理対象サーバーは、現在のプロジェクトに対して DataSpell によって自動的に起動されます。DataSpell を閉じると、管理対象サーバーも終了します。
設定済みのサーバー。URL とトークンを指定してこれらのサーバーに接続します。ローカルサーバーまたはリモート / Jupyter サーバーに接続できます。
サーバーの構成
Jupyter サーバーを起動すると、デフォルトでは現在のプロジェクトインタープリターと自動的に選択されたポートが使用されます。ただし、DataSpell インスタンスで利用可能な他のインタープリターを選択し、別のポートを指定することもできます。また、URL とトークンが分かっている場合は、設定済みの任意のサーバーに接続することもできます。
サーバー設定を開くには、Jupyter ノートブックツールバーの Jupyter サーバーの一覧で Jupyter サーバーの構成を選択します。

実行中の Jupyter サーバーに接続するには、構成済みサーバーを選択し、URL とトークンを含むサーバーのパスを指定します。
Jupyter ツールバーのサーバーリストから現在の Jupyter サーバーに切り替えるを選択して、構成されたサーバーに明示的に切り替えます。
詳細は Jupyter ノートブックサーバーの管理を参照してください。
作業環境を調整する
ノートブックで Python コードを実行するには、Python インタープリターに基づく仮想環境が必要です。そのため、マシン上に少なくとも 1 つの環境が設定されている必要があります。
DataSpell で既存のプロジェクトを開いたり、Jupyter サーバーに接続したりすると、IDE によって仮想環境が作成されます。ほとんどの場合、Anaconda インストールに基づいた Conda 環境が作成されます。マシン上の他の Conda 環境を選択するか、新しい環境を作成することもできます。
環境を変える
DataSpell UI の右下にある Python インタープリターセレクターで環境を変更します。それをクリックし、リストからターゲット環境を選択します。

Conda を Anaconda CLI で変更する
ターミナルウィンドウで、<Conda Home>/envs ディレクトリ (たとえば、/Users/jetbrains/.conda/envs) で
lsコマンドを実行し、ターゲット環境を選択します。Anaconda インストールの bin ディレクトリ (たとえば、anaconda3/bin) に移動します。
conda activate <env name> command(たとえば、conda activate my-conda-env) を実行します。
新しい環境を作る
Python インタープリターセレクターでインタープリターの追加を選択します。

Python インタープリターの追加ダイアログで、新しい環境の名前を入力し、Conda 実行可能フィールドで Anaconda ベースを指定します。

同じ Anaconda インストールをベースに、複数の Conda 環境を作成する理由は明らかです。それぞれの環境に特定のパッケージをインストールし、特定のタスクやプロジェクトに使用できるからです。また、venv や pipenv といった他の種類の環境を選択することもできます。
パッケージのインストール
Python インタープリターセレクターで、ターゲット環境を選択し、インタープリターの設定を選択します。

新しいパッケージを追加するには、
をクリックします。Conda リポジトリのパッケージを管理するには、Conda パッケージマネージャーボタン (
) をクリックします。それ以外の場合、DataSpell は pip を使用します。
検索フィールドにパッケージ名を入力し、対象パッケージを指定します。必要に応じて、パッケージのバージョンを指定します。
インストールをクリックします。タスク完了時にウィンドウを閉じます。
さらなる進化
R 言語
DataSpell に R プラグインをインストールすると、R 言語(英語)を使用してさまざまな統計計算を実行し、コーディング支援、ビジュアルデバッグ、スマート実行およびプレビューツール、その他の一般的な IDE 機能を使用できます。

データベース
すでにお気づきかもしれませんが、様々なタイプのプロジェクトを作成するにはデータソースが必要です。また、ソースコードに SQL 文を挿入することも考えられます。
DataSpell ではデータベースを作成することはできませんが、データベースを管理およびクエリする機能は提供されます。特定のデータベースへのアクセスが許可されると、データベースの構造を反映する DataSpell 内の 1 つ以上のデータソースを構成し、データベースアクセス資格情報を保存できます。この情報に基づいて、DataSpell はデータベースへの接続を確立し、そこに含まれる情報を取得または変更する機能を提供します。
データベースへのアクセスは、データベースウィンドウ()によって提供されます。このツールウィンドウを使用して、データベースを操作することができます。データベース内のデータ構造の表示と変更、その他の関連タスクの実行が可能です。

詳細は、データベースツールおよび SQL を参照してください。
関連ページ:
DataSpell をインストールする
DataSpell は、Windows、macOS、Linux で一貫したエクスペリエンスを提供するクロスプラットフォーム IDE です。https://www.jetbrains.com/dataspell/ からダウンロードできます。システム要件:RAM2 GB の空き RAM8 GB の総システム RAMCPU 最新の CPU マルチコア CPU。DataSpell は、さまざまな操作やプロセスのマルチスレッドをサポートしているため、使用できる CPU コアが多くなります。ディスク容量 3.5...
DataSpell を初めて実行する
DataSpell の実行はオペレーティングシステムによって異なります。DataSpell を実行するには、Windows 開始メニューでそれを見つけるか、デスクトップショートカットを使用します。bin のインストールディレクトリでランチャーバッチスクリプトまたは実行可能ファイルを実行することもできます。Applications ディレクトリ、Launchpad、Spotlight から DataSpell アプリを実行します。bin のインストールディレクトリで dataspell.sh シェルスクリプト...
Jupyter ノートブックの作成と編集
プロジェクトをセット上へするワークスペースを開きます。選択したインタープリターの jupyter パッケージをインストールします。すべてのインデックス作成プロセスが完了したら、ノートブックファイルを使用する準備が整いました。Jupyter ノートブックの作成:以下のいずれか 1 つを実行します: ワークスペースツールウィンドウでターゲットディレクトリを右クリックし、コンテキストメニューから新規を選択します。ボタン、Jupyter Notebook を選択します。開いたダイアログで、ファイル名を入力して...
ワークスペースを管理する
ワークスペースにディレクトリとプロジェクトを追加する:既存のディレクトリまたはプロジェクトを追加する以下のいずれか 1 つを実行します: ワークスペースツールウィンドウで新規または既存のディレクトリを添付リンクをクリックします。メインメニューからを選択します。ワークスペースツールウィンドウのツールバーでクリックします。、ファイルシステム内で目的のディレクトリを見つけます。プロジェクトを追加するには、プロジェクトディレクトリを選択します。新しいディレクトリを追加する以下のいずれか 1 つを実行し...
ユーザーインターフェース
DataSpell でプロジェクトまたはワークスペースディレクトリを開くと、デフォルトのユーザーインターフェースは次のようになります。プラグインのセットと構成設定によっては、IDE の外観と動作が異なる場合があります。ナビゲーションバー:フォーカス: 表示 / 非表示: ナビゲーションバーはプロジェクトビューの代わりとなるもので、プロジェクトまたはワークスペースディレクトリの構造を確認したり、特定のファイルを開いたり、現在のファイル内の特定のコード要素に移動したりできます。メインウィンドウの下部に...
ソースコードの作成と編集
コードを使用する場合、DataSpell は作業にストレスがないことを保証します。追加、選択、コピー、移動、編集、折りたたみ、出現箇所の検索、コードの保存に役立つさまざまなショートカットと機能を提供します。IDE の主要部分である DataSpell エディターを使用して、コードを作成、読み取り、変更します。エディター内のナビゲーションについては、エディターの基本を参照してください。アクションの検索使用したいアクションのショートカットを覚えていない場合は、を押して名前でアクションを見つけてくだ...