JetBrains Mellum
JetBrains Mellum は、カスタム AI プロバイダーのコード補完機能を強化します。組織のインフラストラクチャ内にインストールされ、エアギャップ環境を含む可用性とセキュリティを確保します。
インストールを計画する
JetBrains Mellum の使用を開始する前に、次のチェックリストを確認してインストールを計画してください。
- ハードウェア
JetBrains および Mellum のハードウェア要件をご確認ください。組織内のシート数に応じて、マシンの台数と仕様を決定してください。
単一マシン: AI Enterprise を使用する小規模チーム (10 席未満) の場合は、ハイエンド GPU を搭載した単一マシンで動作します。
マルチノードクラスター: 大規模なチームの場合、複数のマシンで分散セットアップを実行すると、負荷のバランスをとることができます。
Cloud デプロイ: オンプレミスのハードウェアを管理したくない場合は、IDE Services Cloud と JetBrains AI の使用を検討してください。
- コード補完モデル
JetBrains Mellum には、複数のプログラミング言語で動作するように設計されたコード補完の jet-all-medium モデルが含まれています。
- JetBrains Mellum のアクセストークン
JetBrains(Mellum) をオンプレミスでデプロイするには、JetBrains からのアクセストークンが必要です。アクセストークンを取得するには、IDE Services 営業チームにお問い合わせください。
要件
JetBrains Mellum をサポートするには、マシンが次の要件を満たしている必要があります。
以下の GPU のいずれか: L40、H100、H200
2 CPU
16 GB の RAM
コード補完のパフォーマンスに関する考慮事項
コード補完のパフォーマンスは、GPU の種類とシート数によって異なります。
コード補完リクエストを処理する際のさまざまな GPU の予想パフォーマンス:
最大ゴール RPS | 座席数 | インスタンスタイプ | GPU モデル | ターゲットレイテンシ |
|---|---|---|---|---|
1 rps | テスト / デバッグ目的 | Amazon EC2 g6.2x ラージ | Nvidia L4 | p50 < 500ms p90 < 1500ms |
5 rps | 750 未満 | Amazon EC2 g6e.2xlarge | Nvidia L40 | p50 < 250ms p90 < 1000ms |
10 発 / 秒 | 750 - 1500 | Amazon EC2 p5.4xlarge | Nvidia H100 | p50 < 250ms p90 < 750ms |
11 rps | 750 - 1750 | Amazon EC2 p5.4xlarge | Nvidia H200 | p50 < 250ms p90 < 750ms |
インストール
IDE Services には、Helm チャートを介して JetBrains、Mellum をデプロイするオプションが付属しています。
インストール手順
IDE Services 営業チームにお問い合わせくださいにアクセストークンを要求します。
デプロイを実行します。
helm install jb-ide-services jetbrains-ide-services/ide-services-helm --version 2026.0.1 --namespace kube-ide-services -f values.yamlIDE Services Web の UI を開き、お好みの AI プロバイダーを設定して、JetBrains Mellum のセットアップを完了してください。
JWT キーを生成する
IDE Services と JetBrains、Mellum 間の通信用の JWT キーを生成します。
openssl genpkey -algorithm RSA -pkeyopt rsa_keygen_bits:2048 | openssl rsa -out private_key.pem -outform PEM -traditional openssl rsa -in private_key.pem -pubout -out public_key.pem生成されたキーは JetBrains Mellum の構成に必要となるため、安全な場所に保存します。
values.yaml を設定する
values.yaml ファイル内の
aie.mellumパラメーターに移動します。aie.mellum.enabledパラメーターの値をtrueに設定します。aie.mellum.providersセクションで、jet-all-medium モデルを構成します。providers: mellum-all: model: "jet-all-medium" image: registry: "docker.io" repository: "jetbrains/mellum-all-enterprise" tag: "2025.4.24"Kubernetes のドキュメント(英語)に記載されているように、IDE Services 営業チームから提供されたアクセストークンと
jetbrainsユーザー名を含むシークレットを生成します。次に、aie.mellum.providerDefaults.image.pullSecretsプロパティにシークレット名を指定します。aie.mellum.providerDefaults.podNodeSelectorプロパティに必要な GPU を指定します。例:aie: mellum: providerDefaults: podNodeSelector: kubernetes.io/arch: amd64 cloud.google.com/gke-accelerator: nvidia-l40生成された JWT キーペアを次のプロパティに指定します。
aie.mellum.config.jwtPublicKeyで公開鍵を指定します。ides.config.mellum.jwtPrivateKeyで秘密鍵を指定します。または、シークレットを作成し、
aie.mellum.config.jwtPublicKeySecretNameおよびides.config.mellum.jwtPrivateKeySecretNameでその名前を指定します。
- aie.mellum.enabled
Mellum モデル機能を有効または無効にします。Mellum コンポーネントをデプロイするには、
trueに設定します。- aie.mellum.providers
Mellum プロバイダーのマップを定義します。マップ内の各キーは、固有のモデル構成を表します。これらのキーはユーザー定義であり、Helm チャートからは直接参照されません。各プロバイダーの構成は、
aie.mellum.providerDefaultsのデフォルトをオーバーライドします。- aie.mellum.providerDefaults
Mellum モデルのデフォルト設定を提供します。これらの設定は、
aie.mellum.providersセクションで上書きされない限り、すべてのプロバイダーに適用されます。model: Mellum モデル ID
イメージ構成(
image):registry: コンテナーレジストリの URLrepository: イメージリポジトリへのパスtag: イメージバージョンdigest: イメージダイジェスト (プラットフォーム固有のダイジェストをサポート)pullPolicy: イメージプルポリシー (IfNotPresent、Alwaysなど)pullSecrets: プライベートレジストリのイメージプルシークレットのリスト
- aie.mellum.config.jwtPublicKey
Mellum と IDE Services 間の安全な通信を確立するための JWT 公開鍵を指定します。この鍵または
jwtPublicKeySecretNameのいずれかを設定する必要があります。- ides.config.mellum.jwtPrivateKey
Mellum と IDE Services 間の安全な通信を確立するために、JWT 秘密鍵を指定してください。この鍵または
ides.config.mellum.jwtPrivateKeySecretNameのいずれかを設定する必要があります。
関連ページ:
AI Enterprise を管理する
AI Enterprise を使用すると、組織全体でさまざまな AI サービスプロバイダー (JetBrains AI または次のようなカスタムソリューション) を使用できます。OpenAI プラットフォーム、Azure OpenAI、Google Vertex AI、Amazon Bedrock、すべてのオプションを有効にしてから、特定のユーザープロファイルに対して優先プロバイダーを選択できます。組織内で AI Enterprise を有効にする Web UI で、構成ページを開き、ライセンスとア...
分離されたインフラストラクチャ内の AI Enterprise
IDE Services は、AI Enterprise のエアギャップ操作のために次のオンプレミスソリューションをサポートしています。OpenAI 対応:AI Enterprise を使用すると、次のようなオンプレミスの OpenAI 互換 LLM サーバーと統合できます。llama.cpp、vLLM、LMStudio、対応する手順に従ってオンプレミスでサーバーをデプロイし、IDE Services UI からそのサーバーに接続します。これらのサーバーを使用すると、Claude や GPT などの...