プロビジョニングされたスループットの概要
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このページでは、プロビジョンド スループットの概要と使用方法について説明します。
プロビジョンド スループットの概要
プロビジョンド スループットは、Vertex AI でサポートされている生成 AI モデルのスループットを予約する、固定料金の月額または週単位のサブスクリプション サービスです。スループットを予約するには、モデルと、モデルが実行される利用可能なロケーションを指定する必要があります。
プロビジョンド スループットの使用が適切なケース
ユースケースで次のいずれかの事項が該当する場合は、プロビジョニングされたスループットの使用を検討してください。
- chatbot やエージェントなどのリアルタイム生成 AI 本番環境アプリケーションを構築している。
- 重要なワークロードで常に高いスループットが求められる。スループットの測定はモデルによって異なります。
- アプリのユーザーに、一貫性があり予測可能なエクスペリエンスを提供したい。
- 月額または週単位の固定料金で生成 AI の費用を管理し、超過料金を制御したい。
プロビジョンド スループットは、生成 AI モデルを消費する 2 つの方法の一つです。2 つ目は従量課金制です。これはオンデマンドとも呼ばれます。
次のステップ
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-04-23 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-04-23 UTC。"],[],[]]