2026年01月27日
[Bedrock] Amazon Bedrock now supports 1-hour duration for prompt caching
- 公開日: 2026-01-27 (JST)
- カテゴリ: Bedrock
- リンク: https://aws.amazon.com/about-aws/whats-new/2026/01/amazon-bedrock-one-hour-duration-prompt-caching/
概要
Amazon Bedrockが、特定のAnthropic Claudeモデル向けにプロンプトキャッシュの有効期間(TTL)を従来の5分から1時間に延長できるオプションを一般提供しました。これにより長時間にわたるエージェントワークフローやマルチターン会話でのコスト効率と応答性が改善されます。
変更内容・新機能の詳細
従来、Bedrockのプロンプトプレフィックスキャッシュは固定で5分の有効期間でした。今回のアップデートで、AnthropicのClaude Sonnet 4.5、Claude Haiku 4.5、Claude Opus 4.5に対して、プロンプトプレフィックスを1時間保持するTTLオプションが利用可能になりました。1時間TTLを選択すると、キャッシュされたコンテキストがより長時間持続するため、ユーザーの応答間隔が長いセッションや、ツール呼び出し・検索・オーケストレーションなど複数ステップを挟むエージェント処理、またはバッチ処理での再利用によるレイテンシ低減とコスト削減が期待できます。1時間キャッシュは5分キャッシュと異なる料金体系で課金されます。利用可能リージョンは、対象モデルが提供されている全ての商用AWSリージョンおよびAWS GovCloud (US)リージョンです。詳細な設定方法や料金はAmazon Bedrockのドキュメントと料金ページを参照してください。
影響範囲・利用シーン
- 対象ユーザー: LLMを使ったエージェント開発者、マルチターン会話アプリケーション開発者、SRE/運用チーム
- 利用シーン: 長時間の対話セッション、ツール呼び出しやレトリーバルを含むエージェントワークフロー、複数バッチ処理で同一プロンプトコンテキストを再利用するケース
- 運用効果: キャッシュヒット率向上によりAPI呼び出しあたりのコスト低減と応答レイテンシの改善が期待できる。逆にTTLが長くなることで最新コンテキスト反映の遅延が発生する可能性があるため、ユースケースに応じたTTL選択が必要
技術的な注意点
- 対応モデル: Anthropic Claude Sonnet 4.5、Claude Haiku 4.5、Claude Opus 4.5 のみ対応
- リージョン制限: 対象モデルが利用可能なすべての商用リージョンおよびAWS GovCloud (US)で一般提供。モデル未提供のリージョンでは利用不可
- IAM権限: Bedrockの設定変更やAPI利用に必要なIAM権限を事前に確認(Bedrockコンソール/APIにアクセスできる権限が必要)
- コスト: 1時間TTLは5分TTLとは別料金で課金されるため、キャッシュヒット率と使用パターンを検証してコスト効果を評価すること
- データ/セキュリティ: キャッシュに保存されるプロンプトが機密情報を含む場合は注意。必要に応じて入力のマスキングやキャッシュ無効化ポリシーを検討すること
- 整合性/無効化: 長いTTLはコンテキストの変更反映が遅れるリスクがある。動的コンテキストを即時反映したい場合は短いTTLまたは明示的なキャッシュ無効化が必要
- 設定方法: BedrockのコンソールまたはAPIでプロンプトキャッシュのTTLオプションを指定(詳細は公式ドキュメント参照)
参考情報
- https://aws.amazon.com/about-aws/whats-new/2026/01/amazon-bedrock-one-hour-duration-prompt-caching/
- https://aws.amazon.com/bedrock/pricing/
- https://docs.aws.amazon.com/bedrock/latest/userguide/
[General] Amazon WorkSpaces Core announces monthly pricing for managed instances
- 公開日: 2026-01-27 (JST)
- カテゴリ: General
- リンク: https://aws.amazon.com/about-aws/whats-new/2026/1/amazon-workspaces-core-managed-instances-flexible-billing/
概要
Amazon WorkSpaces Core の管理インスタンスで、既存の時間課金に加えて月額の定額課金が利用可能になりました。これにより、常時稼働するフルタイムデスクトップには月額を、利用が変動するユーザーには時間課金を選ぶことでコスト最適化が可能になります。
変更内容・新機能の詳細
今回の変更で、WorkSpaces Core の managed instances に月額フラットレートが追加され、従来の時間課金(オンデマンド)と併用できる柔軟な課金モデルが提供されます。managed instances は顧客の AWS アカウント内にリソースをプロビジョニングし、永続/非永続ワークロードのインフラライフサイクル管理を行います。月額は常時稼働(always-on)利用時に時間課金よりコスト優位になるよう最適化されており、月額と時間課金を同一デプロイ内で混在させることができます。VDI パートナー(例: Citrix、Workspot、Dizzion、Leostream)は WorkSpaces の API 経由でインスタンス作成時に月額課金を選択できるように統合可能です。なお時間課金はデフォルトの料金モデルのままで、合わせて WorkSpaces による時間ユーティリティ料金の結合請求が始まり、従来のように請求が EC2 と WorkSpaces に分かれて出ることはなくなります(オンデマンド時間料金の実効レートに変更はありません)。詳細な単価や見積りは WorkSpaces の価格ページやドキュメントを確認してください。
影響範囲・利用シーン
- 対象ユーザー: バーチャルデスクトップ(VDI)を使う企業のデスクトップ管理者、SRE、VDI パートナー(Citrix 等)
- 利用シーン: フルタイムで常時稼働させるエンドユーザー向けデスクトップを月額で固定化してコストを予測可能にする場面(例: 社員用常設デスクトップ)。一方で、外部要員やシフト勤務など利用変動が大きいユーザーには時間課金を併用してコスト最適化するハイブリッド運用。
- 運用効果: 月額選択により永続デスクトップの月次コストが安定し予算計上が容易になる。時間課金との混在運用により、利用パターンに応じた柔軟なコスト最適化が可能になる。
技術的な注意点
- IAM権限: Managed instances のプロビジョニングには顧客アカウント側での適切な IAM ロール・権限が必要(インスタンス作成・ENI・EC2 操作など)。
- リージョン制限: 新料金が全リージョンで即時提供されているかは確認が必要。導入前に対象リージョンでのサポート状況を確認してください。
- コスト: 月額は常時稼働で有利。具体的な単価差・ブレークイーブンポイントは WorkSpaces の価格ページで確認して見積もりを取ること。長期コミットメントは不要だが、継続利用での費用差を事前に算出すること。
- 請求表示: 時間ユーティリティ料金は WorkSpaces 側でまとめて請求されるようになり、従来の EC2 と WorkSpaces の分割表示が統合される。請求書の見方・レポートへの影響を運用チームで確認すること。
- リソース要件: Managed instances は顧客アカウント内に EC2/ENI/ストレージ等を作成するため、VPC、サブネット、セキュリティグループ、ENI/EC2 のクォータ制限、サブネットの IP 空き容量などリソース要件を事前に確認してください。
- API/パートナー統合: VDI パートナーが WorkSpaces API を使って月額オプションを指定してインスタンスを作成できる。既存パートナー統合や自動化スクリプトは API の更新点に合わせた改修が必要になる可能性があります。
- 既存インスタンス: 既存の managed instances を後から月額に切り替えられるか、移行手順・停止期間の有無は事前確認が必要です。
参考情報
- https://aws.amazon.com/about-aws/whats-new/2026/1/amazon-workspaces-core-managed-instances-flexible-billing/
- https://docs.aws.amazon.com/workspaces/latest/adminguide/
[Govcloud Us] Amazon Managed Grafana now available in the AWS GovCloud (US) Regions
- 公開日: 2026-01-27 (JST)
- カテゴリ: Govcloud Us
- リンク: https://aws.amazon.com/about-aws/whats-new/2026/01/amazon-managed-grafana-aws-govcloud-us-regions
概要
Amazon Managed GrafanaがAWS GovCloud (US-West)およびAWS GovCloud (US-East)リージョンで利用可能になりました。政府機関や規制産業向けに、準拠要件を満たしつつ運用データの可視化・分析を行えます。
変更内容・新機能の詳細
Amazon Managed GrafanaはオープンソースのGrafanaをベースにしたフルマネージドサービスで、ダッシュボード作成、アラート、複数データソースの統合(例:Amazon CloudWatch、Amazon OpenSearch Service、Prometheus互換データソースなど)をスケーリングして提供します。今回、サービスがAWS GovCloud (US-West)およびAWS GovCloud (US-East)リージョンで利用可能になり、GovCloudのセキュリティ・コンプライアンス要件下でManaged Grafanaの機能を利用できるようになりました。なお、GovCloud (US)リージョンではEnterpriseプラグインのみサポート対象外です。開始・設定はAWSコンソールおよびAmazon Managed Grafanaユーザーガイドに従って行います。GovCloudは別パーティション(aws-us-gov)で動作するため、GovCloudアカウントと適切な認証・ネットワーク設定(IAM/Identity Center連携、VPCエンドポイント等)が必要です。
影響範囲・利用シーン
- 対象ユーザー: 政府機関、国防・ヘルスケア等の規制業界、GovCloudを利用するエンタープライズユーザー
- 利用シーン: 機密性が高い運用ログやメトリクスの可視化、セキュアなダッシュボード共有、コンプライアンス下での運用監視/インシデント対応
- 運用効果: GovCloud内で完結する可視化基盤によりデータ主権とコンプライアンスを維持しつつ、アラートやダッシュボードによる早期検知・対応が可能になります
技術的な注意点
- IAM権限: Managed Grafanaワークスペース作成やデータソース接続に必要なIAM権限(およびIAMロール設定)を事前に確認・付与してください
- リージョン制限: 対象はAWS GovCloud (US-West)およびAWS GovCloud (US-East)です。通常のAWSリージョンとは別パーティション(aws-us-gov)での操作が必要です
- Enterpriseプラグイン: AWS GovCloud (US)リージョンではEnterpriseプラグインはサポートされません
- ネットワーク: VPC内のデータソースへ接続する場合はVPCエンドポイントやプライベートネットワーク設定が必要です。必要に応じてENI/セキュリティグループの設定を確認してください
- データソース互換性: 一部AWSサービスやサードパーティの統合はGovCloudリージョンで利用不可またはリージョン制限がある可能性があります。利用予定のデータソースのGovCloud対応状況を確認してください
- 認証/SSO: IAM Identity Center(旧AWS SSO)やSAML等での認証統合が可能ですが、GovCloud用の設定を行う必要があります
- コスト: Managed Grafanaの利用料金が発生します。GovCloudでの課金体系は一般リージョンと同様の要素(ワークスペース時間、アクティブユーザー等)があるため、事前に価格ページで確認してください
- 監査・コンプライアンス: GovCloudのコンプライアンス要件に従って、ログ保持・アクセス監査の設計を行ってください