試験ガイド / Generative AI Developer Professional
Professional

Generative AI Developer Professional

試験概要

AWS Certified Generative AI Developer – Professional(AIP-C01)は、AWS の生成 AI 関連サービスを用いて本番品質のアプリケーションを設計・実装・運用する能力を評価する Professional レベルの認定試験です。Amazon Bedrock を中心に、Foundation Model の選定・カスタマイズ、RAG システムと AI Agent の設計、スケーラブルな本番運用、責任ある AI・セキュリティ・ガバナンスまで、生成 AI 開発者に求められる実務能力を広範囲に問います。合格スコアは 750/1000、試験時間 180 分・75 問で構成され、AI Practitioner(AIF-C01)が概念理解を評価するのに対し、AIP-C01 は設計判断と実装トレードオフを評価する点が大きく異なります。

対象者・前提知識

Amazon Bedrock や Amazon Q、Amazon SageMaker を用いた生成 AI アプリケーションの実装経験が 1 年以上ある開発者・アーキテクト向けの試験です。PoC を超えて本番運用まで経験していること、RAG / Agent / Fine-tuning のいずれかで設計判断を行った経験があることが望ましい受験者像です。AI Practitioner(AIF-C01)または Machine Learning Engineer Associate(MLA-C01)を取得済みであると基礎が固まった状態で臨めます。生成 AI SaaS を開発するエンジニア、エンタープライズの GenAI 基盤を設計するアーキテクト、LLM ベースの業務自動化を推進するテックリードに特に適しています。

ドメイン構成

生成 AI ソリューション設計
22%
Bedrock(マネージド基盤モデル)・SageMaker(自前モデルホスティング・Fine-tuning)・Amazon Q(エンドユーザー向けアシスタント)の棲み分けを、コスト/運用負荷/カスタマイズ自由度の 3 軸で整理しましょう。マルチテナント SaaS での「テナント分離(IAM / KMS / Guardrails プロファイル)」設計、Cross-region Inference Profile を使ったレイテンシー・スループット・耐障害性の両立パターンが頻出です。Well-Architected Generative AI Lens の 6 柱(Responsible AI 含む)をベースに設計判断を説明できるようにしておきましょう。
基盤モデルの選択とカスタマイズ
20%
「プロンプトで足りるなら Fine-tuning しない」が原則。データ量が数百件なら Few-shot + RAG、数千〜万件で出力フォーマット固定が必要なら PEFT/LoRA、ドメイン固有語彙が支配的なら Continued Pre-training、というレイヤー化した意思決定フローを暗記しましょう。Bedrock の Provisioned Throughput は「一定以上のトラフィック」で On-demand より安くなる損益分岐の考え方が問われます。Model Distillation(大規模モデル → 小型モデル)や Custom Model Import(自前モデルを Bedrock で運用)の適用条件も整理しておきましょう。
RAG とエージェント開発
24%
Knowledge Bases のチャンキング戦略は「固定長+オーバーラップ」が無難ですが、階層構造を持つ文書では hierarchical、意味的境界が重要な場合は semantic を選びます。ベクトルストアは「運用負荷最小=OpenSearch Serverless」「既存 RDB 活用=Aurora pgvector」「関係性重視=Neptune Analytics(GraphRAG)」「大規模・低コスト=S3 Vectors」のように使い分けます。Bedrock Agents は「Action Group(Lambda/OpenAPI)+ Knowledge Base + Guardrails」の 3 点セットを設計でき、Return of Control で人間承認フローを挟むパターンまで押さえましょう。Multi-agent 協調(Supervisor / Router 型)も近年の頻出トピックです。
本番実装・運用・最適化
20%
本番運用の柱は「評価」「監視」「コスト最適化」の 3 点。評価は Bedrock Model Evaluation(自動・人手・LLM-as-a-Judge)と Ragas / TruLens などの RAG 評価を使い分け、ハルシネーション率・検索再現率・Faithfulness を継続計測します。監視は CloudWatch Metrics・X-Ray・Model Invocation Logging(S3/CloudWatch Logs)を組み合わせ、プロンプト/応答/遅延/コストをトレース可能にします。コスト最適化は Prompt Caching(最大 90% の入力トークン削減)・Batch Inference(最大 50% 割引)・Provisioned Throughput の組み合わせが定石。ストリーミング応答(SSE / WebSocket / AppSync Events)とクライアント体験の両立も問われます。
責任ある AI・セキュリティ・ガバナンス
14%
Bedrock Guardrails の 6 フィルタ(Content / Denied Topics / Word / Sensitive Information / Contextual Grounding Check / Prompt Attack)をユースケース別に組み合わせる設計力が試されます。特に Contextual Grounding Check は RAG のハルシネーション抑制に直結する重要機能です。セキュリティ面では Bedrock VPC エンドポイント(インターフェース型)、IAM 条件キー(aws:RequestTag/bedrock:ModelId 等)によるモデル利用制御、KMS によるモデル入出力の暗号化、Model Invocation Logging の 90 日以上保持による監査証跡を押さえましょう。ガバナンス面では EU AI Act の高リスク分類、NIST AI RMF の Govern/Map/Measure/Manage、ISO/IEC 42001、Model Card / AI BOM による透明性確保が出題範囲です。著作権・知的財産の観点から、学習データや生成物の利用条件評価も忘れずに学習しておきましょう。

出題傾向

RAG とエージェント開発(ドメイン 3、24%)が最大の比重を占め、Bedrock Knowledge Bases のチャンキング戦略(fixed / semantic / hierarchical)、ベクトルストア選択(OpenSearch Serverless / Aurora pgvector / Neptune Analytics / S3 Vectors)、リランキングやハイブリッド検索の最適化が頻出テーマです。Bedrock Agents のアクショングループ設計、Function calling スキーマ、Multi-agent 協調、Return of Control による人間介入フローも繰り返し問われます。

生成 AI ソリューション設計(ドメイン 1、22%)では、Bedrock / SageMaker / Amazon Q の使い分け、Well-Architected Generative AI Lens に沿ったアーキテクチャ判断、マルチテナント SaaS 設計、Cross-region Inference Profile を使ったレイテンシー/可用性設計が出題されます。

モデル選択とカスタマイズ(ドメイン 2、20%)では「プロンプト → RAG → Fine-tuning → Continued Pre-training」という段階的選択基準が重要です。PEFT / LoRA / QLoRA、Model Distillation、Custom Model Import、Provisioned Throughput vs On-demand vs Batch の経済性比較が頻出です。

本番実装・運用・最適化(ドメイン 4、20%)では、Prompt Caching、Batch Inference、Streaming(SSE / WebSocket / AppSync Events)、CloudWatch / Model Invocation Logging を組み合わせた監視、LLM-as-a-Judge や Ragas による継続的評価が問われます。

責任ある AI・セキュリティ・ガバナンス(ドメイン 5、14%)では、Bedrock Guardrails の Contextual Grounding Check、Prompt Injection 対策、EU AI Act / NIST AI RMF / ISO/IEC 42001 準拠、Model Card / AI BOM によるガバナンス文書化が重点的に出題されます。

学習のポイント

Professional 試験の定石として、「同じ要件を満たせる複数の正解候補から、コスト・運用負荷・レイテンシー・精度・安全性のトレードオフを踏まえて最適解を 1 つ選ぶ」訓練が不可欠です。問題文中の制約(p95 レイテンシー、月額予算、規制、ハルシネーション許容値など)を先に拾い、それを満たさない選択肢を機械的に除外する読み方が有効です。

カスタマイズ手法の選択基準(Prompt Engineering → RAG → Fine-tuning → Continued Pre-training)を段階で整理し、それぞれが「何を解決し」「何を解決しないか」を説明できるレベルに仕上げましょう。例えば「最新の社内文書を反映したい」なら Fine-tuning ではなく RAG、「独自のトーン/出力フォーマットを固定したい」なら Fine-tuning、というユースケース別マッピングが効きます。

Bedrock の 3 大機能(Knowledge Bases / Agents / Guardrails)は、単体理解ではなく組み合わせ設計で出題されます。「Agents のアクショングループで Lambda を呼び Knowledge Bases で根拠付けし、Guardrails で不適切出力を遮断する」といった多段アーキテクチャをユースケース別に描けるようにしておきましょう。

コスト最適化は Professional 試験の常連テーマです。Prompt Caching による入力トークン再利用、Batch Inference による最大 50% 割引、Provisioned Throughput の損益分岐点、Model Distillation によるコスト削減、Cross-region Inference Profile による容量確保の使い分けを整数レベルで把握しましょう。

責任ある AI は設計全域に関わる横断テーマです。Guardrails の 6 つのフィルタ種別(Content / Topic / Word / Sensitive Information / Contextual Grounding / Prompt Attack)と、EU AI Act の高リスク AI 要件、Model Invocation Logging / S3 アーカイブによる監査証跡を結び付けて理解しておきましょう。