たきびAIラボ TAKIBI · AI · LAB

#プロンプトインジェクション

5 本
Llama Guard 4 + GARAKでLLMアプリの安全性を自動検証する:入出力セーフガードの組み込みとレッドチーム自動化の実践ガイド
🛡️サイバーセキュリティ ハウツー

Llama Guard 4(12Bパラメータ・マルチモーダル)をサイドカー分類器として組み込む実装パターンと、GARAKによる自動レッドチームをGitHub Actions CIに統合する週次スキャン設計を実装コード付きで解説します。

2026.05.25
Azure AI Content Safety Prompt Shields 実装ガイド:直接・間接プロンプトインジェクション検知とGroundedness APIでRAGの事実乖離を防ぐ
🛡️サイバーセキュリティ ハウツー

Azure AI Content Safety の Prompt Shields(直接・間接インジェクション検知)と Groundedness Detection(RAG 事実乖離検知)を Python SDK で実装する方法を解説。リソース作成からコード例・コスト・既存フィルタとの使い分けまで実務目線でまとめます。

2026.05.24
プロンプトが「シェル」になる日——Microsoft Semantic Kernel の RCE 脆弱性(CVE-2026-26030 / 25592)と即時対策
🛡️サイバーセキュリティ ニュース

2026年5月7日、MicrosoftがSemantic KernelフレームワークのRCE脆弱性2件を公開。プロンプトインジェクション経由でホスト上での任意コード実行が可能。影響バージョン・即時対応手順・設計上の教訓を解説。

2026.05.15
MCPのtool poisoning・rug pull・サプライチェーン攻撃から守る:LLMアプリ開発者のための防御設計チェックリスト
🛡️サイバーセキュリティ ハウツー

MCP固有の3リスク(tool poisoning・rug pull・サプライチェーン攻撃)を解説し、STRIDE/DREADフレームワークの脅威分析をもとに、今すぐ実装できる3層防御チェックリストを日本語で提供します。

2026.05.12
AgentDojo論文解説:AIエージェントのプロンプトインジェクション対策を評価する実務チェックリスト
💻AI開発 論文解説

AgentDojo論文をもとに、LLMエージェントのプロンプトインジェクション耐性をどう評価するかを解説。97タスク・629テストケースの意味、限界、実務導入前のチェックリストを整理します。

2026.05.07