#プロンプトインジェクション

7 本

SecurityLingua論文解説：プロンプト圧縮でジェイルブレークの「真の意図」を検出する軽量防御手法（arXiv 2506.12707）

Microsoft Research が提案する SecurityLingua（arXiv 2506.12707）は、プロンプト圧縮器が悪意ある入力の真の意図を抽出し LLM の安全ガードレールを起動する推論時防御手法。クラウド API に依存しないセルフホスト環境向けの仕組み・実験結果・実務への応用を解説します。

2026.06.10

🛡️サイバーセキュリティニュース

NISTがAI専用サイバーセキュリティフレームワーク草案を公開：NIST IR 8596「Cyber AI Profile」が示すLLMシステムの新たなリスク管理指標

NISTがCSF 2.0の全6機能をAI固有リスクにマッピングした「Cyber AI Profile（NIST IR 8596）」初期公開草案（IPRD）を解説。プロンプトインジェクション・データポイズニング・モデル窃取など生成AIに直結するリスクカテゴリと、組織レベルでのリスク管理フレームワーク採用の意義をCISO・情報システム担当者向けに整理します。

2026.06.03

🛡️サイバーセキュリティハウツー

Llama Guard 4 + GARAKでLLMアプリの安全性を自動検証する：入出力セーフガードの組み込みとレッドチーム自動化の実践ガイド

Llama Guard 4（12Bパラメータ・マルチモーダル）をサイドカー分類器として組み込む実装パターンと、GARAKによる自動レッドチームをGitHub Actions CIに統合する週次スキャン設計を実装コード付きで解説します。

2026.05.25

🛡️サイバーセキュリティハウツー

Azure AI Content Safety Prompt Shields 実装ガイド：直接・間接プロンプトインジェクション検知とGroundedness APIでRAGの事実乖離を防ぐ

Azure AI Content Safety の Prompt Shields（直接・間接インジェクション検知）と Groundedness Detection（RAG 事実乖離検知）を Python SDK で実装する方法を解説。リソース作成からコード例・コスト・既存フィルタとの使い分けまで実務目線でまとめます。

2026.05.24

🛡️サイバーセキュリティニュース

プロンプトが「シェル」になる日——Microsoft Semantic Kernel の RCE 脆弱性（CVE-2026-26030 / 25592）と即時対策

2026年5月7日、MicrosoftがSemantic KernelフレームワークのRCE脆弱性2件を公開。プロンプトインジェクション経由でホスト上での任意コード実行が可能。影響バージョン・即時対応手順・設計上の教訓を解説。

2026.05.15

🛡️サイバーセキュリティハウツー

MCPのtool poisoning・rug pull・サプライチェーン攻撃から守る：LLMアプリ開発者のための防御設計チェックリスト

MCP固有の3リスク（tool poisoning・rug pull・サプライチェーン攻撃）を解説し、STRIDE/DREADフレームワークの脅威分析をもとに、今すぐ実装できる3層防御チェックリストを日本語で提供します。

2026.05.12

💻AI開発論文解説

AgentDojo論文解説：AIエージェントのプロンプトインジェクション対策を評価する実務チェックリスト

AgentDojo論文をもとに、LLMエージェントのプロンプトインジェクション耐性をどう評価するかを解説。97タスク・629テストケースの意味、限界、実務導入前のチェックリストを整理します。

2026.05.07