たきびAIラボ TAKIBI · AI · LAB
💻

AI開発

DEV · 13 ARTICLES

コード生成・エージェント・MCP。実務で再現可能な粒度で、ハウツー・比較・レビュー・ニュースを横断的にまとめています。

本番LLMのLoRAアダプタ管理設計ガイド:バージョニング・ホットスワップ・マージ戦略の実務パターン
💻AI開発 ハウツー

複数のLoRAアダプタを本番MLパイプラインで管理するための4パターンを実装コード付きで解説する。HuggingFace PEFT+MLflowによるバージョニング、vLLM dynamic LoRA loadingでのホットスワップ、Task Arithmetic・DARE・TIESでのマージ戦略、評価ゲート設計まで体系的に整理する。

2026.05.31
LLM継続学習の戦略選択ガイド:EWC・リプレイ・LoRAアダプタ分離・ProCLの設計判断
💻AI開発 ハウツー

本番LLMを継続的に更新する際の壊滅的忘却対策として、EWC・リプレイバッファ・LoRAアダプタ分離(O-LoRA)・プログラムメモリ型(ProCL)の4手法を追加学習コスト・推論オーバーヘッド・実装難易度・忘却抑制効果の4軸で比較し、ユースケース別の設計判断基準を示す。

2026.05.30
PicoSpec論文解説:エッジクラウド協調推論でネットワーク遅延を隠蔽する非同期Speculative Decoding(arXiv 2603.19133)
💻AI開発 ハウツー

エッジデバイス上のSLMとクラウドLLMが協調するSpeculative Decodingでは、往復通信遅延が致命的なボトルネックになる。PicoSpec(arXiv 2603.19133)が提案する非同期パイプラインとスパース圧縮付きSeparate Rejection Samplingで最大2.9倍の高速化を達成した仕組みを、vLLMシングルノード実装・DiP-SDとの使い分けとあわせて解説する。

2026.05.23
LLMエージェントの長期記憶を守る:Mnemonic Sovereignty論文に学ぶメモリポイズニング対策の全体像
💻AI開発 論文解説

LLMエージェントの長期記憶を狙うメモリポイズニング攻撃と、2026年4月公開のサーベイ論文『Mnemonic Sovereignty』が提示するライフサイクル別の防御フレームワークを、実装で参照できるチェックリストに落として解説します。

2026.05.21
AIエージェントのアイデンティティ管理:JITエフェメラル認証情報とマルチエージェント認可伝播の実装ガイド
💻AI開発 ハウツー

長期APIキーをAIエージェントに渡し続けるリスクを理論と実例から解説。arXiv 2605.05440の認可伝播研究とNIST AI RMF・CSAのフレームワークをもとに、JITエフェメラル認証情報・暗号IDバインド・TTL強制・監査証跡の4要素で構成する設計パターンを実装ガイドとして提供する。

2026.05.17
LLMハルシネーション検出手法の選び方ガイド【2026年版】:SelfCheckGPT・Koopman・UQ・FactSelfCheckを実務で使い分ける
💻AI開発 ハウツー

LLMハルシネーション検出の3系統(サンプリング一貫性・Koopman/DMD・不確実性定量化)をAPIアクセス制約・コスト・精度・実装難易度の4軸で比較。ユースケース別の選択フローと実務での組み合わせ戦略を解説する。

2026.05.17
LLMエージェントの「過剰権限」を排除する:OWASP LLM06:2025 準拠の最小権限設計チェックリスト
💻AI開発 ハウツー

OWASP LLM06:2025「Excessive Agency」が定義する3次元リスク(機能・権限・自律性)を整理し、ツール権限スコープ絞り込み・認可委譲・Human-in-the-Loop設計・監査ログの実装チェックリストを提供する。

2026.05.13
ブラックボックスLLMのハルシネーションをKoopman演算子で検出する:arXiv 2605.05134 論文解説と実務への応用
💻AI開発 ハウツー

Koopman演算子とDMDを使い、APIのみでLLMハルシネーションを低コスト検出する手法(arXiv 2605.05134)を解説。閉源API環境での実装可能性とSelfCheckGPT・UQとの使い分けを実務視点でまとめる。

2026.05.09
推論スキル再利用でトークンを削減する:TRS(Thinking with Reasoning Skills)の仕組みと実務への応用
💻AI開発 ハウツー

推論LLMは問題を解くたびに長い思考トークンを消費する。TRS(Thinking with Reasoning Skills)は過去の推論軌跡をコンパクトなスキルに蒸留してRAG的に再利用し、トークンを削減しながら精度を維持する。数学・コーディング実験の結果と実務実装パターンを解説する。

2026.05.08
AgentDojo論文解説:AIエージェントのプロンプトインジェクション対策を評価する実務チェックリスト
💻AI開発 論文解説

AgentDojo論文をもとに、LLMエージェントのプロンプトインジェクション耐性をどう評価するかを解説。97タスク・629テストケースの意味、限界、実務導入前のチェックリストを整理します。

2026.05.07
【2026年版】Cursor 3.0 Agents Window 入門:マルチエージェント並列実行の開き方・使い方・実践ワークフロー
💻AI開発 ハウツー

Cursor 3.0で追加されたAgents Windowは、複数AIエージェントをgit worktree隔離環境で並列実行できる専用UI。開き方・タスク分割・/worktreeコマンド連携まで実務ワークフローをゼロから解説。

2026.05.04
AI開発環境でBunとNode.jsをどう選ぶか:2026年版の実務チェックリスト
💻AI開発 比較

Claude Code・Codex・Gemini CLIなどのAIコーディング環境で、Bun v1.3とNode.jsをどう選ぶべきかを実務目線で比較。速度、互換性、依存関係、チーム運用の観点から判断チェックリストを整理します。

2026.04.24
【2026年版】AI開発環境はuvで整える:Claude・Codex時代のPython環境構築ガイド
💻AI開発 ハウツー

Claude、Codex、Gemini CLI などのAI開発ワークフローでは、再現性のあるPython環境が重要です。uvでpip・venv・pyenv・Poetryを一本化し、AIコーディング時代の環境構築を解説します。

2026.04.23