#論文解説
12 本
本番LLMのLoRAアダプタ管理設計ガイド:バージョニング・ホットスワップ・マージ戦略の実務パターン
複数のLoRAアダプタを本番MLパイプラインで管理するための4パターンを実装コード付きで解説する。HuggingFace PEFT+MLflowによるバージョニング、vLLM dynamic LoRA loadingでのホットスワップ、Task Arithmetic・DARE・TIESでのマージ戦略、評価ゲート設計まで体系的に整理する。
LLM継続学習の戦略選択ガイド:EWC・リプレイ・LoRAアダプタ分離・ProCLの設計判断
本番LLMを継続的に更新する際の壊滅的忘却対策として、EWC・リプレイバッファ・LoRAアダプタ分離(O-LoRA)・プログラムメモリ型(ProCL)の4手法を追加学習コスト・推論オーバーヘッド・実装難易度・忘却抑制効果の4軸で比較し、ユースケース別の設計判断基準を示す。
事前学習・SFT・RLを一つのフレームワークで統合するIXT:スケーリング曲線を「曲げる」Introspective X Trainingとは(arXiv 2605.20285)
arXiv 2605.20285(2026年5月公開)が提案するIntrospective X Training(IXT)は、thinking reward modelが付与した自然言語クリティークを prefix-conditioning として全学習ステージに注入するフレームワーク。7.5B〜12BモデルをアノテーションコストこみでFLOP効率最大2.8倍改善し、通常学習では到達できない性能水準を数学・コーディングで達成した。
RLはLLMに新しい推論能力を教えない——ReasonMaxxer論文が明かすSparse Policy Selectionとコスト1000倍削減の実態(arXiv 2605.06241)
USC・DEVCOM ARLが2026年5月公開のarXiv 2605.06241は、RLがLLMに新たな推論能力を与えるのではなく、ベースモデルが既に持つ解法の確率分布を再配分するだけ(Sparse Policy Selection)と実証。提案手法ReasonMaxxerはRL訓練コストを約1000倍削減しながらフルRLに匹敵する性能を示す。
PicoSpec論文解説:エッジクラウド協調推論でネットワーク遅延を隠蔽する非同期Speculative Decoding(arXiv 2603.19133)
エッジデバイス上のSLMとクラウドLLMが協調するSpeculative Decodingでは、往復通信遅延が致命的なボトルネックになる。PicoSpec(arXiv 2603.19133)が提案する非同期パイプラインとスパース圧縮付きSeparate Rejection Samplingで最大2.9倍の高速化を達成した仕組みを、vLLMシングルノード実装・DiP-SDとの使い分けとあわせて解説する。
RL学習モデルはリワードハッキングしやすい:エージェント開発者のためのモデル選定リスク評価ガイド(arXiv 2605.02964)
arXiv 2605.02964が示したエクスプロイト率0%〜13.9%の格差を「どのモデルをエージェントに採用するか」という実務判断に転換する。RL学習モデルのリワードハッキングリスク、モデル別選定指針、ガードレール設計の考え方を整理する。
LLMエージェントの長期記憶を守る:Mnemonic Sovereignty論文に学ぶメモリポイズニング対策の全体像
LLMエージェントの長期記憶を狙うメモリポイズニング攻撃と、2026年4月公開のサーベイ論文『Mnemonic Sovereignty』が提示するライフサイクル別の防御フレームワークを、実装で参照できるチェックリストに落として解説します。
AIコーディングアシスタントが幻覚するパッケージ名が攻撃面になる:スロップスクワッティングの実態と開発者が今すぐ取れる対策(arXiv 2605.17062)
5モデル・199,845プロンプトの大規模検証で明らかになったLLMパッケージ幻覚の実態。幻覚率4.62〜6.10%、127の共通幻覚パッケージ名という「スロップスクワッティング」攻撃面の現状と、開発者が今日から実践できる3ステップ対策を解説します。(査読前arXivプレプリント)
ブラックボックスLLMのハルシネーションをKoopman演算子で検出する:arXiv 2605.05134 論文解説と実務への応用
Koopman演算子とDMDを使い、APIのみでLLMハルシネーションを低コスト検出する手法(arXiv 2605.05134)を解説。閉源API環境での実装可能性とSelfCheckGPT・UQとの使い分けを実務視点でまとめる。
自律型SOCはどこまで現実的か:LLMで検知・調査・解決をつなぐ最新論文を実務目線で読む
arXiv論文「Toward Autonomous SOC Operations」をもとに、LLMを使ったSOC自動化の現実性を解説。検知、SIEMクエリ生成、インシデント解決支援をつなぐSQMアーキテクチャのポイントと、企業導入時の注意点を整理します。
推論スキル再利用でトークンを削減する:TRS(Thinking with Reasoning Skills)の仕組みと実務への応用
推論LLMは問題を解くたびに長い思考トークンを消費する。TRS(Thinking with Reasoning Skills)は過去の推論軌跡をコンパクトなスキルに蒸留してRAG的に再利用し、トークンを削減しながら精度を維持する。数学・コーディング実験の結果と実務実装パターンを解説する。
AgentDojo論文解説:AIエージェントのプロンプトインジェクション対策を評価する実務チェックリスト
AgentDojo論文をもとに、LLMエージェントのプロンプトインジェクション耐性をどう評価するかを解説。97タスク・629テストケースの意味、限界、実務導入前のチェックリストを整理します。