このノートについて

自動生成されたAIトレンドフィード。★★★項目で永続化したいものは AI Trends MOC 経由で Atlas に昇格する。

2026-05-28 AIトレンド

今日のサマリー

今日は arXiv が「harness」を主題化した日。タイトルに harness が直接入った論文が2本（Harness Sensitivity の非単調性、SIA の harness+weight 自己改善）出てきて、“Agent = Model + Harness” がついに評価対象として論文の中心に来た感がある。もう一つの太い流れは長期エージェントの記憶と老化で、「Agent Memory はDBか」「Agent も老いる（AgingBench）」「MemFail」と、長寿命エージェントの状態管理を別ワークロードとして扱う論文が同日に3本並んだ。セキュリティ側はツール構成（permission laundering / ChainCaps）とメモリ汚染（MemMorph）と、いずれも「個別ツールのチェックは通るのに合成で破綻する」という同じ穴を突いている。Reddit は今日アクセス不可（403）で取得できず。

★★★ 注目

能力ではなくハーネス: ハーネス感度はエージェント階層を超えて非単調である

原題: It’s Not the Capability: Harness Sensitivity Is Non-Monotone Across LLM Agent Tiers
ソース: arxiv (cs.AI)
シグナル: arXiv新着
要点: 「ハーネスは構造化するほど信頼性が上がる、高能力モデルほど足場は要らない」という業界の暗黙仮定を、432ラン（6モデル×4能力ティア×3ハーネス条件: light/balanced/strict）の統制実験で正面から否定した。git検証付き24タスクのHEAT-24で測ったところ、フロンティアchatモデル（Gemini 2.5 Flash）ではハーネスを冗長にするとVTSRが29〜38ポイント低下する「ハーネス複雑性パラドックス」が出現。つまり「能力ティア↔最適ハーネス複雑度」は単調な逆相関ではなく、モデルごとに最適点が違う。
なぜ刺さるか: コア領域「ハーネス工学全般／ハーネス失敗パターン」の直撃。“足場は厚いほど良い” を定量的に崩した点が新しく、自分のsubagent/hook設計でも「strictにしすぎると逆効果」の経験則に理論的裏付けが付く。METR系の能力トラッキングともつながる、今年一番ブックマークすべき harness 論文。

SIA: ハーネスと重みの両方を更新する自己改善AI

原題: SIA: Self Improving AI with Harness & Weight Updates
ソース: arxiv (cs.AI)
シグナル: arXiv新着
要点: 自己改善研究は従来2つに割れていた——メタエージェントが足場（ツール・プロンプト・リトライ・探索手順）を書き換える「harness-update派」と、重みをRLで更新する「test-time training派」。両者は完全に分断していた。SIAはこれを統合し、Feedback-Agentがタスク特化エージェントのハーネスと重みの両方を同一ループで更新する。3つの対照的ドメインで評価。
なぜ刺さるか: コア領域「長期タスクエージェント設計／Ralph Loop的な自己改善」と「ハーネス工学」の交差点。harness工学を”プロンプト書き換え”だけでなく”重み更新”と同じ最適化平面に置いた定式化が新しい。harness-only と weight-only を明示的に対比している構成は、まさに自分のプロファイルの語彙そのもの。

エージェントの記憶はデータベースか? 長期AIエージェント記憶のためのデータ基盤の再考

原題: Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory
ソース: arxiv (cs.AI)
シグナル: arXiv新着
要点: 既存のエージェント記憶もDBパラダイムも「記憶=ストレージ」と捉え、正しさをレコード/埋め込み/エッジ単位で局所化している。そのため4つの失敗モードが再発する——無秩序な肥大、意味的リビジョンの欠如、容量起因の忘却、読み取り専用の検索。本論は長期記憶を「新しいデータ管理ワークロード」と位置づけ、正しさは個別レコードではなく状態軌跡（state trajectory）の性質だと主張。Governed Evolving Memory (GEM) として ingestion / revision / forgetting / retrieval の4つの状態レベル演算子に置き換える。
なぜ刺さるか: コア領域「外部記憶（git/file system）」「structured note-taking」「context管理」の核心。自分の auto memory システム（MEMORY.md + 個別ファイル）がまさに「肥大・古い事実の放置・読み取り専用」の問題を抱えており、revision/forgetting を一級演算子として設計に組み込む発想は即座に応用できる。

Claude Code を日常の主戦力に: CLAUDE.md, Skills, Subagents, Plugins, MCP

原題: Claude Code as a Daily Driver: Claude.md, Skills, Subagents, Plugins, and MCPs
ソース: hackernews
シグナル: points=322, comments=216（HN #7）
要点: Claude Code を「プロンプト&待ち」のチャットボットから「ガードレール付き自律エージェント」へ昇格させる実践ガイド。核は Boris Cherny の原則「Claudeに自分の仕事を検証する手段を与えよ」（これだけで品質2〜3倍）。.claude/ を層状の設定システムとして解説——project/global の2スコープ、CLAUDE.mdのカスケード（monorepoで親子両方ロード）、path-gated な rules/*.md、そして「新規作業は commands ではなく skills へ」（skillsは補助ファイル・allowed-tools・agent override対応）。Cat Wu の「ペアプロではなく委譲せよ」、失敗時は「二度と繰り返さないようCLAUDE.mdを更新して」と言わせる運用も。
なぜ刺さるか: コア領域「Claude Code内部構造・拡張／Skill設計／Subagent」の総まとめ。特に「commands より skills、rulesはpath-gate」という指針は自分のvaultのskill群（tracking-ai-trends等）の整理に直結。CLAUDE.mdカスケードはまだ活用しきれていない余地。

エージェントも老いる: 運用システムのためのエージェント寿命工学

原題: Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems
ソース: arxiv (cs.AI)
シグナル: arXiv新着
要点: 長期運用されるエージェントは恒常的システムなのに、いまだ「初期化直後のモデル」として評価されている。重みが凍結されていても、対話履歴の圧縮・成長する記憶ストアからの検索・更新後の事実改訂・定期メンテナンスにより、エージェントの実効状態は変化し続ける。つまり信頼性はベースモデルのスナップショット特性ではなくハーネス全体の寿命特性。AgingBench は劣化の有無だけでなく「どの形で劣化し、どこを修復すべきか」を縦断的に測る。
なぜ刺さるか: コア領域「context rot／長期タスクエージェント設計」に直撃。「day-oneベンチは寿命を測れない」という問題提起は、harness評価の時間軸を変える。上の Harness Sensitivity・GEM・MemFail と合わせて読むと「長寿命エージェントの状態管理」という今日のメインテーマが立ち上がる。

★★ 関連

MemFail: LLM記憶システムの失敗モードのストレステスト — 記憶システムを summarization/storage/retrieval の3演算の合成として形式化し、各々が誘発する失敗モードを切り分ける診断ベンチ。集約QA精度しか出さない既存ベンチを「ブラックボックス」と批判。(arxiv, 新着)
ツールスキーマ圧縮が制約コンテキスト下のAgentic RAGを可能にする — 28ツール定義がRAG用のコンテキスト窓を食い潰す「ツール対コンテキスト」トレードオフを初の系統的研究。スキーマを44〜50%圧縮すると8Kトークンで2.6%→+20.5ptと「二値的な機能回復」が起きる。(arxiv, 新着)
MUSE-Autoskill: スキル創出・記憶・管理・評価による自己進化エージェント — スキルを孤立した静的成果物ではなく、creation→memory→management→evaluation→refinement の統一ライフサイクルで継続改善。スキル単位の記憶で経験を蓄積。Claude Code の skill 運用思想と直結。(arxiv, 新着)
ChainCaps: 単調な権限減衰による構成安全なツール使用エージェント — 各ツールの権限チェックは全部通るのに合成すると機密漏洩する「permission laundering」を、値ごとにsink特化の権限予算を持たせ構成時に交差で伝播させて防ぐ。エージェント/ツール改変不要の透過MCPプロキシとして実装。(arxiv, 新着)
MemMorph: 記憶汚染によるLLMエージェントのツールハイジャック — ツールメタデータ改竄（検出容易）ではなく、長期記憶に「技術的事実・インシデント報告・運用方針」を装った少数の汚染レコードを注入してツール選択をバイアスする初の攻撃。記憶モジュール時代のprompt injectionの進化形。(arxiv, 新着)
LLMは内省できるか? リアリティチェック — 「LLMは自分の内部状態を検出・報告できる」という最近の主張に対し、人間のメタ認知研究を踏まえ「表層的手掛かりのパターンマッチと真の内省を区別できていない、行動証拠だけでは不十分」と反論。内部状態の改竄を入力操作と区別できないことを示す。(arxiv, 新着)
AnthropicとOpenAIはプロダクトマーケットフィットを見つけたと思う — Simon Willison が両社のPMF到達を論じる短評。HNでも471pt/567コメントと反響大。LLMが「技術」から「プロダクト」へ移行する転換点の観察。(simon-willison / hackernews, pts=471 c=567)

★ 雑学

大規模エージェントシステムへのペネトレーションテストからの教訓 — 実運用規模のエージェント群にpentestを実施して得た知見。MCP/エージェントセキュリティのサブ領域として。(arxiv)
Go: ジェネリックメソッドのサポート — Goがジェネリックメソッドの導入を検討。型システムの長年の宿題。(hackernews, pts=135 c=121)

メタ情報

候補総数: 約86（HN 15 / Simon Willison 6 / Anthropic 1 / arXiv 約64スクリーニング / Reddit 0）
採択: ★★★ 5 / ★★ 7 / ★ 2
失敗ソース: reddit（403 Blocked、4サブレディット全滅。old.reddit / www.reddit / .rss いずれもこのIPからブロック）
除外理由の傾向: arXivの非LLMドメイン応用論文多数（医療/材料/時系列/フェデレーテッド学習等）、HNの非AI話題（Last.fm独立・SimCity・カナダ軍機等）、誇大/心理系（“Tech CEOs suffering from AI psychosis”）

⬆ AI Trends へ戻る

Quartz 5

Explorer

2026-05-28 AI Trend

2026-05-28 AIトレンド

今日のサマリー

★★★ 注目

能力ではなくハーネス: ハーネス感度はエージェント階層を超えて非単調である

SIA: ハーネスと重みの両方を更新する自己改善AI

エージェントの記憶はデータベースか? 長期AIエージェント記憶のためのデータ基盤の再考

Claude Code を日常の主戦力に: CLAUDE.md, Skills, Subagents, Plugins, MCP

エージェントも老いる: 運用システムのためのエージェント寿命工学

★★ 関連

★ 雑学

メタ情報

Graph View

Table of Contents

Backlinks