Hermes Agent完全入門
Hermes Agentは、ただ会話するAIではない。記憶を持ち、作業からスキルを学び、CLIの外側にあるチャットツールやサーバー上でも動かせる「長く育てるAIエージェント」だ。本書では、初めて触る人向けに、何ができるのか、どこから始めるべきか、周辺ツールをどう見ればよいかまで一気に整理する。
ChatGPTのようにブラウザで会話して終わるのではなく、ローカル環境、VPS、Docker、SSH先、クラウド実行環境などに置いて、作業・記憶・自動化・外部連携をまとめて扱う。
ここを誤解すると、最初の印象がズレる。Hermesは「Claude Codeの代わりに使う単体ツール」というより、AIエージェントを長期稼働させるための土台だ。
5つの構成要素 → セットアップ → 記憶/スキル/エコシステム → 権限設計と7日間ロードマップ。順番に降りていけば、Hermesを「面白そうなAIツール」ではなく「運用できるエージェント基盤」として理解できる。
Hermes Agentの核心は、「毎回ゼロから話すAI」ではなく「使うほど文脈を蓄積するAI」を目指している点にある。公式ドキュメントでは、Nous Researchが作る自己改善型AIエージェントとして説明されている。
4つの特徴
- ▶経験からスキルを作る
- ▶利用中にスキルを改善する
- ▶セッションをまたいで記憶を使う
- ▶CLI以外のメッセージング環境からも動かせる
Hermesは「AIに作業を頼む場所」ではなく「AIの作業環境そのもの」。ローカル・VPS・Docker・SSH先・クラウド実行環境に置いて、作業・記憶・自動化・外部連携をまとめて扱う。
Hermesを理解する近道は、機能名を暗記することではない。まず、全体を5つの部品に分けて見る。
MEMORY.mdとUSER.mdを中心に構成される。前者は環境やプロジェクトの事実、後者はユーザーの好みや期待値を扱う。初心者は、この5つを「本体、道具、記憶、手順書、入口」と覚えると十分。機能名を全部覚える前に、まずこの粒度で全体像を持つ。
Hermes Agentは、Linux、macOS、WSL2を主な対象にしている。公式インストールページではこの3環境向けの手順が示され、ネイティブWindowsはサポート外でWSL2利用が案内されている。
自動で入る依存関係
公式の説明では、インストーラーはGit以外の依存関係を自動で扱う。具体的には、Python 3.11、Node.js v22、ripgrep、ffmpegなどが挙げられている。
初心者が最初にやるべきは、複雑な依存関係を手で入れることではなく、Gitが入っているかを確認し、公式ドキュメントの手順に沿って進めること。インストール後はシェルを再読み込みしてhermesを起動する。
3つの入口コマンド
Hermes Agentの面白さは、記憶が明示的な仕組みとして用意されている点にある。基本記憶は~/.hermes/memories/配下のMEMORY.mdとUSER.mdで管理される。
Hermesの記憶は無限のメモ帳ではない。常に使う重要情報だけを短く残す設計。何でも保存するとAIは重要なことを見失う。文字数制限はむしろ実務的だ。
保存すべき記憶の例
- ▶「このプロジェクトはGo 1.22とPostgreSQLを使う」
- ▶「ユーザーは短い回答を好む」
- ▶「このサーバーはSSHのポートが標準と違う」
つまり、次回も行動に影響する情報だけを残す。
注意:記憶はセッション開始時に注入される
記憶はセッション開始時にシステムプロンプトへ読み込まれる。セッション中に保存した記憶はディスクには反映されるが、同じ会話の最中にすぐシステムプロンプトへ再注入されるわけではない。これはパフォーマンスとキャッシュを守るための設計。
Hermesのスキルは、AIに読み込ませる作業手順書。~/.hermes/skills/が主要な保存場所で、新規インストール時には同梱スキルがコピーされ、Hubから入れたスキルやエージェントが作成したスキルもこの場所に入る。
スキル化に向く作業の例
スキルは最初は一覧だけを見せ、必要なときだけ全文や参照ファイルを読む。エージェントが大量の手順書を最初から全部読むのを避けるための仕組み。
初心者の最初の一歩
最初から自作スキルを量産する必要はない。まずは「自分が毎週繰り返す作業」を一つ選び、その作業の入力・手順・完了条件・失敗しやすい点を書き出す。
Hermesにとってスキルは才能ではなく、再利用できる作業メモだ。
提示されているリソース集は、大きく4種類(+体験改善系)に分けて見ると混乱しない。
1. 公式ドキュメントと公式リポジトリ
最初に読むべきなのは、Hermes Agent DocumentationとNousResearchのhermes-agentリポジトリ。インストール、クイックスタート、記憶、スキル、MCP、セキュリティ、アーキテクチャはここで確認する。
2. 理解補助のリソース
- ▶
Hermes-Wiki— ソースコード理解の補助。公式の代替ではなく、実装を読むときの索引として扱う。 - ▶
hermes-ecosystem(Hermes Atlas) — 周辺ツール・スキル・統合の地図。
3. 運用支援ツール
- ▶
hermes-control-interface— セルフホスト型のWebダッシュボード。ターミナル、ファイル、セッション、cron、利用状況、複数エージェント管理を扱う。CLIだけで運用するのがつらくなった段階で検討するもの。
4. 拡張・実験用リポジトリ
5. 体験改善系
~/.hermes/を読みTUIで会話・スキル・記憶容量・ツール利用を可視化全部を一気に入れない。公式を動かす → 記憶を理解する → スキルを一つ作る → 運用可視化を足す → 必要に応じて周辺ツールを試す。この順番で十分。
Hermes Agentは便利だが、実行できる範囲が広いほどリスクも増える。AIエージェントを長期稼働させるなら、セキュリティ設定は後回しにできない。
公式のSecurityページでは、危険なコマンドの承認、永続的な許可リスト、メッセージングゲートウェイのユーザー認可などが説明されている。ゲートウェイ経由の操作では、プラットフォーム別の許可、DMペアリング、許可ユーザーリスト、全体許可リスト、全員許可の順で認可が扱われる。デフォルトは拒否。
.env で管理しチャットに貼らない。ゲートウェイ公開時は許可ユーザーを明示。
4つのチェック項目
- ▶作業ディレクトリを限定する
- ▶APIキーは
.envや設定ファイルで管理し、チャットに貼らない - ▶ゲートウェイを公開する場合は、許可ユーザーを明示する
- ▶危険なコマンドを永続許可する前に、本当に毎回承認を省く必要があるかを確認する
Hermesの強みは、AIを自分の作業環境に近づけられること。だからこそ、最初から「便利さ」ではなく「権限の境界」を設計する。
最短で理解したいなら、7日間で触る範囲を区切る。
hermes modelとhermes toolsを確認。どのモデルを使うか、どのツールを許可するかを把握する。この順番で触ると、Hermesを「面白そうなAIツール」ではなく「運用できるエージェント基盤」として理解できる。
全体振り返り — 学んだことの全リスト
Hermes Agentの本質は「AIに何を頼むか」ではなく「AIが次回もっと上手く働ける環境をどう作るか」。記憶を整理し、スキルを増やし、権限を設計するほど、Hermesは単発のAIチャットから長期稼働する生産性エンジンに近づく。
参考リンク
- 公式ドキュメントhermes-agent.nousresearch.com/docs
- Installationgetting-started/installation
- Persistent Memoryuser-guide/features/memory
- Skills Systemuser-guide/features/skills
- Securityuser-guide/security
- Architecturedeveloper-guide/architecture
- 本体リポジトリNousResearch/hermes-agent
- Hermes-Wikicclank/Hermes-Wiki
- hermes-ecosystemksimback/hermes-ecosystem
- Control Interfacexaspx/hermes-control-interface
- Skill FactoryRomanescu11/hermes-skill-factory
- maestroReinaMacCredy/maestro
- hermes-agent-camelnativ3ai/hermes-agent-camel
- hermes-hudjoeynyc/hermes-hud
- hermes-alphakaminocorp/hermes-alpha
- awesome-hermes-agent0xNyk/awesome-hermes-agent