Reader Hub
AI Agent — 完全入門

Hermes Agent完全入門

Hermes Agentは、ただ会話するAIではない。記憶を持ち、作業からスキルを学び、CLIの外側にあるチャットツールやサーバー上でも動かせる「長く育てるAIエージェント」だ。本書では、初めて触る人向けに、何ができるのか、どこから始めるべきか、周辺ツールをどう見ればよいかまで一気に整理する。

0
この記事を読む前に
Hermesは「AIに作業を頼む場所」ではなく「AIの作業環境そのもの」

ChatGPTのようにブラウザで会話して終わるのではなく、ローカル環境、VPS、Docker、SSH先、クラウド実行環境などに置いて、作業・記憶・自動化・外部連携をまとめて扱う。

ここを誤解すると、最初の印象がズレる。Hermesは「Claude Codeの代わりに使う単体ツール」というより、AIエージェントを長期稼働させるための土台だ。

本書の読み方

5つの構成要素 → セットアップ → 記憶/スキル/エコシステム → 権限設計と7日間ロードマップ。順番に降りていけば、Hermesを「面白そうなAIツール」ではなく「運用できるエージェント基盤」として理解できる。

PHASE 01

全体像 — Hermesとは何か

Lec.1〜2 / コンセプトと5つの部品で骨格を掴む

1
Hermes Agentは何が新しいのか
「毎回ゼロから話すAI」ではなく「使うほど文脈を蓄積するAI」

Hermes Agentの核心は、「毎回ゼロから話すAI」ではなく「使うほど文脈を蓄積するAI」を目指している点にある。公式ドキュメントでは、Nous Researchが作る自己改善型AIエージェントとして説明されている。

4つの特徴

  • 経験からスキルを作る
  • 利用中にスキルを改善する
  • セッションをまたいで記憶を使う
  • CLI以外のメッセージング環境からも動かせる
❌ 誤解
Claude Codeの代わりに使う「単体ツール」。ブラウザで会話して終わるAIチャット。
✅ 正しい理解
AIエージェントを長期稼働させるための「土台」。コード/調査/ファイル/記憶/スキル/cronを一つの運用に寄せる設計。
本質

Hermesは「AIに作業を頼む場所」ではなく「AIの作業環境そのもの」。ローカル・VPS・Docker・SSH先・クラウド実行環境に置いて、作業・記憶・自動化・外部連携をまとめて扱う。

2
最初に押さえるべき5つの構成要素
本体・道具・記憶・手順書・入口

Hermesを理解する近道は、機能名を暗記することではない。まず、全体を5つの部品に分けて見る。

1
本体 — 会話と作業を動かす中核。GitHub公式リポジトリにはCLI、ゲートウェイ、ツール、スキル、記憶、Web、TUIなどのディレクトリが並ぶ。会話画面だけで完結する設計ではなく、実行環境と連携環境を含むエージェント基盤。
2
ツール — 検索、抽出、ブラウズ、画像生成、TTS、MCP連携など、Webや外部機能を扱う機能群。AIが「考える」だけでなく「実行する」ための手足。
3
記憶MEMORY.mdUSER.mdを中心に構成される。前者は環境やプロジェクトの事実、後者はユーザーの好みや期待値を扱う。
4
スキル — 必要なときに読み込む知識文書。トークン使用量を抑えるための段階的な読み込みパターンを採用。作業手順を毎回プロンプトに詰め込むのではなく、必要な作業ごとに小さな手順書として呼び出す。
5
ゲートウェイ — Telegram、Discord、Slack、WhatsAppなど15以上のメッセージング環境からHermesを使う導線。CLIに閉じない。
覚え方

初心者は、この5つを「本体、道具、記憶、手順書、入口」と覚えると十分。機能名を全部覚える前に、まずこの粒度で全体像を持つ。

PHASE 02

セットアップ — 動かすための準備

Lec.3 / インストール前に知るべき前提と最初の入口コマンド

3
インストール前に知るべきこと
対応OS、依存関係、最初の1日でやるべきこと

Hermes Agentは、Linux、macOS、WSL2を主な対象にしている。公式インストールページではこの3環境向けの手順が示され、ネイティブWindowsはサポート外でWSL2利用が案内されている。

自動で入る依存関係

公式の説明では、インストーラーはGit以外の依存関係を自動で扱う。具体的には、Python 3.11、Node.js v22、ripgrep、ffmpegなどが挙げられている。

最初の一手

初心者が最初にやるべきは、複雑な依存関係を手で入れることではなく、Gitが入っているかを確認し、公式ドキュメントの手順に沿って進めること。インストール後はシェルを再読み込みしてhermesを起動する。

3つの入口コマンド

hermes model
モデル/プロバイダーを選ぶ
hermes tools
使うツールを調整する
hermes gateway setup
メッセージング連携を設定する
❌ NGなスタート
Web検索・ファイル操作・ターミナル実行・ブラウザ操作・メッセージング連携を初日から全部有効化。何が原因で動かないか分からなくなる。
✅ 安全なスタート
最初の1日はCLIで会話。モデル設定と基本ツールだけ確認。広げるのは2日目以降に分割する。
PHASE 03

コア機能 — 記憶・スキル・エコシステム

Lec.4〜6 / Hermesを「育てるAI」にする3つの仕組み

4
記憶システムは何を覚えるのか
MEMORY.md と USER.md / 文字数制限という設計思想

Hermes Agentの面白さは、記憶が明示的な仕組みとして用意されている点にある。基本記憶は~/.hermes/memories/配下のMEMORY.mdUSER.mdで管理される。

MEMORY.md(上限 2,200字)
エージェント側の作業メモ。環境、プロジェクト構成、運用ルール、作業で学んだこと。
USER.md(上限 1,375字)
ユーザー側のプロフィール。名前、役割、好み、コミュニケーションスタイル、期待値。
設計思想

Hermesの記憶は無限のメモ帳ではない。常に使う重要情報だけを短く残す設計。何でも保存するとAIは重要なことを見失う。文字数制限はむしろ実務的だ。

保存すべき記憶の例

  • 「このプロジェクトはGo 1.22とPostgreSQLを使う」
  • 「ユーザーは短い回答を好む」
  • 「このサーバーはSSHのポートが標準と違う」

つまり、次回も行動に影響する情報だけを残す。

注意:記憶はセッション開始時に注入される

記憶はセッション開始時にシステムプロンプトへ読み込まれる。セッション中に保存した記憶はディスクには反映されるが、同じ会話の最中にすぐシステムプロンプトへ再注入されるわけではない。これはパフォーマンスとキャッシュを守るための設計。

5
スキルはAIの手順書になる
毎回同じ説明を不要にする / 段階的読み込みでトークン節約

Hermesのスキルは、AIに読み込ませる作業手順書。~/.hermes/skills/が主要な保存場所で、新規インストール時には同梱スキルがコピーされ、Hubから入れたスキルやエージェントが作成したスキルもこの場所に入る。

スキル化に向く作業の例

PRを作る
繰り返しのGitワークフロー
調査レポートを書く
構造の決まった出力
データセットを整理する
前処理パイプライン
Slackに報告する
フォーマット固定の通知
段階的読み込み

スキルは最初は一覧だけを見せ、必要なときだけ全文や参照ファイルを読む。エージェントが大量の手順書を最初から全部読むのを避けるための仕組み。

初心者の最初の一歩

最初から自作スキルを量産する必要はない。まずは「自分が毎週繰り返す作業」を一つ選び、その作業の入力・手順・完了条件・失敗しやすい点を書き出す。

Hermesにとってスキルは才能ではなく、再利用できる作業メモだ。

6
周辺リソースはどう使い分けるか
公式・補助・運用・拡張・体験改善の5レイヤーで整理

提示されているリソース集は、大きく4種類(+体験改善系)に分けて見ると混乱しない。

1. 公式ドキュメントと公式リポジトリ

最初に読むべきなのは、Hermes Agent DocumentationとNousResearchのhermes-agentリポジトリ。インストール、クイックスタート、記憶、スキル、MCP、セキュリティ、アーキテクチャはここで確認する。

2. 理解補助のリソース

  • Hermes-Wiki — ソースコード理解の補助。公式の代替ではなく、実装を読むときの索引として扱う。
  • hermes-ecosystem(Hermes Atlas) — 周辺ツール・スキル・統合の地図。

3. 運用支援ツール

  • hermes-control-interface — セルフホスト型のWebダッシュボード。ターミナル、ファイル、セッション、cron、利用状況、複数エージェント管理を扱う。CLIだけで運用するのがつらくなった段階で検討するもの。

4. 拡張・実験用リポジトリ

hermes-skill-factory
作業フローを再利用可能なスキルに変える実験的拡張
maestro
複数の外部CLI/エージェントをまたぐ作業指揮
hermes-agent-camel
CaMeLの信頼境界を組み込んだHermes Agentフォーク

5. 体験改善系

hermes-hud
~/.hermes/を読みTUIで会話・スキル・記憶容量・ツール利用を可視化
hermes-alpha
クラウド環境でHermesを動かす実験
awesome-hermes-agent
コミュニティのリンク集
導入順

全部を一気に入れない。公式を動かす → 記憶を理解する → スキルを一つ作る → 運用可視化を足す → 必要に応じて周辺ツールを試す。この順番で十分。

PHASE 04

運用 — 権限設計と7日間ロードマップ

Lec.7〜8 / 安全に長期稼働させるための土台と入門スケジュール

7
セキュリティで最初に気をつけること
「便利さ」より先に「権限の境界」を設計する

Hermes Agentは便利だが、実行できる範囲が広いほどリスクも増える。AIエージェントを長期稼働させるなら、セキュリティ設定は後回しにできない。

公式のSecurityページでは、危険なコマンドの承認、永続的な許可リスト、メッセージングゲートウェイのユーザー認可などが説明されている。ゲートウェイ経由の操作では、プラットフォーム別の許可、DMペアリング、許可ユーザーリスト、全体許可リスト、全員許可の順で認可が扱われる。デフォルトは拒否

❌ 避けるべき
「便利だから」という理由で実行権限を全開放。誤操作・プロンプト注入・外部入力の影響を一気に受ける。
✅ 推奨
作業ディレクトリを限定。APIキーは .env で管理しチャットに貼らない。ゲートウェイ公開時は許可ユーザーを明示。

4つのチェック項目

  • 作業ディレクトリを限定する
  • APIキーは .env や設定ファイルで管理し、チャットに貼らない
  • ゲートウェイを公開する場合は、許可ユーザーを明示する
  • 危険なコマンドを永続許可する前に、本当に毎回承認を省く必要があるかを確認する
設計の原則

Hermesの強みは、AIを自分の作業環境に近づけられること。だからこそ、最初から「便利さ」ではなく「権限の境界」を設計する。

8
初心者向けの実践ロードマップ
7日間で「運用できるエージェント基盤」として理解する

最短で理解したいなら、7日間で触る範囲を区切る。

1
1日目 — 起動 / 公式ドキュメントのGetting StartedとInstallationを読み、CLIで起動する。モデル設定と基本会話だけで十分。
2
2日目 — 設定hermes modelhermes toolsを確認。どのモデルを使うか、どのツールを許可するかを把握する。
3
3日目 — 小さく任せる / ローカルのREADMEを要約させる、メモを整理させる、簡単なスクリプトを作らせる。低リスクな作業を1つ。
4
4日目 — 記憶を整える / 何を覚えるべきか、何を覚えないべきかを見る。環境情報・プロジェクトルール・ユーザーの好みのような再利用価値の高い情報だけ残す。
5
5日目 — スキルを使う / 既存スキルを呼び出すか、自分の定型作業を短い手順書にする。入力・手順・完了条件・注意点の4つを書くだけで十分。
6
6日目 — 連携と自動化 / メッセージング連携やcronを検討。ただし、外部に公開する場合は許可ユーザーと実行権限を先に絞る。
7
7日目 — 周辺ツールを1つ / 可視化ならHermes HUD、Web管理画面ならHermes Control Interface、エコシステム探索ならHermes AtlasやAwesome Hermes Agent。
7日間の到達点

この順番で触ると、Hermesを「面白そうなAIツール」ではなく「運用できるエージェント基盤」として理解できる。

全体振り返り — 学んだことの全リスト

PHASE 01 — 全体像
使うほど文脈を蓄積するAI
AIの作業環境そのもの
5要素:本体・道具・記憶・手順書・入口
CLIに閉じない設計
PHASE 02 — セットアップ
Linux/macOS/WSL2 対応
Git以外は自動インストール
3つの入口:model / tools / gateway
初日は CLI 会話だけで十分
PHASE 03 — コア機能
MEMORY.md は2,200字 / USER.md は1,375字
記憶は次の判断に効くものだけ短く
記憶はセッション開始時に注入
スキルは段階的に読み込む手順書
周辺リソースは公式→補助→運用→拡張の順
PHASE 04 — 運用
デフォルトは「拒否」
作業ディレクトリと許可ユーザーを限定
便利さより権限の境界を先に設計
7日間で運用基盤として理解
本質メッセージ

Hermes Agentの本質は「AIに何を頼むか」ではなく「AIが次回もっと上手く働ける環境をどう作るか」。記憶を整理し、スキルを増やし、権限を設計するほど、Hermesは単発のAIチャットから長期稼働する生産性エンジンに近づく。