会話するたびに賢くなる自己改善型 AI エージェント「Hermes Agent」— スキル自動生成・Telegram 連携・マルチ LLM 対応
会話するたびに賢くなる自己改善型 AI エージェント「Hermes Agent」— スキル自動生成・Telegram 連携・マルチ LLM 対応
ひとことでいうと
Hermes Agent は、AI 研究機関 Nous Research が開発した「自己改善型 AI エージェント」です。会話を重ねるたびにスキル(操作手順)を自動で蓄積し、次のセッションでそれを再利用して、だんだん賢くなっていきます。CLI(文字で命令を送る画面)から始まり、Telegram・Discord・Slack・WhatsApp・Signal など使い慣れたアプリでも同じエージェントを操作できます。月 5 ドル程度の安価なサーバーから、クラウドの GPU クラスターまで幅広い環境で動かせる点も魅力です。
こんな人におすすめ
1. 自分の PC 以外でコードを書いたりデプロイしたりしたい開発者・エンジニア
Hermes はコマンドの実行先として、手元の PC だけでなく Docker・SSH・Daytona・Singularity・Modal(クラウド実行サービス)など 6 種類の「ターミナルバックエンド(実行環境)」を選べます。クラウド環境では使っていない間のコストがほぼゼロになるので、必要なときだけ動かす使い方にも向いています。
2. AI モデルの学習データを集めたい研究者・ML エンジニア
バッチ軌跡生成(エージェントの操作履歴をまとめて記録すること)や、強化学習(試行錯誤でモデルを鍛える手法)用のフレームワーク「Atropos」との連携により、ツール呼び出しモデルの次世代トレーニングデータを効率よく収集・圧縮できます。スキルの共有規格 agentskills.io にも対応しており、コミュニティが公開しているスキルをそのまま取り込めます。
3. 定期タスクを自動化したい個人・チームのユーザー
「毎朝 7 時にニュースを要約して Telegram に送る」「週に一度バックアップを実行する」といった定期作業を、コードを書かずに自然言語(普通の日本語)で設定できます。内蔵の cron スケジューラー(タイマー機能)が、指定した時間に自動で動いてくれます。
インストール・使い方
Step 1: インストール(Linux / macOS / WSL2 対応)
ターミナル(文字で命令を送る画面)を開いて、次のコマンドをコピー&ペーストしてください。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc # zsh を使っている場合は source ~/.zshrc
インストーラーがお使いの OS に合わせたセットアップを自動で行います。Android(Termux という無料アプリ)でも動作しますが、その場合は .[termux] と呼ばれる軽量版の構成を使う形になります。
Step 2: 初期セットアップ
hermes setup # セットアップウィザードを起動(質問に答えるだけで設定完了)
hermes model # 使う AI モデル(LLM)を選ぶ
hermes tools # 有効にする機能セットを選ぶ
hermes setup を実行すると、どのモデルを使うか・API キー(サービスを使うための認証コード)をどこに登録するかを、画面の質問に答えながらまとめて設定できます。以前に「OpenClaw」という類似ツールを使っていた場合は、設定・メモリ・スキルを自動で引き継ぐ移行機能も用意されています。
Step 3: 会話を始める
hermes # 対話モードを起動(チャットのように話しかけられる)
hermes -q "Pythonでフィボナッチ数列を実装して" # 一問一答モード(実行後に終了)
-q オプションは「1 つの質問だけ答えて終わる」モードです。スクリプトや自動化と組み合わせるときに便利です。
Step 4: メッセージングアプリとつなぐ(Telegram など)
hermes gateway setup # Telegram / Discord などのアプリを設定する
hermes gateway start # ゲートウェイ(橋渡し役)を起動する
ゲートウェイを起動しておけば、パソコンを閉じた後もクラウド上でエージェントが動き続け、スマートフォンの Telegram から指示を送ることができます。
動かしてみた
Docker(アプリを隔離して動かす仮想環境)上の Python 3.12 環境でリポジトリ(ソースコードの置き場)を展開し、依存パッケージのインストールと CLI の動作確認を行いました。pip(Python のパッケージ管理ツール)によるインストールは問題なく完了し、hermes_cli/ と environments/ の各モジュールが正しく配置されていることを確認しています。
CLI の --help オプションでは、--query(-q)フラグや --toolsets フラグが表示され、用途に合わせた最小構成での起動が設計レベルで意識されていることがわかります。
NAME
cli.py - Hermes Agent CLI - Interactive AI Assistant
FLAGS
--query=QUERY Single query to execute (then exit). Alias: -q
-t, --toolsets=TOOLSETS
コードの構造は environments/(エージェントループ・実行環境の定義)と hermes_cli/(CLI・ゲートウェイ・モデル切り替え・スキル設定など)の 2 層に明確に分かれており、用途ごとの拡張や読解がしやすい設計です。
デモについて
Hermes Agent は AI モデルの API キー(サービス利用のための認証コード)が必要なため、ブラウザ上で今すぐ試せるオンラインデモは提供していません。ローカル PC や VPS(仮想専用サーバー)での動作を前提とした CLI ツールで、hermes setup からわずか数ステップで起動できます。費用を抑えてまず試してみたい場合は、200 種以上のモデルを一元管理できる「OpenRouter」の無料枠を使うのがおすすめです。
はじめの一歩:よく使うコマンドとコツ
Hermes を使い始めるときは、次の流れで進めると迷いにくいです。
- まず
hermes doctorを実行して、設定が正しいかシステムの診断を行う hermes modelでモデルを選ぶ(例:openrouter:meta-llama/llama-3.3-70b-instruct)hermes toolsでツールを絞り込み、必要な機能だけを有効にする- スキルは
/スキル名で呼び出せ、/skillsで一覧を確認できる
hermes doctor # 設定・動作の問題を自動診断する
hermes model # AI モデルを切り替える
/skills # 蓄積したスキルの一覧を表示
/new # 会話の記録をリセットして新しいセッションを始める
/compress # 会話の文脈を圧縮してトークン(処理量)を節約する
/usage # これまでのトークン使用量を確認する
セッション(会話の一区切り)をまたいだ過去の記憶検索には FTS5(SQLite という軽量データベースに内蔵された全文検索エンジン)が使われているため、「先週話したあのタスクの続き」を自然な言葉で引き出すことができます。モデルの切り替えはコマンド 1 つでできるので、タスクの重さに応じて軽量モデルと高精度モデルを使い分けるのも有効です。
用語とポイント解説
スキル(Skill) 複雑なタスクを完了したあと、Hermes がその手順を自動で保存したものです。かんたんに言うと「自動でメモされた操作レシピ」で、次回以降は同じ作業をより速く・正確にこなせるようになります。使うたびに自己改善される仕組みで、蓄積するほど精度が上がります。
ターミナルバックエンド エージェントが実際にコマンドを実行する「先の環境」のことです。かんたんに言うと「どのパソコン・サーバーで動くか」の設定で、local(手元の PC)・Docker・SSH・Daytona・Singularity・Modal の 6 種類から選べます。用途やコストに合わせて自由に切り替えられます。
LLM(Large Language Model) 大規模言語モデルと呼ばれる、文章を理解・生成する AI の中核エンジンです。かんたんに言うと「Hermes の頭脳」で、OpenAI・Anthropic・OpenRouter など複数のサービスを切り替えて利用できます。コストや精度の要件に応じて最適なモデルを選べるのが強みです。
OpenRouter 200 種類以上の AI モデルを 1 つの API(サービスをつなぐ窓口)経由で使えるサービスです。かんたんに言うと「いろいろな AI モデルをまとめて利用できる窓口」で、無料枠もあるため Hermes を最初に試す際にも向いています。
Atropos
強化学習(試行錯誤でモデルを鍛える手法)用の軌跡生成フレームワークです。かんたんに言うと「エージェントが動いた記録をまとめて AI の教材にする仕組み」で、tinker-atropos というサブモジュールとして Hermes に組み込まれています。研究・ML 用途での活用が主な目的です。
FTS5 SQLite(軽量データベース)に内蔵された全文検索エンジンです。かんたんに言うと「過去の会話をまとめて検索できる仕組み」で、セッションをまたいで「先週話した内容」をすばやく引き出せます。データベースを別途用意する必要がなく、インストールだけで使えます。
Honcho plastic-labs が開発した「dialectic ユーザーモデリングライブラリ」です。かんたんに言うと「ユーザーの好みや文脈を深く理解して記憶する仕組み」で、Hermes が会話を続けるうちにユーザーをより的確に把握できるようになります。
agentskills.io スキルを共有・配布するためのオープンスタンダード(公開規格)です。かんたんに言うと「コミュニティが作ったスキルを取り込んで使えるプラットフォーム」で、自分でゼロから作らなくても他の人が公開したスキルをそのまま利用できます。
cron スケジューラー 定期的にタスクを自動実行するための内蔵タイマー機能です。かんたんに言うと「毎朝・毎週など決まった時間に自動で動かす仕組み」で、設定は自然言語(普通の日本語)で書けます。コードの知識がなくても定期タスクを組めるのが特徴です。
サブエージェント メインのエージェントから派生して、独立したタスクを並列で処理する補助エージェントです。かんたんに言うと「仕事を手分けして同時進行できる分身」で、複数の作業を同時に委譲することでマルチステップパイプライン(複数工程の処理)の実行時間を大幅に短縮できます。
活用例
-
毎朝のニュース要約自動配信: cron スケジューラーで毎朝 7 時にウェブ検索スキルを実行し、結果を Telegram に自動送信。自然言語で設定できるためコードは一切不要です。
-
コードレビューの自動化: GitHub のプルリクエスト(コードの変更提案)の URL を渡してレビューを依頼し、結果を Slack チャンネルに投稿するワークフローも自然言語だけで組めます。
-
ML 訓練データの収集: Atropos 環境と連携し、エージェントの操作軌跡を自動生成・圧縮して、モデルのファインチューニング(追加学習)に利用できます。
-
サブエージェントによる並列処理: 複数の独立したタスクをサブエージェントに分担させ、同時進行することでパイプライン全体の処理時間を大幅に短縮できます。
-
Telegram からのリモート操作: パソコンから離れていても、スマートフォンの Telegram からエージェントに指示を送り、サーバー上での作業を遠隔で継続できます。
-
スキルの横断的な再利用: agentskills.io からコミュニティのスキルを取り込むことで、ゼロから設定することなく高度なタスクを即座に実行できます。
Hermes Agent は、「会話を続けるだけで賢くなる」という新しい発想の AI エージェントです。毎日の定期タスクの自動化や、複雑な開発作業の効率化、そして ML 研究のデータ収集など、さまざまな場面で力を発揮します。ぜひ日々の業務自動化や個人開発のパイプライン構築などに活用してみてはいかがでしょうか。