<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Monitoring on OHTLY Blog</title>
    <link>https://blog.ohtly.com/tags/monitoring/</link>
    <description>Recent content in Monitoring on OHTLY Blog</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Thu, 02 Jul 2026 23:37:59 +0800</lastBuildDate>
    <atom:link href="https://blog.ohtly.com/tags/monitoring/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>OpenClaw Prometheus 监控接入</title>
      <link>https://blog.ohtly.com/posts/2026-07-02-openclaw-prometheus-monitoring/</link>
      <pubDate>Thu, 02 Jul 2026 23:36:17 +0800</pubDate>
      <guid>https://blog.ohtly.com/posts/2026-07-02-openclaw-prometheus-monitoring/</guid>
      <description>&lt;h2 id=&#34;背景&#34;&gt;&#xA;  背景&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e8%83%8c%e6%99%af&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;OpenClaw 是日常使用的 AI 网关，接入飞书通道提供 AI 助手服务。之前监控体系只有节点级的 CPU/内存/磁盘告警，缺少网关本身的可观测性——不知道模型调用失败率、token 消耗趋势、会话是否异常恢复、任务队列是否堆积。&lt;/p&gt;&#xA;&lt;p&gt;已有的监控基础设施：Prometheus + Alertmanager 部署在内网服务器，alert-transformer 负责将告警格式化后通过 OpenClaw 推送到飞书。这次要做的是把 OpenClaw 自身的指标接入同一套体系。&lt;/p&gt;&#xA;&lt;h2 id=&#34;安装插件&#34;&gt;&#xA;  安装插件&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e5%ae%89%e8%a3%85%e6%8f%92%e4%bb%b6&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;OpenClaw 官方提供了 &lt;code&gt;diagnostics-prometheus&lt;/code&gt; 插件，通过 ClawHub 安装：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;openclaw plugins install clawhub:@openclaw/diagnostics-prometheus&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;不过有版本兼容性问题：最新版插件要求的 &lt;code&gt;pluginApi &amp;gt;= 2026.6.11&lt;/code&gt;，而部署的 OpenClaw 运行时是 &lt;code&gt;2026.6.6&lt;/code&gt;，直接装最新版会报安装失败。查看 npm 历史版本后，锁定 &lt;code&gt;2026.6.6&lt;/code&gt; 版本安装：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;openclaw plugins install @openclaw/diagnostics-prometheus@2026.6.6&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h2 id=&#34;配置&#34;&gt;&#xA;  配置&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e9%85%8d%e7%bd%ae&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;&lt;code&gt;openclaw.json&lt;/code&gt; 需要做三个改动：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;diagnostics.enabled: true&lt;/code&gt; — 启用诊断事件流，插件依赖此开关&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;plugins.allow&lt;/code&gt; 加入 &lt;code&gt;&amp;quot;diagnostics-prometheus&amp;quot;&lt;/code&gt; — 显式允许加载&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;plugins.entries&lt;/code&gt; 加入 &lt;code&gt;&amp;quot;diagnostics-prometheus&amp;quot;: { &amp;quot;enabled&amp;quot;: true }&lt;/code&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code class=&#34;language-json5&#34; data-lang=&#34;json5&#34;&gt;{&#xA;  &amp;#34;diagnostics&amp;#34;: {&#xA;    &amp;#34;enabled&amp;#34;: true&#xA;  },&#xA;  &amp;#34;plugins&amp;#34;: {&#xA;    &amp;#34;allow&amp;#34;: [&amp;#34;diagnostics-prometheus&amp;#34;],&#xA;    &amp;#34;entries&amp;#34;: {&#xA;      &amp;#34;diagnostics-prometheus&amp;#34;: { &amp;#34;enabled&amp;#34;: true }&#xA;    }&#xA;  }&#xA;}&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;插件注册的指标端点位于：&lt;/p&gt;</description>
    </item>
    <item>
      <title>Gitea 可观测性：Prometheus 指标 &#43; Loki 日志</title>
      <link>https://blog.ohtly.com/posts/2026-07-02-gitea-observability/</link>
      <pubDate>Thu, 02 Jul 2026 23:00:00 +0800</pubDate>
      <guid>https://blog.ohtly.com/posts/2026-07-02-gitea-observability/</guid>
      <description>&lt;h2 id=&#34;背景&#34;&gt;&#xA;  背景&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e8%83%8c%e6%99%af&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://blog.ohtly.com/posts/2026-07-02-gitea-deployment/&#34; &gt;Gitea 部署完成&lt;/a&gt;后，需要监控保障服务稳定性。监控三要素——指标、日志、告警——缺一不可。&lt;/p&gt;&#xA;&lt;p&gt;现有监控基础设施已部署在监控节点：&lt;/p&gt;&#xA;&lt;table&gt;&#xA;  &lt;thead&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;th&gt;服务&lt;/th&gt;&#xA;          &lt;th&gt;端口&lt;/th&gt;&#xA;          &lt;th&gt;说明&lt;/th&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/thead&gt;&#xA;  &lt;tbody&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Prometheus&lt;/td&gt;&#xA;          &lt;td&gt;9090&lt;/td&gt;&#xA;          &lt;td&gt;指标采集 + 告警规则&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Loki&lt;/td&gt;&#xA;          &lt;td&gt;3100&lt;/td&gt;&#xA;          &lt;td&gt;日志存储&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Alertmanager&lt;/td&gt;&#xA;          &lt;td&gt;9093&lt;/td&gt;&#xA;          &lt;td&gt;告警路由&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Alloy&lt;/td&gt;&#xA;          &lt;td&gt;12345&lt;/td&gt;&#xA;          &lt;td&gt;Docker 日志采集&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/tbody&gt;&#xA;&lt;/table&gt;&#xA;&lt;p&gt;Gitea 部署在应用节点，Docker Compose 运行，端口 3000（Web）+ 2222（SSH）。&lt;/p&gt;&#xA;&lt;h2 id=&#34;开启-gitea-metrics&#34;&gt;&#xA;  开启 Gitea Metrics&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e5%bc%80%e5%90%af-gitea-metrics&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;Gitea 原生支持 Prometheus，只需在配置文件 &lt;code&gt;app.ini&lt;/code&gt; 中追加：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-ini&#34; data-lang=&#34;ini&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;[metrics]&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;ENABLED&lt;/span&gt; &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;true&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;重启后验证：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;curl http://git-server:3000/metrics | head&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;返回的指标分三类：&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;业务指标：&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;table&gt;&#xA;  &lt;thead&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;th&gt;指标&lt;/th&gt;&#xA;          &lt;th&gt;说明&lt;/th&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/thead&gt;&#xA;  &lt;tbody&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_users&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;用户数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_repositories&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;仓库数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_issues&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Issue 数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_pull_requests&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;PR 数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_accesses&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;HTTP 总访问次数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;code&gt;gitea_mirrors&lt;/code&gt;&lt;/td&gt;&#xA;          &lt;td&gt;镜像仓库数&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/tbody&gt;&#xA;&lt;/table&gt;&#xA;&lt;p&gt;&lt;strong&gt;运行时指标：&lt;/strong&gt;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
