os-assistant v0.5 升级方案
App: os-assistant
版本: v0.2.0 → v0.3.0
平台依赖: v0.5
一、升级概述
1.1 新定位
os-assistant:运行哨兵 + 智能建议(只读)
- 监控采集(probe)+ 专家规则建议
- v0.5:智能建议(只读解释)
- 禁止执行:v0.5 明确禁止任何修改系统的操作
1.2 升级内容
基础功能(Phase 1-3):
- Probe Agent:指标/日志采集
- 新增 5 个对象:server、server_metric、alert、rule_template
- 新增 4 个视图
- 异常识别规则(5类)
AI 功能(Phase 4):
- AI 告警分析
- AI 排查建议
- AI 修复建议(只读,不执行)
二、详细实施
2.1 基础功能(Phase 1-3)
详见:v0.4/93-os-assistant-implementation.md Phase 1-3
2.2 AI 功能(Phase 4)
详见:v0.4/93-os-assistant-implementation.md Phase 4
三、Prompt 模板
3.1 告警分析 Prompt
ID: ops.alert_analysis@1.0.0
模板:
你是一个运维专家,请分析以下告警:
告警信息:
- 服务器: {{server.hostname}}
- 告警类型: {{alert.title}}
- 严重程度: {{alert.severity}}
- 告警消息: {{alert.message}}
历史指标:
{{#each metrics}}
- 时间: {{timestamp}}, CPU: {{cpu_usage}}%, 内存: {{memory_usage}}%
{{/each}}
请分析:
1. 告警的根本原因
2. 可能的影响范围
3. 建议的处理方案
请以 JSON 格式返回分析结果。
输出 Schema:
{
"type": "object",
"properties": {
"root_cause": {"type": "string"},
"impact_scope": {"type": "string"},
"suggestions": {
"type": "array",
"items": {"type": "string"}
}
},
"required": ["root_cause", "suggestions"]
}
3.2 排查建议 Prompt
ID: ops.troubleshooting_suggestion@1.0.0
模板:
你是一个运维专家,请根据以下信息给出排查建议:
告警信息:
{{alert}}
服务器状态:
{{server_status}}
请给出:
1. 排查步骤(详细)
2. 需要查看的指标/日志
3. 可能的解决方案
请以 JSON 格式返回。
四、规则定义
4.1 AI 告警分析规则
- id: os-assistant.ai_alert_analysis
name: AI 告警分析
description: LLM 对告警做解释/排查建议
status: enabled
trigger:
type: on_event
eventTypes: [alert_triggered]
condition:
typeId: alert
filters:
- field: data.severity
op: in
value: [error, critical]
action:
type: invoke_llm_summary
prompt_template: ops.alert_analysis@1.0.0
context_refs:
alertIds: ["{{entity_id}}"]
eventIds: ["{{alert.related_event_ids}}"]
target_type: ai_insight
scope:
typeIds: [alert]
五、前端实现
5.1 Alert Detail 页面增强
功能:
- 显示 AI 洞察(如果已生成)
- 显示 AI 分析结果(根本原因、影响范围、建议)
- 显示 AI 生成时间、使用的 Prompt 模板
5.2 Dashboard 增强
功能:
- 在告警列表中显示 AI 分析状态(已分析/未分析)
- 在告警详情中显示 AI 洞察
文档版本: v1.0
最后更新: 2025-12-17