k230/README.md

66 lines
908 B
Markdown
Raw Normal View History

主要功能
1、追踪运动
2、实时显示镜子
**3、memory**
5s停留启动保存带时间戳的图像
**时间戳**
**4、对话图片-promptLLMTTS**
图片: **(皮肤,五官,表情)**
返回tag
即时对话normal-,告警有特殊状态
1
LLM三轮对话
TTS
2
端到端+对话轮次控制(优先)
# 主体工作
# agent
1. 数据存储: img,心情,皮肤状态。
2. 对话:
1. 状态不好的时候触发对话(皮肤和性情)
3. 对外接口:数据库,外部数据获取
4. 端到端语音识别 asr tts
## 前端
1. ui
2. 数据分析
## 结构
1. k230 显示器
2. 云台
3. sg90
## 模型
1. 心情,状态
2. 人脸识别 — 人脸识别k230内置模型
3. asr tts
## k230
1. 人脸跟踪
2. 小翅膀摇一摇
3. 语音视频获取
4. agent调用逻辑
5. 电路,供电
## 海报,文档