k230/README.md

66 lines
908 B
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

主要功能
1、追踪运动
2、实时显示镜子
**3、memory**
5s停留启动保存带时间戳的图像
**时间戳**
**4、对话图片-promptLLMTTS**
图片: **(皮肤,五官,表情)**
返回tag
即时对话normal-,告警有特殊状态
1
LLM三轮对话
TTS
2
端到端+对话轮次控制(优先)
# 主体工作
# agent
1. 数据存储: img,心情,皮肤状态。
2. 对话:
1. 状态不好的时候触发对话(皮肤和性情)
3. 对外接口:数据库,外部数据获取
4. 端到端语音识别 asr tts
## 前端
1. ui
2. 数据分析
## 结构
1. k230 显示器
2. 云台
3. sg90
## 模型
1. 心情,状态
2. 人脸识别 — 人脸识别k230内置模型
3. asr tts
## k230
1. 人脸跟踪
2. 小翅膀摇一摇
3. 语音视频获取
4. agent调用逻辑
5. 电路,供电
## 海报,文档