IntuitionX_agent/src/Module/asr/asrconfig.py

"""
ASR 配置文件
定义语音识别的默认参数
"""

# ============================================================
# 模型配置
# ============================================================

# 默认模型
# qwen3-asr-flash: 短音频 (≤5分钟)
# qwen3-asr-flash-filetrans: 长音频 (≤12小时)
MODEL = 'qwen3-asr-flash'

# API URL (北京地域)
API_URL = 'https://dashscope.aliyuncs.com/api/v1'

# 新加坡地域 URL (备用)
# API_URL = 'https://dashscope-intl.aliyuncs.com/api/v1'


# ============================================================
# 识别参数
# ============================================================

# 语言 (可选值: 'zh', 'en', 'ja', 'ko', 'de', 'fr', 'ru', 'es', 'it', 'pt', 'ar', 等)
# None 表示自动检测
LANGUAGE = None

# 是否启用 ITN (Inverse Text Normalization)
# 将口语数字转为书面形式，如"一百二十三"→"123"
ENABLE_ITN = False


# ============================================================
# 支持的音频格式
# ============================================================

SUPPORTED_FORMATS = [
    'aac', 'amr', 'avi', 'aiff', 'flac', 'flv',
    'm4a', 'mkv', 'mp3', 'mpeg', 'ogg', 'opus',
    'wav', 'webm', 'wma', 'wmv'
]

# 最大文件大小 (字节) - 10MB
MAX_FILE_SIZE = 10 * 1024 * 1024

# 最大音频时长 (秒) - 5分钟
MAX_DURATION = 5 * 60
feat: :sparkles: 语音识别 2026-01-01 21:34:51 +08:00			`"""`
			`ASR 配置文件`
			`定义语音识别的默认参数`
			`"""`

			`# ============================================================`
			`# 模型配置`
			`# ============================================================`

			`# 默认模型`
			`# qwen3-asr-flash: 短音频 (≤5分钟)`
			`# qwen3-asr-flash-filetrans: 长音频 (≤12小时)`
			`MODEL = 'qwen3-asr-flash'`

			`# API URL (北京地域)`
			`API_URL = 'https://dashscope.aliyuncs.com/api/v1'`

			`# 新加坡地域 URL (备用)`
			`# API_URL = 'https://dashscope-intl.aliyuncs.com/api/v1'`


			`# ============================================================`
			`# 识别参数`
			`# ============================================================`

			`# 语言 (可选值: 'zh', 'en', 'ja', 'ko', 'de', 'fr', 'ru', 'es', 'it', 'pt', 'ar', 等)`
			`# None 表示自动检测`
			`LANGUAGE = None`

			`# 是否启用 ITN (Inverse Text Normalization)`
			`# 将口语数字转为书面形式，如"一百二十三"→"123"`
			`ENABLE_ITN = False`


			`# ============================================================`
			`# 支持的音频格式`
			`# ============================================================`

			`SUPPORTED_FORMATS = [`
			`'aac', 'amr', 'avi', 'aiff', 'flac', 'flv',`
			`'m4a', 'mkv', 'mp3', 'mpeg', 'ogg', 'opus',`
			`'wav', 'webm', 'wma', 'wmv'`
			`]`

			`# 最大文件大小 (字节) - 10MB`
			`MAX_FILE_SIZE = 10 * 1024 * 1024`

			`# 最大音频时长 (秒) - 5分钟`
			`MAX_DURATION = 5 * 60`