Back to Documentation
Configuration

ASR & LLM BYOK Setup: 极致弹性与厂商中立架构

自由混合配置第三方云服务与私有化部署模型,实现成本与合规的完美平衡。

CXMind 秉持厂商中立(Vendor-Neutral)的底层设计哲学,允许企业根据业务场景在成本、精度与合规性之间取得完美平衡。通过 BYOK 模式,您可以无缝组合第三方云服务与私有化部署模型。

ASR Connection Pool Architecture (语音识别连接池)

CXMind 的 Go 语言摄取引擎(Ingestion Engine)专为高并发语音流处理而生,核心在于其健壮的 WebSocket 复用机制。

  • 毫秒级首字延迟 (TTFT): 引擎预先维护与上游提供商(Azure, Google, 腾讯云, Deepgram 等)的持久化连接池,规避了每通电话重新进行 TCP/TLS 握手的开销。

智能路由与负载均衡:

  • Round-Robin Routing: PCM 音频流进入系统后,由健康检查(Ping-Pong 机制)筛选出的可用 TaskHandler 句柄进行分配。
  • 并发复用: 单个 WebSocket 连接支持多达 10 路并发音频流多路复用,显著提升单节点支持的并发频道数。

弹性容灾:

  • 指数退避重连: 当链路异常时,系统采用指数退避算法自动重建隧道。
  • 本地缓冲区保护: 在重连期间,系统会短暂缓存音频片断,确保在链路恢复后数据不丢失,保障识别的完整性。

LLM 配置与模型路由网关

CXMind 的 LLM 适配层完全兼容 OpenAI API 规范,这使得接入新模型如同修改配置一样简单。

1. 混合部署模式 (Hybrid Deployment)

  • 云端模型 (Cloud LLMs): 通过 API 接入 GPT-4o、Claude 3.5 或 Gemini 1.5 Pro,用于处理复杂的逻辑推理或多语言任务。
  • 私有化模型 (Self-hosted): 针对高频、标准化的业务场景,支持通过 Ollama 或 vLLM 驱动的 Llama 3、DeepSeek 或 Qwen 内部节点。

2. BYOK 管理逻辑

  • Key 组隔离: 支持为不同的项目或租户配置独立的 API Key,实现精确的账单统计与额度控制。
备选路径 (Fallback Strategies):

示例场景:当预设的 GPT-4 接口触发 Rate Limit 或响应延迟过高时,路由网关可自动切换至备用的 DeepSeek 私有节点,确保业务连续性。

数据隐私与合规 (Data Privacy & Compliance)

BYOK 架构不仅是为了节省成本,更是为了满足不同地域的合规要求:

  • 敏感数据拦截: 在将数据发送至公有云 LLM 之前,CXMind 支持在本地侧进行 PII(个人身份信息)脱敏处理。
  • 本地回路: 对于涉密等级极高的通话,可强制指定仅使用本地 ASR(如 Faster-Whisper)与本地 LLM,数据全流程不落公网。

Need more help or have a specific architecture question?

Contact Engineering Support