关于 ChatDLM

新一代领域大模型 · 搜索产品的技术底座

ChatDLM 是 Qafind Labs 自主研发的新一代领域大模型,也是搜索产品的技术底座。

融合 Block Diffusion(块扩散)与 Mixture of Experts(混合专家)架构, 突破传统 Transformer 在长上下文与推理效率上的瓶颈。

核心指标

2600 TPS 超高吞吐
通过动态早停技术减少 40% 无效计算
131K 长上下文
结合 RoPE 位置编码与分层缓存,缓存命中率达 98.2%
领域召回率 95.6%
基于 MoE 架构动态调整专家权重,实现领域自适应
← 返回首页