术语表：AI 聚合网关、模型路由、虚拟密钥、RAG、MCP 等 13 个概念速查

AI 聚合网关是企业所有大模型调用的统一入口层：对上聚合多家模型厂商，对下以一套兼容 API 服务全部应用与工具，并在转发过程中完成路由、配额、审计与安全治理。企业级聚合网关与轻量代理的分界，在于是否理解组织结构（谁在用）与数据资产（留下什么）。

API 中转站是把请求转发给上游模型厂商的轻量服务，核心能力是协议转换与计费转售，面向个人开发者与小团队。它解决「能用、便宜」，不解决权限、审计与数据沉淀。与聚合网关的详细对照见对比页。

模型路由指网关按预设策略为每个请求自动选择模型：可以按场景（代码、写作、问答）、按成本（能用便宜的绝不用贵的）、按延迟或按模型健康度分流。好的路由让业务方无需关心「该调哪个模型」，同时把整体成本压到最低。

负载均衡把流量分散到多个 API Key 与多家厂商，避免单点限流；故障转移在某家厂商超时或报错时秒级切换备用通道。两者共同保证「上游任何一家出问题，业务无感」。

语义缓存按「意思相近」而非「字面相同」命中历史请求：员工问「报销流程是什么」和「怎么报销」会命中同一份缓存答案，直接返回、不再计费。在客服、知识问答等重复度高的场景，典型可降本 20-40% 并显著降低延迟。

虚拟密钥是网关签发的二级凭证：企业真实的厂商 Key 收在网关里，员工、项目与 Agent 各拿一把独立的虚拟 Key。每把可单独限额、限 IP、限模型、随时吊销，用量自动归集到人与项目，从根上解决「一把 Key 全公司共用」的失控。

分级配额按组织结构逐层分配用量额度（部门、项目、个人），支持月度与季度周期；熔断指用量触达阈值时自动阻断后续调用并通知负责人。两者组合让 AI 预算第一次可以像网费一样被管理。

全链路审计记录每次调用从入口到模型厂商的完整链路：谁、何时、用哪个模型、输入输出 Token、花了多少钱、是否触发护栏。它是成本分账、合规检查与安全追责的共同底座，也是等保测评的关键证据链。

Shadow AI 指员工绕过企业管控私自使用的 AI 工具与个人 API Key。它的风险不在「用了 AI」，而在企业数据流向不可知的第三方、成本游离在账外。治理方式是发现、拦截并引导回企业网关，而不是一禁了之。

RAG 让大模型回答前先从企业知识库中检索相关内容，再基于检索结果作答并标注来源。它解决通用模型「不懂你们公司」的问题：答案来自企业自己的文档、纪要与经验，可溯源、可更新。

MCP（模型上下文协议）是让 AI Agent 以标准方式访问工具与数据源的开放协议。企业里的 MCP 管理指统一登记内部 MCP Server、控制每个 Agent 能访问哪些工具与数据范围，是 Agent 时代的权限边界。

组织记忆是企业长期积累、可复用的集体知识：文档与流程是显性部分，员工脑中的经验、判断与解题路径是隐性部分。隐性知识在离职时随人流失，这正是「组织失忆」的来源，也是知识沉淀要解决的核心问题。

知识沉淀引擎是启元天枢的差异化模块：站在 AI 流量入口，把每一次调用的对话、代码与决策脱敏后结构化入库，同时汇入飞书、钉钉的会议纪要与文档，形成权限继承、可检索、可继承的企业知识资产，并主动产出改进建议。详见产品页。

GEO 指让内容更容易被 AI 搜索与大模型回答引用的优化方法：定义句先行、植入统计数据与权威引述、建设对比与 FAQ 内容。研究显示这类特征可将内容在 AI 回答中的可见度提升三到四成，是 AI 时代的「新 SEO」。

术语表