一键部署 Higress AI 网关
本指南基于 docker 提供 Higress AI 网关一键快速部署的方式,如您需要使用其他部署方式(如标准k8s集群、本地k8s集群等),请参照 快速开始。
基于 Higress AI 网关实现 Remote MCP Server 托管,请参照MCP Server 快速开始。
安装 Higress AI 网关
Section titled “安装 Higress AI 网关”在本地控制台,执行以下命令:
curl -sS https://higress.cn/ai-gateway/install.sh | bash注意:AI 网关的启动过程需要访问公网资源。请确保其运行环境具备外网访问条件。
按照指引可以分别录入模型供应商的 API-KEY ;也可以键入回车后跳过,之后在控制台中修改。

如您当前端口已被占用,需要使用其他端口,可使用 wget https://higress.cn/ai-gateway/install.sh命令下载部署脚本后,修改DEFAULT_GATEWAY_HTTP_PORT_/DEFAULT_GATEWAY_HTTPS_PORT/_DEFAULT_CONSOLE_PORT;然后使用bash执行脚本。

部署完成后,会出现以下界面:

通过浏览器访问控制台界面 http://localhost:8001/,首次登录需要配置管理员及密码。
在AI服务提供者管理界面,可以配置已集成供应商的 API-KEY。当前已集成的供应商有阿里云、DeepSeek、Azure OpenAI、OpenAI、豆包等。

每个AI服务提供商都可以单独配置令牌降级策略,当某一认证令牌返回异常响应的数量超出阈值,Higress 将暂停使用该令牌发起请求,直至后续健康检测请求连续收到一定数量的正常响应。

在AI路由管理界面,支持配置不同路由的域名、模型匹配方式、降级配置、请求消费者等。也可以通过策略,配置不同认证鉴权方式、限流策略等,也支持如 RAG、Prompt 模板、语义缓存等功能。



打开系统自带命令行,通过以下命令进行请求(如 HTTP 服务未部署在8080端口上,修改为对应端口即可)
curl 'http://localhost:8080/v1/chat/completions' \ -H 'Content-Type: application/json' \ -d '{ "model": "qwen-max", "messages": [ { "role": "user", "content": "你是谁" } ] }'请求结果示例:

在AI监控面板界面,可以对 AI 请求进行观测。观测指标包括每秒输入输出 Token 数量、各供应商及模型 Token 使用数量等。
通过观测指标,可以进一步比较当前多个模型的使用情况及时延对比,帮助开发者进一步优化模型调用策略。

如您在部署过程中遇到问题,可在 Higress Github Issue 中留下您的信息。
如您对 Higress 后续更新感兴趣,或希望给 Higress 提供反馈,欢迎 Star Higress Github Repo。