Blog Background
Community / Blog
Blog
All Articles Technical Articles Ecological Articles Best Practices Community Activities
如何使用 Higress 快速构建 AI 应用?
随着AI时代到来,基于大模型的应用对网关提出了新的要求,例如在不同LLM提供商之间进行负载均衡、构建AI应用的可观测能力、基于token的限流保护与配额管理、AI应用内容安全等等。Higress基于企业内外的丰富场景沉淀了众多面向AI的功能,推出了AI原生的API网关形态并且全部开源。 是一个开源的前端项目,用于提供大模型聊天窗口,支持接入多种大模型,本文基于Higress、通义千问以及 ChatGPTNextWeb,演示 Higress 如何兼容 openai 协议,并逐步搭建一个体系完整的LLM应用,应用最终架构如图所示: AI 代理 官方文档: 应用架构 首先,我们先通过网关快速...
CH3CHO | 2024-08-08
如何使用 Higress 快速构建 AI 应用?
OpenAI 国内停服,除了停机迁移,这个方案更平滑
OpenAI 国内停服,除了各个大模型厂商提供的迁移方案外,是否有其他更平滑的迁移方案呢?本文以 OpenAI 切换到通义千问为例,介绍开源网关 Higress 的应对方案。优势是: 默认按照模型价格和能力进行了合理映射,且支持用户自定义调整配置 可以通过 OpenAI 的统一协议对接多种大模型,屏蔽实现细节,降低接入新大模型的 API 适配成本 Higress 可以提供 token 限流插件、内容审核插件,通过网关的工程化能力实现业务收益 实操视频 步骤介绍 准备工作:需要登陆阿里云 第一步:启动 Higress AI 网关 Higress 有多种部署方式,例如...
Higress | 2024-07-23
OpenAI 国内停服,除了停机迁移,这个方案更平滑
Higress 发布 v1.4,开放 AI 网关能力,增强云原生能力
基于大模型的 AIGC 应用或 SaaS 服务,出现了全新的需求,例如对 LLM 结果的缓存、多个 LLM 之间的容错切换、基于 toke 的限流、内容审核等,通过在网关上的插件能力可以非常优雅的满足这些需求,形成统一的流量治理,从而避免后端服务的“负重”。 一、新版本简介 Higress 发布 v1.4,基于为通义千问,以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀,开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。AI能力全面开源:提供包含安全防护、多模型适配、可观测、缓存、提示词工程等领域在内的多个开箱即用插件,核心能力例...
张添翼, 王晨 | 2024-07-18
Higress 发布 v1.4,开放 AI 网关能力,增强云原生能力
通义千问2.5“客串”ChatGPT4,你分的清吗
引子 OpenAI 发布了最新的 GPT4o 模型,通义千问也在前不久刚发布通义千问 2.5,已经和 GPT4Turbo 不分伯仲: 既然目前还没有和 GPT4o 文本生成能力的对比数据,就让我们来和大模型一起做个游戏测试一下: 我们让通义千问 2.5 扮演 GPT4,来和真正的 GPT4 进行问答 PK,读者不妨来猜一猜谁是通义千问。 两名选手的头像和昵称分别是: 🌝 :我是GPT4 🌚 :如假包换GPT4 谁是通义千问,谁是ChatGPT,答案将在文末揭晓。 Round 1 第一轮由“我是GPT4”选手提问,由“如假包换GPT4”选手作答 🌝:角...
CH3CHO、澄潭 | 2024-05-11
通义千问2.5“客串”ChatGPT4,你分的清吗
教程:如何在本地开发和调试 Higress Pilot
背景说明 前面 SJC 在中介绍了如何在本地开发和调试 Higress Controller。而 Higress 控制面除了 Controller 之外还有一个组件,那就是 Pilot。本文就将介绍如何在本地开发和调试 Higress Pilot。 环境准备 步骤一:克隆代码仓库 Pilot 的代码目前是以 Istio 上游仓库 submodule 加补丁文件的形式存在于 Higress 的主仓库中的,所以直接克隆 Higress 的代码主仓库 https://github.com/alibaba/higress 即可。 步骤二:准备项目代码 Higress Pilot 是...
CH3CHO | 2024-03-16
教程:如何在本地开发和调试 Higress Pilot
教程:如何在本地开发和调试 Higress 控制台
概述 本文旨在介绍如何在本地使用 IDE 来进行 Higress 控制台(以下简称控制台)的开发和调试工作。 代码结构 控制台的代码仓库地址为 。 控制台项目使用了前后端分离的架构。在将代码下载到本地后,我们可以看到整个项目主要由以下三个目录组成:backend、frontend 和 helm。它们也分别对应了项目的三个部分:后端、前端和部署。 Backend:后端部分 后端部分是一个使用 Maven 构建配置的 Java 项目,其中共有两个模块:sdk 和 console。 SDK sdk 中包含了定义了 Higress 治理平面的核心数据模型和业务逻辑,如路由模型、...
CH3CHO | 2024-03-02
教程:如何在本地开发和调试 Higress 控制台
如何使用 Higress Admin SDK 进行配置管理
1. 背景 Higress 一个遵循开源 Ingress/Gateway API 标准,提供流量调度、服务治理、安全防护三合一的高集成、易使用、易扩展、热更新的下一代云原生网关。而配置管理网关的运维工作中扮演者重要的角色。如何让配置管理自动化,尤其是与其他的运维系统进行对接,就成为了一个非常迫切的需求。本文将介绍如何使用 Higress Admin SDK 来管理 Higress 系统内的各类配置。希望能够对存在此类需求的朋友有所帮助。 2. Higress Admin SDK Higress Admin SDK 脱胎于 Higress Console。起初,它是作为 H...
CH3CHO | 2024-02-08
如何使用 Higress Admin SDK 进行配置管理
打爆帕鲁私服的 Sealos 是如何选型网关的?
作者介绍:Sealos 创始人,环界云计算 CEO 方海涛Sealos 公有云_(https://cloud.sealos.io)_几乎打爆了市面上所有主流的开源网关,本文可以给大家很好的避坑,在网关选型方面做一些参考。 Sealos Cloud 的复杂场景 Sealos 公有云上线以来,用户呈爆发式增长,目前总共注册用户 8.7w,每个用户都去创建应用,每个应用都需要有自己的访问入口,就导致整个集群路由条目非常巨大,需要有支撑数十万条 Ingress 的能力。另外,在公网提供共享集群的服务,对多租户要求极为苛刻,用户之间的路由必须不能相互影响,需要非常好的隔离性,以及流量控制能力。公有...
CH3CHO | 2024-01-29
打爆帕鲁私服的 Sealos 是如何选型网关的?
Higress × OpenKruiseGame 游戏网关最佳实践
作者:赵伟基,力铭,澄潭 OpenKruiseGame(下文简称:OKG)是一个面向多云的开源游戏服Kubernetes工作负载,是CNCF工作负载开源项目OpenKruise在游戏领域的子项目,其提供了热更新、原地升级、定向管理等常用的游戏服管理功能。而游戏作为典型的流量密集型场景,在吞吐量、延迟性能、弹性与安全性等方面对入口网关提出了很高的要求。 Higress是基于阿里内部两年多的 Envoy 网关实践沉淀,以开源Istio与Envoy为核心构建的下一代云原生网关。Higress实现了安全防护网关、流量网关、微服务网关三层网关合一,可以显著降低网关的部署和运维成本。Hi...
CH3CHO | 2024-01-26
Higress × OpenKruiseGame 游戏网关最佳实践
Page 14 of 18