Blog Background
Community / Blog
Blog
All Articles Technical Articles Ecological Articles Best Practices Community Activities
Tokenmaxxing 困局,有立竿见影的改善方案吗?
4个多月前,Uber 开始向旗下约 5000 名工程师全面推广 Claude Code,该工具迅速在工程师群体中引发热潮,但4个月后使用量远超公司财务模型的预期,烧光了全年的 AI 编程预算[1]。这一案例引发了的社区的连锁讨论,一是控制 Token 消耗的最佳实践,二是如何量化商业价值。由此可见,鼓励开发者使用 AI 提效、加速产品迭代和创新的同时,建立透明的成本管控机制,将成为各大企业面临的重要课题。 一、Token 都烧在哪里? 这是一个复杂的问题,既依赖严苛的统计学,又需要大量的合规样本。我们尝试从以下三类数据源,对Token 消耗的分布,做一番初探:学术论文 arXiv:...
王晨 | 2026-06-05
Tokenmaxxing 困局,有立竿见影的改善方案吗?
Code Harness 还是 Natural-Language Harnesses?
"If you're not the Model, you're the Harness." 这是 Langchain 提出过的观点,强调了 Harness 在构建 Agent 过程中的重要性。从事过后端开发、设计过分布式系统的朋友,肯对对胶水代码、中间件很熟悉,展开本文正文前,我们来结合两个熟悉的概念来进一步加深理解 Harness。 + 胶水代码:泛指把两个东西粘在一起的代码,没有自己的业务含义,纯粹是连接器。听上去不高级,因为它暗示这层代码没有设计、是偶然产物。 + 中间件:分布式系统中的术语,强调位于两端之间的一层服务,通常指消息队列、RPC 框架、API 网关这类基础设施...
王晨 | 2026-06-05
Code Harness 还是 Natural-Language Harnesses?
本体论又火了,他能优化我的 Agent 效果么?
作者:望宸 本体论,这个听上去有点哲学范儿的概念,正越来越受到 Agent Builder 们的重视。 不同于上下文工程、Harness 这些 Buzzword,本体论虽然听上去不够性感,但它更加具象,落地路径更加清晰。 一、本体论:从哲学定义到机器认知 本体论(Ontology)一词源来自希腊语的 ontos(存在)与 logos(学说),直译就是关于存在的学说。直白讲,本体论就是给你要研究的领域,画一张统一、无歧义的认知地图。 从亚里士多德在《形而上学》里搭建的第一套存在分析框架,到如今企业 IT 系统的可观测建模。本体论跨越两千余年,从形而上学的核心分支,一步步演变为千...
王晨 | 2026-05-29
本体论又火了,他能优化我的 Agent 效果么?
Higress v2.2.2 发布:Bedrock 直连、Nginx 安全迁移、CNCF 治理完善
作者:如漫 之前有用户在社区问过一个问题:"我只是想通过 Bedrock 调个 Claude,为什么请求要在网关里转两次协议才能出去?" 好问题。我们也觉得这一趟弯路该省了——v2.2.2 主要就在干这类事。 这个版本在解决什么问题 v2.2.2 于 2026 年 5 月 21 日发布,距 v2.2.1 约六周,包含 70 项变更(主仓库 36 项 + Console 34 项)。这次的改动主要集中在三个方向: + 减少不必要的协议转换层,让 Bedrock 调用更直接 + 让被限流摘掉的 API Key 能自动恢复,不用人工干预 + 降低从 nginx 迁移过来的成本,rewrit...
阿里云高级工程师 | 2026-05-25
Higress v2.2.2 发布:Bedrock 直连、Nginx 安全迁移、CNCF 治理完善
告别 Ingress Nginx:云原生 API 网关 Gateway API 使用指引
作者:如漫 导语 2025 年 11 月,Kubernetes 社区宣布:作为最主流的 Ingress 控制器,Ingress Nginx 将于 2026 年 3 月正式停止维护。对于正在使用 Ingress Nginx 的用户来说,是时候考虑下一步了。 Kubernetes 官方给出了两条建议: + 拥抱 Gateway API——Ingress 的下一代继任者,提供更强大、更灵活的路由能力 + 选择其他 Ingress 控制器——继续沿用 Ingress 模型,但切换到仍在维护的实现 云原生 API 网关(APIG)同时覆盖了这两条路径:既提供了完善的 Ingress 迁移方案和...
阿里云高级工程师 | 2026-05-21
告别 Ingress Nginx:云原生 API 网关 Gateway API 使用指引
从一个隐藏 18 年的 Nginx 漏洞,看网关安全架构的演进
CVE202642945,CVSS 9.2,影响 Nginx 0.6.27 到 1.30.0,一个存在了 18 年的堆溢出漏洞。它不是什么精巧的攻击链,而是一个最朴素的状态管理疏忽。但正是这种"低级错误",让我们有机会重新审视网关的安全设计哲学。 漏洞原理:两阶段执行之间的状态幽灵 Nginx 的脚本引擎 Nginx 的 `rewrite` 和 `set` 指令不是简单的字符串替换。它们被编译成一系列操作码(opcodes),由 Nginx 内部的脚本引擎执行。这个引擎采用了一个经典的性能优化设计——两阶段执行(twopass): 第一次执行(长度计算):遍历所有操作码,计算出...
张添翼 | 2026-05-15
从一个隐藏 18 年的 Nginx 漏洞,看网关安全架构的演进
HiClaw 发布 v1.1.0,提供 Kubernetes 集群部署实现,支持 Hermes Worker 运行时
HiClaw v1.1.0 新增了 11 项功能,修复了 18 个 Bug,特别感谢 xcaspar, johnlanni, vincent067,cr72589,maxwc,Jingze,YuFeng,luoxiner,googs1025等9位贡献者。 一、新增功能 Kubernetes 原生架构 HiClaw 可运行在 Kubernetes 原生控制平面之上。`hiclawcontroller` 取代了旧版单容器模式,采用标准的 ControllerReconciler 架构:内嵌轻量级 kubeapiserver + kine 存储 CRD 数据,Controller 将 Wo...
阿里云高级工程师 | 2026-04-29
HiClaw 发布 v1.1.0,提供 Kubernetes 集群部署实现,支持 Hermes Worker 运行时
阿里云 AI 网关支持 DeepSeek V4
作者:望宸、梧同 今天,DeepSeek 发布两个模型,V4Pro 和 V4Flash。其架构和技术优势可以总结为: + 架构升级:流形约束残差连接mHC、Muon 优化器,提升训练质量。 + 后训练范式升级:引入领域专家培育和 onpolicy distillation(将多个专家能力融合到一个学生模型里),提升后训练效率和效果。 + 全新的注意力机制:在 DSA 的基础上引入 CSA 和 HCA,提升1M 上下文情况下的对话效果。 从而带来了模型效果和性价比方面的提升,: + Agent 能力大幅提高:在 Agentic Coding 评测中,V4Pro 已达到当前开源模型最佳...
阿里云高级工程师 | 2026-04-24
阿里云 AI 网关支持 DeepSeek V4
OpenClaw vs Hermes:来自6篇评测文章、4篇安全报告和500+社区互动的真实看法
作者:望宸 我们基于 X 、Reddit、Hacker News 等社区,对过去30天的真实用户反馈进行了整理,尝试去还原全球开发者对 OpenClaw vs. Hermes 的真实看法,例如 OpenClaw 被开发者抛弃?Hermes 过度营销?自部署转向 Serverless 托管服务? 目录 一、调研方法说明 二、核心架构差异:网关中心 vs 学习循环 三、OpenClaw:优势与缺陷 四、Hermes Agent:优势与缺陷 五、两者合用:1+12 的最佳实践 六、社区声音:基于500+评论的大数据分析 一、调研方法说明 为避免仅依赖 SEO 排名靠前的营销文...
王晨 | 2026-04-21
OpenClaw vs Hermes:来自6篇评测文章、4篇安全报告和500+社区互动的真实看法
Page 1 of 20