ecogofit
本站致力于IT相关技术的分享
使用Ansible自动化Linkerd流量切分以优化Scrum流程中的变更失败率指标 使用Ansible自动化Linkerd流量切分以优化Scrum流程中的变更失败率指标
我们的变更失败率(Change Failure Rate, CFR)一度高达23%。这意味着每四次生产部署,就有一次会触发P0或P1级别的告警。在Scrum的回顾会议上,气氛总是很沉重,话题从技术债转向了发布流程,最终往往演变成毫无结果的讨
基于 Event Sourcing 与 OpenSearch 构建高韧性的读模型投射管道 基于 Event Sourcing 与 OpenSearch 构建高韧性的读模型投射管道
在 Event Sourcing (ES) 架构中,所有状态变更都以一系列不可变事件的形式持久化。这种模式为系统提供了完美的审计日志和时间旅行能力,但它也带来了一个核心挑战:事件流本身是一种为写入优化的数据结构,直接用于复杂的读取查询几乎是
2023-10-27
整合Vite前端、Go-Fiber网关与Kafka构建高吞吐异步日志处理链路 整合Vite前端、Go-Fiber网关与Kafka构建高吞吐异步日志处理链路
在构建任何有一定规模的系统时,日志都不仅仅是调试的工具,更是洞察系统行为、追踪用户路径、预警潜在问题的生命线。当业务从单一后端扩展到前后端分离的复杂应用时,将前端的用户行为日志与后端的API调用日志关联起来,就成了一个棘手但价值极高的问题。
2023-10-27
使用 Node.js 构建与 GraphQL API 通信的自定义 Ansible 模块 使用 Node.js 构建与 GraphQL API 通信的自定义 Ansible 模块
团队内部维护着一个集中式的配置中心,它通过 GraphQL API 暴露服务。这个配置中心是所有微服务功能开关、A/B 测试参数和动态设置的唯一真实来源(Single Source of Truth)。然而,一个棘手的问题始终存在:如何将这
2023-10-27
基于 Nomad 和 Prometheus 构建面向 SLO 的 Django 应用 GitOps 交付闭环 基于 Nomad 和 Prometheus 构建面向 SLO 的 Django 应用 GitOps 交付闭环
我们团队在维护一套中等规模的内部服务时,一直面临一个棘手的问题:应用的发布流程与它的可观测性状态是完全脱节的。开发者提交代码,CI/CD流水线构建镜像、推送到仓库,最后触发部署。而另一边,SRE团队需要手动去更新Prometheus的告警规
实现 Pub/Sub 事务性消费的 Outbox 模式:Fastify, JPA 与 Go 的横向对比 实现 Pub/Sub 事务性消费的 Outbox 模式:Fastify, JPA 与 Go 的横向对比
处理来自消息队列的事件并原子性地更新数据库状态,是构建可靠分布式系统时无法回避的挑战。一个经典的问题是“双重写入”:你成功处理了消息,更新了数据库,但在确认(ack)消息之前服务崩溃了。消息被重新投递,导致重复处理。反之,如果先确认消息再更
6 / 8