Go · Distributed Systems
一个高可用的分布式任务调度平台,支持弹性扩缩容、多租户隔离与故障自动恢复。已在生产环境稳定运行超过一年。
AI Infrastructure · Python
面向大模型训练与推理的统一资源调度层,实现 GPU 资源的细粒度分配与任务优先级管理。
Observability · Rust
高性能分布式链路追踪系统,基于 eBPF 实现零侵入式数据采集,支持百万级 spans/秒吞吐量。