曾立
职务/职称
主任工程师
研究方向
AI计算加速
电子邮箱
zengli@sribd.cn
教育背景
北京大学,计算机专业理学博士
北京大学,计算机专业理学学士
主要成果/荣誉
- 大模型训推加速:在昇腾上构建细粒度并行、MoE路由机制优化、选择性zero3等技术,实现LLM训练MFU提升>10pct,发表LocMoE等论文;构建异构混合训练技术(如910B3&B4集群,V100&A800集群),实现整体加速1.69倍,入选华为GTS金牌专利包;在昇腾上构建负载感知的多实例调度、xPU协同推理、投机采样技术,推理吞吐提升>50%,时延降低>30%,发表专利2项
- 电信图计算加速:针对电信网络的高维属性、复杂异构的特点,构建自动机图压缩、无锁位运算、张量降维等技术,相比前沿的图引擎(TigerGraph/PyG/DGL)实现1.5倍+的性能提升,且内存占用降低一半,获得国际顶尖图计算竞赛GraphChallenge创新奖、华为金牌个人等荣誉
- 图机器学习系统研发:针对金融数据的高维异构属性,构建高性能数据加载和解析模块,实现2倍+的性能提升;在图存储中构建内存实时裁剪模块,支持用户自定义采样udf,内存峰值占用降低31%且对模型影响控制在1%内
- 图数据库系统研发:作为开源项目gStore的主要贡献者,带领项目成员构建查询计划优化器、内外存索引改进等技术,累计贡献超过十万行代码,大幅提升查询性能(100×)和数据规模(40×);在GPU上加速子图匹配、三角形计数等算法,分别实现>10×和2×的性能提升,发表GSI和SGSI等论文
个人介绍
曾立博士2016年从北大本科毕业,2021年从北大博士毕业,发表论文10篇+、专利5项+,获得国际顶尖图计算竞赛GraphChallenge创新奖、华为天才少年/金牌个人/代码英雄/金牌专利等荣誉,是图数据库系统gStore等知名开源项目的主要贡献者,主要研究大模型训推加速、向量计算、图计算等方向。
代表性论文
1. Li Zeng (instructor). SLO-Aware Scheduling for Large Language Model Inferences. arXiv, 2025.
2. Li Zeng (instructor). WindVE: Collaborative CPU-NPU Vector Embedding. arXiv, 2025.
3. Li Zeng (second author). LocMoE: A Low-Overhead MoE for Large Language Model Training. IJCAI, 2024.
4. Li Zeng, et al. WindGP: Efficient Graph Partitioning on Heterogenous Machines. arXiv, 2024.
5. Li Zeng, et al. KBQA: Accelerate Fuzzy Path Query on Knowledge Graph. DEXA, 2023.
6. Li Zeng, Lei Zou, M. Tamer Özsu. SGSI: Scalable GPU-friendly Subgraph Isomorphism. TKDE, 2022.
7. Li Zeng, et al. HTC: Hybrid vertex-parallel and edge-parallel Triangle Counting. HPEC, 2022.
8. Li Zeng, et al. SQLG+: Efficient k-hop Query Processing on RDBMS. DASFAA, 2022.
9. Li Zeng, Lei Zou, M. Tamer Özsu, et al. GSI: GPU-friendly Subgraph Isomorphism. ICDE, 2020.
10. Li Zeng, Lei Zou. Redesign of the gStore system. FCS, 2018.