关于我
我是一名从事 AI 基础设施与大模型工程的工程师,毕业于清华大学电子工程系与交叉信息研究院(本科/硕士)。长期关注高性能训练/推理系统的设计与实现。
研究与关注方向
- 大模型训练与后训练(pretrain / post-train)的系统优化与工程实践
- GPU 资源高效利用与性能调优(显存 / 带宽 / 并行度 / 算子融合)
- 分布式训练与推理架构(并行策略、通信优化、调度与容错)
- 工程化与可复用性(可维护的基础设施、工具链与最佳实践积累)
联系我
- LinkedIn: @hanshe
- 知乎: @han-shen-86
- GitHub: @shenh10
经历概览
| 时间 | 经历 |
|---|---|
| 2010 - 2015 | 清华大学 电子工程系(本科) |
| 2013 - 2015 | Cisco Systems, San Jose(实习/合作) |
| 2015 - 2018 | 清华大学 交叉信息研究院(硕士) |
| 2017 - 2020 | 地平线机器人(CV 算法工程师) |
| 2020 - 2021 | GPU 创业公司(AI Infra) |
| 2021 - 2025 | 快手(AI Infra) |
项目
- PaperCache — AI 驱动的论文阅读博客,让 LLM 帮你读论文