关于我

我是一名从事 AI 基础设施与大模型工程的工程师，毕业于清华大学电子工程系与交叉信息研究院（本科/硕士）。长期关注高性能训练/推理系统的设计与实现。

研究与关注方向

大模型训练与后训练（pretrain / post-train）的系统优化与工程实践
GPU 资源高效利用与性能调优（显存 / 带宽 / 并行度 / 算子融合）
分布式训练与推理架构（并行策略、通信优化、调度与容错）
工程化与可复用性（可维护的基础设施、工具链与最佳实践积累）

联系我

LinkedIn: @hanshe
知乎: @han-shen-86
GitHub: @shenh10

经历概览

时间	经历
2010 - 2015	清华大学电子工程系（本科）
2013 - 2015	Cisco Systems, San Jose（实习/合作）
2015 - 2018	清华大学交叉信息研究院（硕士）
2017 - 2020	地平线机器人（CV 算法工程师）
2020 - 2021	GPU 创业公司（AI Infra）
2021 - 2025	快手（AI Infra）

项目

PaperCache — AI 驱动的论文阅读博客，让 LLM 帮你读论文