【[35星]DeepSeek_Simulator:一款针对NVIDIA Hopper架构的深度学习推理性能模拟器,能快速估算DeepSeek V3/R1在不同硬件上的表现。亮点:1. 支持H800和H20等Hopper架构GPU;2. 提供多种并行和重叠计算方法;3. 提供详细的性能分析图表】
'DeepSeek Simulator: A test-based Performance Simulator for DeepSeek V3/R1'
GitHub: github.com/shenh10/DeepSeek_Simulator
性能模拟 深度学习 硬件优化 AI创造营