A DeepSeek lançou uma série de estratégias paralelas otimizadas no quarto dia da Semana de Código Aberto, incluindo o Dual Pipeline (um algoritmo paralelo de pipeline bidirecional que otimiza a sobreposição computação-comunicação no treinamento V3/R1), EPLB (Expert Parallel Load Balancer, que melhora a eficiência da alocação de recursos de computação) e uma ferramenta de análise de sobreposição de computação-comunicação para ajudar a otimizar o desempenho do treinamento.