DeepSeek lanzó una serie de estrategias paralelas optimizadas en el cuarto día de la Semana de Código Abierto, incluyendo Dual Pipeline (un algoritmo de paralelismo de tuberías bidireccional que optimiza la superposición de computación y comunicación en el entrenamiento V3/R1), EPLB (Expert Parallel Load Balancer, que mejora la eficiencia de la asignación de recursos de computación) y una herramienta de análisis de superposición de computación y comunicación para ayudar a optimizar el rendimiento del entrenamiento.