ChainCatcher melaporkan bahwa model DeepSeek-V3.2-Exp secara resmi dirilis dan open source hari ini. Model ini mengadopsi arsitektur Attention Sparse, yang secara efektif dapat mengurangi konsumsi sumber daya komputasi dan meningkatkan efisiensi inferensi model. Saat ini, model tersebut telah resmi tersedia di platform layanan model besar Huawei Cloud MaaS. Untuk model DeepSeek-V3.2-Exp, Huawei Cloud masih menggunakan solusi paralel EP besar untuk deployment, menggabungkan strategi paralel konteks yang ramah terhadap urutan panjang berdasarkan struktur Attention Sparse, sekaligus mempertimbangkan latensi model dan kinerja throughput.