DeepSeek объявляет об открытии исходного кода DeepGEMM
Deepseek объявила об открытии исходного кода DeepGEMM на третий день Недели открытого исходного кода. DeepGEMM — это библиотека, специально разработанная для лаконичного и эффективного умножения матриц общего вида (GEMM) с использованием FP8, с возможностями тонкой настройки масштабирования, как предложено в DeepSeek-V3. Она поддерживает как обычные, так и сгруппированные GEMM с использованием смеси экспертов (MoE). Библиотека написана на CUDA, не требует компиляции во время установки и компилирует все ядра во время выполнения с использованием легковесного модуля Just-In-Time (JIT). Библиотека FP8GEMM предоставляет поддержку для обучения и вывода V3/R1.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Советник экосистемы Solana Никита Бир стал руководителем продуктового направления X
Популярное
ДалееЦены на крипто
Далее








