DeepSeek объявляет об открытии исходного кода DeepGEMM
Deepseek объявила об открытии исходного кода DeepGEMM на третий день Недели открытого исходного кода. DeepGEMM — это библиотека, специально разработанная для лаконичного и эффективного умножения матриц общего вида (GEMM) с использованием FP8, с возможностями тонкой настройки масштабирования, как предложено в DeepSeek-V3. Она поддерживает как обычные, так и сгруппированные GEMM с использованием смеси экспертов (MoE). Библиотека написана на CUDA, не требует компиляции во время установки и компилирует все ядра во время выполнения с использованием легковесного модуля Just-In-Time (JIT). Библиотека FP8GEMM предоставляет поддержку для обучения и вывода V3/R1.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться

Данные: 10 адресов за 6 часов получили в общей сложности 210 000 ETH на сумму около 863 миллионов долларов.
Популярное
ДалееЦены на крипто
Далее








