Jinse Finance melaporkan bahwa pada 17 September, makalah DeepSeek-R1 tampil sebagai artikel sampul di "Nature", dengan pendiri dan CEO DeepSeek, Liang Wenfeng, sebagai penulis korespondensi. Tim peneliti membuktikan melalui eksperimen bahwa kemampuan penalaran model bahasa besar dapat ditingkatkan melalui pembelajaran penguatan murni, mengurangi beban kerja input manusia, dan menunjukkan kinerja yang lebih baik dalam tugas matematika, pemrograman, dan lainnya dibandingkan model yang dilatih dengan metode tradisional. DeepSeek-R1 telah mendapatkan 91.1k bintang di GitHub dan mendapat pujian dari pengembang di seluruh dunia. Asisten profesor dari Carnegie Mellon University dan lainnya menilai bahwa model ini telah berkembang dari pencari solusi yang kuat namun tidak transparan menjadi sistem yang mampu melakukan percakapan seperti manusia. Nature dalam artikel Editorial menegaskan bahwa ini adalah LLM arus utama pertama yang diterbitkan setelah peer review, merupakan langkah menggembirakan menuju transparansi, peer review membantu memperjelas prinsip kerja LLM, mengevaluasi efektivitasnya, dan meningkatkan keamanan model.