DeepSeek с отворен код нов модел V3.1 · TechNode
На 20 август DeepSeek обяви отворения код на новия си модел V3.1-Base на Hugging Face. Според компанията моделът има приблизително 685 милиарда параметъра, а дължината на контекста му е разширена до 128K. По-рано същата вечер DeepSeek уведоми потребителите, че техният онлайн модел е надстроен до V3.1 с дължина на контекста 128K. Тази версия може да…
DeepSeek с отворен код нов модел V3.1 · TechNode Read More »