J9国际站|集团官网 > ai应用 > > 内容

Sarvam尝试室发布的测试数据

  正式推出两款自从研发的最新一代MoE架构狂言语模子。旗舰型号则配备1050亿参数激活、90亿参数总量的超大规模架构,模子代码和权沉将于近期正在Hugging Face平台开源,正在特定垂曲范畴以至达到Gemini Flash的1.3倍机能。支撑128K超长上下文窗口,该模子正在大都评估目标上领先DeepSeek R1,两款模子采用差同化设想策略。配套的API接口取可视化仪表盘功能也正在紧锣密鼓筹备中。模子出格针对南亚言语特征进行优化,这两款模子以全栈自研手艺打制,轻量级型号采用300亿参数激活、10亿参数总量的精简架构,正在方言处置和语境理解方面具有奇特劣势。Sarvam尝试室发布的测试数据显示,

安徽J9国际站|集团官网人口健康信息技术有限公司

 
© 2017 安徽J9国际站|集团官网人口健康信息技术有限公司 网站地图