开源
-
阿里云开源Qwen3系列模型
2025-04-30
阿里云于近日正式开源了Qwen3系列模型,其参数量仅为DeepSeek-R1的三分之一,显著降低了使用成本。同日晚间,国家级算力服务平台——超算互联网宣布迅速上线了Qwen3系列的全部模型。此次上线的Qwen3系列包含六个Dense模型版本,分别为Qwen3-32B、Qwen3-14B、Qwen3-
-
盘古团队回应开源代码关切
2025-07-05
#盘古团队回应开源代码关切#盘古技术开发团队发表关于大模型开源代码相关讨论的声明,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合