Tencent yuanbao has pulled ahead of bytedance ai apps.
this is going to be interesting to watch
QwQ 32B is out! Comparable benchmark to DeepSeek R1 with about 20x less parameters!
View attachment 147084
since Lenovo and Meta-X partnered up for domestic DeepSeek all in one machine, it has sold over 1000 units covering almost 10000 cards, Covering medical, education and manufacturing.2025年3月7日,北京——正值全国“两会”如火如荼之际,“人工智能+”与“智能终端”等热点话题引发广泛关注,凸显了业界对AI技术的高度重视。自2025年2月5日联想集团与国产GPU领军企业沐曦股份联合发布首个国产DeepSeek一体机解决方案以来,这一软硬协同的AI产品迅速成为行业焦点。截至今日,该解决方案累计发货量已突破千台,配备沐曦国产GPU卡近万张,覆盖医疗、教育、制造等十余个核心行业,标志着国产AI产业落地的重要里程碑。
N260 can infer 14B model at 110-130% of main line GPU.搭配沐曦曦思N260国产GPU的一体机可支持在本地部署DeepSeek各种参数蒸馏模型,实测数据显示,在相同并发条件下,DeepSeek-R1-Distill-Qwen-14B模型推理性能达到国际主流GPU的110%-130%。而旗舰版DeepSeek训推一体机基于联想问天WA5480 G3 AI服务器搭载曦云C500国产GPU,性能比肩国际一流水平,实测671B满血版模型针对基于4K上下文的用户真实使用环境,在高达64并发时总吞吐量达到1575.4tokens/s,每用户实际可用吞吐达到24.6tokens/s,而在1024个用户并发访问的极限测试时,实现了3725.1tokens/s的极限吞吐。沐曦和联想的技术团队通过编译器优化、张量/数据并行、MLA、FuseMoE等技术手段,仍在持续刷新性能上限。