本文来源: admin
8
|
蚂蚁百灵正式推出Ling-2.6-flash一款总参数量104B、激活参数7.4B的Instruct模型。该模型主打Token效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 据权威三方评测Artificial Analysis数据,Ling-2.6-flash展现了突出的Token Efficiency优势,以15M output tokens实现了26分的Intelligence Index,在保持较强智能水平的同时,将输出消耗控制在相对更低的位置。 据了解,Ling-2.6-flash沿用了Ling 2.5的混合线性架构设计,这种高度稀疏化的MoE架构在硬件表现上优势明显。 在4卡H20条件下推理速度最快可达到340 tokens/s,Prefill吞吐达到Nemotron-3-Super的2.2倍。 在Output Speed测评中,Ling-2.6-flash以215 tokens/s的稳定输出速度位列同参数级别模型的第一梯队。 从Token消耗来看,Ling-2.6-flash的智效比显著提升。 在Artificial Analysis完整测评中,Ling-2.6-flash总消耗为15M tokens,而Nemotron-3-Super等模型达到或超过110M tokens。这意味着,Ling-2.6-flash仅用约1/10的token消耗完成了同类评测任务。 Ling-2.6-flash面向Agent场景进行了定向增强,在控制Token消耗的前提下,依然保持了极强的任务执行力,模型在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等Agent相关基准上达到同尺寸SOTA水平。 与此同时,Ling-2.6-flash在通用知识、数学推理、指令遵循及长文本解析等维度保持优秀水准。 API定价方面,Ling-2.6-flash输入每百万tokens定价0.1美元,输出0.3美元。目前,Ling-2.6-flash的API已正式向用户开放,并提供为期一周的限时免费试用。 用户可以通过OpenRouter、百灵大模型tbox获取对应服务。据了解,该模型后续将通过蚂蚁数科发布商业版本LingDT,服务全球开发者及中小企业。 |
大疆并没有试图用一款惊世骇俗的产品征服所有人,而是显露出一种不同于往日的姿态——...
电商圈的气氛有些微妙。商家社群里,讨论“模型跑得怎么样”的声音,正在与“优惠券力...
荣耀今日正式推出定位中高端市场的WIN H7电竞游戏本,至高搭载酷睿i7-14650HX处理器与...
采用180广角蓝光显尘技术,探照距离约30cm,可实现30倍放大显尘,在床底、沙发下、墙...
蚂蚁百灵正式推出Ling-2.6-flash一款总参数量104B、激活参数7.4B的Instruct模型。该模...
华为Mate90系列将率先搭载全新的鸿蒙7.0系统。此次系统更新的核心亮点在于端侧AI的深...
支付宝今天宣布AI付正式支持OpenClaw(龙虾)类AI智能体,用户可在AI智能体中直接完成...
去年小米数字旗舰阵容迎来了重大调整,新增了Pro Max版本。小米17系列目前已经推出了...