2025-09-13 15:52:22 时尚 33
5月27日,蚂蚁模态在蚂蚁技术日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模成都高中内幕地址激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练数据。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产品,大模包括2个MoE架构的蚂蚁模态武汉高中泄露体验大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产品在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去技术探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
UIUC 李博:GPT
Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节
MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」
月之暗面“自卷”,Kimi智能助手官宣支持200万字无损上下文
启明创投发布2024生成式AI十大展望
元象首个多模态大模型 XVERSE
牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团
Sora 发布两周后,关于 Sora 的一些冷思考
技术壁垒这么多,AIGC 凭什么爆火?
大模型时代下的数字安全答案,藏在一本实战指南里
面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!
在 AI 战场里拿掉英特尔,PC 能活吗?
星尘数据MorningStar正式发布!狙击“数据债”成最大看点
国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地
大模型「进化手册」:AI 原生应用该如何落地?
昆仑万维开源「天工」13B系列大模型,0门槛商用
具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?
牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团
彩云科技DCFormer模型架构发布,效率是Transformer的两倍!
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕
超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文
共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕
"寻数计划"已发布,面向全社会征集高质量大模型语料数据
新能源时代,国产3D视觉「冲击」保守的汽车行业