南山企业团队发布UniWorld-V2图像模型 在多模态AI领域实现架构革新
创始人
2025-11-11 09:17:06
0

深圳新闻网2025年11月11日讯(深圳特区报记者 曹欣)近日,南山企业深圳兔展智能科技有限公司与北京大学UniWorld团队联合发布新一代图像编辑模型UniWorld-V2。根据公开评测报告,该模型在GEdit-Bench和ImgEdit等权威测试基准中的综合得分已超越OpenAI的GPT-Image-1等国际顶尖闭源模型,尤其在中文指令理解与精细化编辑任务中展现出显著优势。

UniWorld-V2的核心突破在于其创新提出的UniWorld-R1训练框架。该框架首次将强化学习策略优化应用于统一架构的图像编辑模型,通过多模态大语言模型作为奖励机制,提升了模型与人类意图的对齐能力。

值得注意的是,在AI领域,最顶尖的性能往往被锁在闭源的“黑箱”里(如OpenAI、Google的模型)。UniWorld-V2不仅实现了在多项权威基准测试关键性能指标上对顶级闭源模型的超越,同时保持完全开源。据悉,兔展与北大团队于今年5月开源了采用统一理解与生成架构的视觉模型UniWorld-V1,其技术路径的公开,早于谷歌8月发布的同类知名模型Nano Banana约三个月。有观察人士认为,此次突破因其架构的根本性创新,有望成为视觉领域的“GPT时刻”,为该领域的发展打开全新局面。

目前,该技术已在产业端快速落地。据悉,UniWorld-V2已服务超过50家行业龙头客户,尤其在跨境电商领域,其能精准保持商品材质、光影与结构细节的特性,为“中国制造”产品走向全球市场提供了强大的内容生成工具。

编辑:刘晓宇

相关内容

热门资讯

AI解锁会议新价值,腾讯会议+... AI正在解锁会议新价值,助力企业打造提质增效的协同能力。在2025腾讯全球数字生态大会上,腾讯会议公...
速领!近屿智能10000次第六... 近屿智能宠粉福利重磅上线!即日起面向审核客户免费送出10000次AI得贤招聘官第六代AI面试智能体使...
光网络迈向AI-ON,助力构建... 【法国,巴黎,2025年10月14日】在NetworkX 2025期间,全球云网宽带产业协会WBBA...
2025站酷设计周发布AI设计... 10月28日,2025站酷设计周在北京开幕,今年的主题为“AI时代的超级设计师”,会上正式发布站酷A...
智启AI文娱新生态:2025科... 11月6日下午,2025科大讯飞全球1024开发者节AI文娱生态战略发布会在合肥圆满举办。发布会以“...
艺术家杨帅作品《APPLE/苹... 近日,2025釜山国际艺术节(Busan International Art Festival,以下...
株洲炎陵旅游环线崛起新地标 远... 本文转自:人民网-湖南频道近日,株洲炎陵县绿水青山间,远山蓝康养基地项目建设现场一片火热。尘土飞扬中...
深城交等成立低空运营服务公司,... 人民财讯11月11日电,企查查APP显示,近日,深圳市智德低空运营服务有限公司成立,注册资本2000...
AI板块集体回升,福昕软件涨超... 每经AI快讯,11月11日,AI板块集体回升,福昕软件涨超5%,浙文互联、凡拓数创、凌云光、创业黑马...
北京本周三、周日将北风呼啸,双... 本周将有两次冷空气活动。12日白天有3级左右偏北风,山区阵风较明显;13至14日北风暂停,气温略有下...