南山企业团队发布UniWorld-V2图像模型 在多模态AI领域实现架构革新
创始人
2025-11-11 09:17:06
0

深圳新闻网2025年11月11日讯(深圳特区报记者 曹欣)近日,南山企业深圳兔展智能科技有限公司与北京大学UniWorld团队联合发布新一代图像编辑模型UniWorld-V2。根据公开评测报告,该模型在GEdit-Bench和ImgEdit等权威测试基准中的综合得分已超越OpenAI的GPT-Image-1等国际顶尖闭源模型,尤其在中文指令理解与精细化编辑任务中展现出显著优势。

UniWorld-V2的核心突破在于其创新提出的UniWorld-R1训练框架。该框架首次将强化学习策略优化应用于统一架构的图像编辑模型,通过多模态大语言模型作为奖励机制,提升了模型与人类意图的对齐能力。

值得注意的是,在AI领域,最顶尖的性能往往被锁在闭源的“黑箱”里(如OpenAI、Google的模型)。UniWorld-V2不仅实现了在多项权威基准测试关键性能指标上对顶级闭源模型的超越,同时保持完全开源。据悉,兔展与北大团队于今年5月开源了采用统一理解与生成架构的视觉模型UniWorld-V1,其技术路径的公开,早于谷歌8月发布的同类知名模型Nano Banana约三个月。有观察人士认为,此次突破因其架构的根本性创新,有望成为视觉领域的“GPT时刻”,为该领域的发展打开全新局面。

目前,该技术已在产业端快速落地。据悉,UniWorld-V2已服务超过50家行业龙头客户,尤其在跨境电商领域,其能精准保持商品材质、光影与结构细节的特性,为“中国制造”产品走向全球市场提供了强大的内容生成工具。

编辑:刘晓宇

相关内容

热门资讯

“跨年好去处”搜索热度飙升!年... 近年来,民众迎接新年的形式愈发多元,不论是游览名胜,还是畅玩冰雪,都颇具仪式感。今年元旦共有3天假期...
每周股票复盘:邦彦技术(688... 截至2025年12月26日收盘,邦彦技术(688132)报收于18.74元,较上周的18.45元上涨...
2025年热贡文化唐蕃古道行兰... 本文转自:人民网-青海频道黄河之约·金城相会2025年热贡文化唐蕃古道行兰州站农文旅商推介活动启幕黄...
《徐霞客游记》中两次提及的报恩... 从大理市区到鸡足山虽然有点远,但这座曾被徐霞客在他的游记中两次提及的报恩寺的吸引力也是显而易见的。不...
崇明的海风吹进浦江东岸,足不出... 这个周末,来自崇明的海风,吹进了浦江东岸,邀请都市人足不出“沪”,体验另一种“向往的生活”。12月2...
崇明文旅推介嘉年华亮相浦东前滩... 今天(12月27日),“域见上海 申爱崇明”崇明文旅推介嘉年华在浦东新区前滩公园巷举行。现场,近70...
抖音2025文旅报告揭晓!万岁... 12月24日抖音生活服务发布《2025文旅数据报告》郑州入选全国十大热门旅游城市洛阳、开封跻身全国十...
2025「Ai+消费品」日常生... “AI+消费品”是将生成式AI、计算机视觉等技术作为核心功能的产品,主要面向普通消费者。其发展历经“...
城市徒步新玩法!徐家汇“博物行... 徐家汇商圈 “如今看到的徐家汇空中连廊于2024年竣工,简洁雅致的造型和通透的结构,将连廊巧妙融入商...
人类基准测试大翻车:样本不足、... 我们经常在一些对比 AI 性能的测试中,看到宣称基础模型在自然语言理解、推理或编程任务等性能超人类的...