以AI赋能AI,澳鹏不断提升数据服务效率
创始人
2025-03-12 18:14:07
0

大模型与生成式AI无疑已经成为实实在在的效率和增长引擎,而DeepSeek的问世则证明了算力和算法对于大模型普及的制约正在迅速降低,规模化的高质量标注数据特别是行业垂直领域(垂类)数据,正在成为大模型普及的下一个战场。2025年2月底澳鹏发布的年报显示:2024年公司中国业务营收突破4.2亿,年增长达到71%,其中的大模型/AIGC业务增长了526%,几乎所有AI龙头,特别是大模型AI企业都成为了澳鹏的客户。

澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示,与全球大模型更侧重通用性和多语言多语种模型泛化的模式不同,中国大模型更侧重"通用+垂直领域",这意味着中国大模型在未来行业应用场景、特定垂直领域创新方面独树一帜,也更在"局部领域"更容易实现 AI 垂类实践的突破,对特定行业和社会生产力的大幅快速提升。

澳鹏Appen公司的2024年全年报显示,经调整后的公司年增长16%、2024年下半年大模型收入占28%。在澳鹏中国,大模型及大模型相关业务已经占据了营收的40%。澳鹏自2023年中旬推出大模型相关产品和服务,仅仅一年多的时间发展成为了第一大业务,用"爆发"形容并不为过。2024年,澳鹏中国全年实现了4.2亿人民币营收,其中大模型及大模型相关业务营收达到1亿人民币。

自2023年率先在AI数据服务行业中推出大模型智能开发平台以来,几乎所有的互联网、科技、AI和大模型头部客户都找到了澳鹏,与澳鹏团队捆绑式紧密合作,共同应对大模型的数据洪流。例如,基于澳鹏大模型平台多模态数据处理能力,澳鹏为某AI科技厂商提供图像文本描述数据服务工作,提供高质量图文对超过50亿对,充分满足了图文大模型的数据需求。正是"笨鸟先飞",提前"押注"投资技术和研发,让澳鹏在行业洗牌中脱颖而出,跃升为行业龙头。

虽然公司在2024年取得了跨越式发展,但澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士认为,以DeepSeek等大模型为代表的大模型红利才刚刚开始,AI数据服务行业将进入10-20年的景气周期,澳鹏中国将在技术、交付、安全和渠道等方向持续布局,其中的战略重点是技术和交付。而澳鹏作为AI数据服务行业的龙头,其面向未来十年超级周期的布局,也将影响整个行业的发展方向。

技术和研发是澳鹏中国持续性战略投资的重要方向。田小鹏博士表示,技术是绝对生产力,未来5年,澳鹏中国将向研发再投入2-3亿元人民币,以确保公司在大模型超级周期中的持续竞争力,公司也将持续转型为算法辅助型、深化垂直领域的数据服务能力,同时通过人机协同模式提升数据标注的专业性和准确性。

澳鹏中国研发负责人、产品和工程副总裁钱程介绍,公司目前80%以上的研发人员都参与了大模型相关的研发任务,主要研发方向包括面向大模型的数据服务平台、面向大模型的数据标注工具以及大模型相算法的研发和应用等。2025年,澳鹏中国将投入研发资源打造智能化成品数据集生产管理平台,通过自动化的数据标注、清洗挖掘和质量评估快速构建大规模高质量成品数据集,为大模型的模型训练提供高质量数据养料。

此外,随着大模型应用向垂直领域的不断深入,澳鹏中国将结合自身在大模型和各垂直领域数据服务中积累的丰富经验,研发高精尖垂类数据标注平台,澳鹏中国计划在2025年上半年推出专业的大模型医疗数据标注平台和具身智能数据标注平台,进一步赋能垂直领域客户构建高质量模型训练数据。

当前正处于超级周期的启动阶段,大模型发展迅猛且竞争激烈。许多AI数据标注项目具有实验性质,澳鹏需要迅速调整相关的平台和资源以适应不同的数据需求。钱程指出,大模型的发展,尤其在后训练阶段非常迅速,客户不断尝试新方法以优化效果。澳鹏团队与客户紧密合作,支持模型训练的数据需求,助力模型能力的不断提升。

对于尝试性实验项目,澳鹏需要迅速构建数据处理工具和工作流程,采集和标注数据,并进行结果训练和验证。这需要一个灵活的平台工作流、自定义标注模板和敏捷的项目管理。澳鹏的大模型智能开发平台通过自定义模板引擎,能够在几分钟内快速配置数据标注模板,而定制化小型工具的开发则可在几天到一周内完成。

钱程指出,客户需求快速迭代,创意层出不穷,澳鹏的产品研发团队为深度参与在这一快速发展的赛道而感到兴奋。一方面,他们积极跟进国内外大模型训练的技术变化;另一方面,与客户实时交流前沿发展趋势,共同探讨数据服务的构建方法。

"以AI赋能AI"是澳鹏产品研发团队不断提升数据服务效率的宗旨,为了提升团队的生产力和效率,澳鹏在数据处理和生产管理中广泛应用大模型,替代传统算法。这不仅大幅提高了技术和工程团队的代码编写效率,还帮助数据交付部门提升了数据服务和项目管理的智能化水平。

在大模型时代,尽管之前有不少科技企业都有自己的数据标注工具或平台,但随着大模型和生成式AI需求的激增,企业越来越依赖澳鹏这样的外部专业数据平台和服务商,既能满足不断变化的工具和平台开发需求,又能结合垂直领域专业标注人员的RHLF强化学习,一体化满足大模型和生成式AI的持续迭代要求。

面向垂直领域的交付能力也是澳鹏的战略投资方向。继通用知识后,专业知识是大模型下一步的重点发展领域。澳鹏在已有垂直领域能力的基础上, 2024年开辟了金融、法律、音乐、多语种、文学、TTS、数学、医疗、代码等九个大模型垂直领域团队,专门负责开发和培养这些垂直领域的复合型人才,以及承担相应的数据服务项目。

自2023年下半年起,澳鹏组建了400+金融背景全职团队,其中拥有金融、经济或财会学本科及以上学历占比99%,70%持有基金或证券从业资格,支持风险管控、数据分析等金融应用开发,并具备完善的数据安全合规体系。

2024年,澳鹏在代码大模型领域取得显著增长,拥有120+全职技术人员覆盖主流编程语言,提供代码生成、调试等服务,业务扩展至能力评估、运维、测试等场景,团队规模翻倍,并持续积累高质量代码数据集,确保代码模型在多种编程场景和任务类型上的泛化能力。

此外,澳鹏在大模型各垂类领域都拥有丰富的专业人才资源:在法律领域,拥有专业的法律人才,涵盖法律检索、庭审、风控体系建设等核心能力;多语言领域,团队覆盖200+语种,具备丰富的多语言项目交付经验;音乐领域,拥有500+兼职音乐专业人员支持编曲、标注、制谱等任务;TTS领域,拥有数十个国家TTS采集经验,录音棚覆盖全国主要城市;文学领域,团队成员均具备深刻的文学理解与鉴赏能力,支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展……澳鹏凭借强大的专业团队和丰富经验,持续为大模型提供高质量数据支持。

相关内容

台积电给华为造芯片,难怪A...
2025年,全球AI产业迎来了一场历史性变革,DeepSeek通过...
2025-03-12 22:40:59
机构看好AI模型及应用,信...
截至收盘,中证信息安全主题指数上涨1.0%,中证软件服务指数上涨0...
2025-03-12 20:41:08
学汽车维修技术和厨师哪个好...
学汽车维修技术和厨师哪个好?出现这种问题多久了?做过哪些检查或维修...
2025-03-12 20:35:54
谷歌开源单卡最强多模态模型...
智东西 编译 | 程茜 编辑 | 心缘 智东西3月12日报道,刚刚...
2025-03-12 20:10:52
原创 ...
据环球时报官方媒体报道,菲律宾众议院正式对副总统莎拉·杜特尔特提出...
2025-03-12 20:10:21
以AI赋能AI,澳鹏不断提...
大模型与生成式AI无疑已经成为实实在在的效率和增长引擎,而Deep...
2025-03-12 18:14:07

热门资讯

王家大院现在的所有者还是王家的... 王家大院现在的所有者还是王家的后人吗?我说的是山西灵石的王家大院...现在不知道是被收为国,还是仍为...
写字好看的女生有什么优势 写字好看的女生有什么优势见字如见人,字好看 很加分的。学校有书法比赛时很吃香哦感觉没有打字快的女生有...
杨大勇的妻子是谁 杨大勇的妻子是谁杨大勇的妻子是一位名叫王小丽的女性。据悉,王小丽与杨大勇相识于大学时期,两人相恋多年...
我家办白事,朋友给我发红包,我... 我家办白事,朋友给我发红包,我该怎么说感谢话我家办白事,朋友给我发红包,我该怎么说感谢话当家里有事情...
顶级绝伦推理片100部介绍 顶级绝伦推理片100部介绍 《白夜追凶》;可以说是刑侦国剧天花板了,逻辑,叙事方式,主演演技,这些几...
小猿众包骗局 小猿众包骗局小猿众包是小猿旗下的可以在家做题赚钱的兼职,平时如果时间充裕的情况下可以做做小猿众包挣个...
女生说男生丑萌什么意思? 女生说男生丑萌什么意思?丑萌就是又丑又萌,意思是男生在她的审美里不是好看的那种,但是又很戳她萌点就是...
自从和女朋友确定关系后,女朋友... 自从和女朋友确定关系后,女朋友为什么每天晚上发视频要我给她讲故事哄她睡觉?每次给她讲一个小时她都不睡...
外婆发外孙朋友圈说说有哪些? 外婆发外孙朋友圈说说有哪些? 1、天伦之乐,幸福便是如此简单。2、难得好时光,携孙儿共享天伦之乐,哪...
一个女生。让我去找她玩。是什么... 一个女生。让我去找她玩。是什么意思呢?求解。她是对你有好感的,不然也不会邀请你去找她玩。有可能把你当...