2025硕果累累:市场、生态、技术三维度全面爆发
作为AI训练数据领域的标杆企业,海天瑞声在2025年交出了一份亮眼的成绩单,以“国内精耕、全球开拓”战略为引领,实现前三季度总收入56.69%的同比高速增长,在市场拓展、生态建设与技术创新三大维度均取得突破性进展。
在市场布局上,国内业务精准把握“数据要素市场化”与“国央企智能化”两大机遇,不仅稳固了互联网大厂基本盘,更成功切入运营商、物流、能源等国央企赛道,深度参与多地“数据可信空间”建设,实现相关业务从0到1的跨越,成为核心增长引擎;海外业务则紧跟全球AI巨头多模态能力爆发需求,通过并购东南亚基地构建超1500人的海外标注产能,完成中国香港、新加坡、美国子公司布局,并持续推进日本、韩国及欧盟本土团队建设,以深度本地化服务赋能全球客户。
生态建设层面,海天瑞声实现从“产品提供商”到“生态共建者”的战略转型。通过一系列关键合作织密生态网络:与视觉中国强强联合,整合合规版权库与数据处理能力,推出安全高质量的多模态数据解决方案;与头部机器人企业共建具身智能数据工程化平台,为人形机器人产业筑牢数据根基;与华为昇腾深化合作,联合发布DeepSeek数据飞轮智能体,提供“数据+算力”一体化服务;作为中国移动人工智能焕新社区内唯一专业数据服务商,深度参与国家“AI+”行动计划,成为产业智能化进程的核心数据伙伴。
技术创新上,公司双管齐下突破效率与能力边界:一方面持续丰富核心数据储备,不仅依托深厚语言学积累支持全球超300个语种/方言的数据处理,更重点布局金融、法律、教育等垂直行业高价值场景化数据集,为“AI+”行业深化应用提供精准“燃料”;另一方面升级平台与算法效能,新增200余个覆盖语音、视觉、文本领域的自研算法模型并集成至DOTS智能数据平台,显著提升数据生产自动化水平与复杂场景标注精度。其中,与清华大学联合研发的语音大模型“Dolphin”在40种东方语言测试中,平均词错误率降低超60%,极大提升了小语种AI应用的可用性。
行业变局凸显:数据治理迈入“多模态+模型驱动”新阶段
谈及2025年数据治理领域的最显著变化,李科指出,行业已从传统存量数据治理,全面扩展至合成数据与多模态数据治理,核心突破集中于非结构化数据的语义治理能力升级。“通过多模态大模型,我们能够自动识别视频风险内容、清理音频噪声,在复杂场景下完成高精度语义标注,数据治理正从规则主导转向模型驱动,效率与准确性实现双重飞跃。”
在实践过程中,海天瑞声也遭遇了行业共性挑战:政策合规层面,不同国家和地区监管要求差异显著,增加了全球交付的合规成本,亟需更具共识性的行业合规框架;技术落地层面,隐私保护与模型性能的平衡难题突出,传统脱敏方法易影响数据质量,而差分隐私、联邦学习等新技术的应用则对算力与系统架构提出了更高要求。
从行业差异化特征来看,2025年各领域数据治理重点已明确分化:金融行业聚焦隐私保护、可解释性与可审计性,核心围绕合规与风险控制;制造行业侧重实时性与边缘侧治理,数据治理直接服务于产线与设备智能化升级;政务领域则以语义统一和跨部门共享为核心诉求,大模型成为解决异构数据协同问题的关键手段。