
博览会上,国家数据局发布了首批高质量数据集建设先行先试工作名单。经厦门数据管理局推荐、国家数据局评审,众数(厦门)信息科技有限公司(简称:众数信科)申报的“文鳐船舶与海洋工程行业垂直大模型高质量数据集”成功入选。

基于跨源融合与动态治理理念,构建“开源数据+企业专业知识+产学研项目”的多源数据体系,基于国际海事公约、船舶法规、船级社规范、港航气象服务、船舶技术手册等7大类跨学科知识,联合厦门理工学院、福船集团、中船九院等企业构建含20多万专业术语的垂直知识库。
采用混合扩散模型+机器视觉技术对海事法规文件、航运管理文件、技术说明文件等等据统一标注,建立自动化清洗流程消除规范矛盾条款,与气象等单位实时对接更新航运气象数据,动态校准灾害预警阈值,形成“数据采集-清洗-标注-更新”的全流程治理体系,为模型训练提供高质量多模态数据支撑。
众数信科凭借在船舶与海洋工程领域深厚的数据治理能力与行业大模型实践经验,获得国家层面认可。以此为契机,公司将通过技术验证、场景拓展、标准构建与机制创新,持续推动高质量数据资源建设与人工智能应用深度融合,为行业数据治理与价值挖掘提供可复制、可推广的路径参考。