中报]格灵深瞳(688207):格灵深瞳2024年半年度报告

发布时间:2024-08-24 15:21:06 来源:工程案例

       

  一、 本公司董事会、监事会及董事、监事、高级管理人员保证半年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。

  公司已在本报告中详细阐述公司在经营过程中可能面临的各种风险,敬请查阅本报告“第三节 管理层讨论与分析”之“五、风险因素”。

  五、 公司负责人赵勇、主管会计工作负责人王艳及会计机构负责人(会计主管人员)杜家芳声明:保证半年度报告中财务报告的真实、准确、完整。

  本报告所涉及的前瞻性陈述,不构成公司对投入资产的人的实质承诺,请投资者注意投资风险。

  十一、 是不是真的存在半数以上董事没办法保证公司所披露半年度报告的真实性、准确性和完整性 否

  Artificial Intelligence,是研究和开发用于模拟、延伸 和扩展人的智能的理论、方法、技术及应用系统的一门技 术科学

  计算机视觉是利用一个代替人眼的图像传感器获取物体的 图像,将图像转换成数字图像,并利用计算机模拟人的判 别准则去理解和识别图像,达到分析图像和作出结论的一 种技术

  分布式计算的一种,利用互联网将巨大的数据计算处理程序 分解成无数个小程序,然后通过多部服务器组成的系统进 行处理和分析这些小程序得到结果并返回给用户

  互联网基础上的延伸和扩展的网络,将各种信息传感设备 与网络结合起来而形成的一个巨大网络,实现在任何时间、 任何地点,人、机、物的互联互通

  解题方案的准确而完整的指令描述,即以系统的方法描述、 处理问题的策略机制

  在靠近物或数据源头的一侧,采用网络、计算、存储、应用 核心能力为一体的开放平台,就近提供最近端服务。其应 用程序在边缘侧发起,产生更快的网络服务响应,满足行 业在实时业务、应用智能、安全与隐私保护等方面的基本 需求

  计算机视觉与计算机图形学高度交叉的一个重要研究方 向,突破传统的二维图像空间,实现三维空间的分析、理解 和交互

  多接入边缘计算(Multi-access Edge Computing),部署 在路侧,接入视频、雷达等多传感器的数据,并做多元化的分析、 融合处理,生成多维度交通感知数据

  某个坐标系下的点的数据集,包括三维坐标X、Y、Z,颜色、 分类值、强度值、时间等信息

  一种将基于深度学习的较大模型进行轻量化处理的技术, 用于降低模型运行算力要求,使得模型可以在小算力平台 运行

  一类人工智能主流算法的总称,可基于海量数据训练具有 大量隐含层的人工神经网络模型(即深度神经网络),使其 完成图像识别、语音识别等特定的人工智能任务

  一种软件开发方法,可应对快速变化的需求的一种软件开 发能力。敏捷开发(Agile Development)是一种以人为核 心、迭代、循序渐进的开发方法

  在机器学习或AI领域,通过大量带标签样本,通过 一定的方法,得到对应机器学习、人工智能模型参数的过 程

  利用两个相机拍摄同一场景的左、右两幅视点图像,运用 立体匹配算法获取视差图,进而获取深度图

  沿 x、y、z 三个直角坐标轴方向的移动自由度和绕这三个 坐标轴的转动自由度

  一个环境光标是由若干不可见光(如近红外)光源按一定的 位置编码组成的固定装置,多个不同编码的环境光标按照 一定规则布置在深瞳灵境空间中

  Beijing DeepGlint Technology Co., Ltd.

  北京市海淀区东升科技园北街6号院中关村科学城?东升科技园 10号楼8-10层

  公司主要办公地址变更情况请查询上交所网站()及指定媒体披露的《北京格灵深瞳信息技术股份有限公司关于 变更主要办公地址和传线)。

  1、报告期内,公司营业收入同期减少 67.41%,主要为大客户农业银行提出全面信创需求,公司产品需完成国产化适配和测试工作后方可供货,导致交付时间延后,叠加部分客户所处行业的市场环境下行等因素影响;

  2、本报告期,公司实现归属于母企业所有者的净利润、归属于母企业所有者的扣除非经常性损益的净利润转盈为亏,主要系公司当期营业收入同比下降;

  3、本报告期,经营活动产生的现金流量净额同比减少,主要系本报告期销售商品收到的现金同比减少。

  计入当期损益的政府补助,但与公司正常经 营业务紧密关联、符合国家政策规定、按照 确定的标准享有、对公司损益产生持续影响 的政府救助除外

  除同公司正常经营业务相关的有效套期保值 业务外,非金融企业持有金融实物资产和金融负 债产生的公允市价变动损益以及处置金融资 产和金融负债产生的损益

  企业取得子公司、联营企业及合资经营企业的投 资成本小于取得投资时应享有被投资单位可 辨认净资产公允市价产生的收益

  对于现金结算的股份支付,在可行权日之 后,应付职员薪酬的公允市价变动产生的损 益

  对公司将《公开发行证券的公司信息公开披露解释性公告第1号——非经常性损益》未列举的项目认定为的非经常性损益项目且金额重大的,以及将《公开发行证券的公司信息公开披露解释性公告第 1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因 □适用 √不适用

  根据国家统计局《国民经济行业分类》(GB/T4754-2017),公司属于“软件和信息技术服务业”(行业代码为I65)。根据《战略性新兴起的产业分类(2018)》,公司属于“新一代信息技术产业”中的“人工智能”行业。

  伴随人工智能技术的加速演进,围绕大模型等前沿热点领域的研究持续深入,生成式人工智能等新赛道为产业注入新的增长点。大模型已成为孕育新质生产力的沃土,自然语言处理、多模态等领域研发提速,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型将广泛赋能社会多个领域,产业应用将进一步加速落地,推动新一轮的科技革命与产业变革。

  我国格外的重视AI行业的发展,出台了一系列扶持政策和规划,强调AI和产业高质量发展融合,为高水平质量的发展提供新动能。2024年2月,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会,强调中央企业要把发展人工智能放在全局工作中统筹谋划,加快布局和发展AI产业,深入推动产业焕新,进一步深化开放合作,开展AI+专项行动,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态;2024年3月,《2024年国务院政府工作报告》提出深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群,这是“人工智能+”首次被写入政府工作报告中,体现了国家对数字化的经济和AI产业的重视。各地方政府也在积极实施“人工智能+”行动,印发各类政策推动构建AI生态,加强科技、产业与金融的协同,开放更多AI应用场景,与企业一同探索落地的商业模式。

  公司以“让AI造福人类,让世界更安全更宜居更健康”为愿景,专注于将先进的计算机视觉技术、大数据分析技术、机器人技术和人机交互技术与应用场景深层次地融合,提供面向智慧金融、城市管理、智慧商业、轨交运维、体育健康、元宇宙的AI产品及解决方案。

  公司经过多年的研发技术与积累,已有效掌握了多模态大模型技术、3D立体视觉技术、大规模跨镜追踪技术、自动化交通场景感知与事件识别技术、机器人感知与控制技术、沉浸式交互感知技术等方向的多项核心技术,凭借过硬的技术能力和长期的商业化经验,已成功在智慧金融、城市管理、智慧商业、轨交运维、体育健康五大领域实现落地应用,其中:智慧金融领域已覆盖农业银行全国各省市的上万家网点,包含智能安保、智能运营、智能风控等多个金融业务场景,同时,公司参与搭建某国有银行总行AI平台,并开始在其他国有银行分支行进行试点;城市管理领域已覆盖全国多省市的公安局、公安交通管理局、政法委员会等政府机关或企业和事业单位,车路协同感知MEC产品已进行交付,同时车载视频违规事件取证产品已在多省市开展试点;智慧商业领域主要收入来自排名前列的地产类客户,加强完善的智慧油站产品和解决方案在中国石化重新再启动试点应用;轨交运维领域公司自研的列车智能检测解决方案已在高铁和地铁项目 中落地应用,为列车的安全运维提供保障,在研产品己涵盖轨交机务、电务和工务三大场景;体 育健康领域公司发布了深瞳阿瞳目体育训考系统、体感交互系统、体育大数据系统系列新产品和解 决方案,开发体育教育市场的渠道产品,建设了国家人工智能学生体质健康测试标准化考场,体 育训考全流程解决方案已在全国多个校园试点应用、销售,大规模应用于北京、河北等多个区县 的初中学业水平考试体育现场中,也应用于北京某区的国家学生体质健康考试统测和某区的高中 年级体育毕业会考等场景中。除此之外,公司在元宇宙等领域进行前瞻性的布局,探索元宇宙领 域发展运营模式、开发多类型交互内容,公司产品、整体解决方案和基于大模型的行业应用的研 发和落地工作按计划有序推进。公司从客户的真实需求出发,面向智慧金融、城市管理、智慧商业、轨 交运维、体育健康、元宇宙不相同的领域的客户,提供对应的行业解决方案。 (三)主要经营模式 1、盈利模式 企业主要从事计算机视觉技术、大数据分析技术、机器人技术和人机交互技术的研发和应 用。公司的盈利来源于向客户提供面向应用场景的AI产品及解决方案获得出售的收益。公司 自主研发的AI产品最重要的包含智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台。 AI产品既可以标准化模式销售,也可按照每个客户需求进行产品组合,提供定制化服务,以整 体行业解决方案向客户交付。 2、研发模式 公司拥有完整的研发组织架构与创新机制,以用户需求为核心,采用迭代、循序渐进的敏捷 方法进行研发活动,并对整个产品生命周期进行管理,在过程中不断对执行结果和阶段目标进行 总结复盘,通过不断迭代完善产品质量和改进研发过程。公司具体的研发过程如下图所示: (1)在产品需求调研阶段,公司对行业发展趋势、市场规模和用户核心需求来做调研分析,并结合公司产品战略规划,由产品团队完成需求分析,确定产品的核心目标特性和功能,由研发团队进行技术路线)在可行性验证阶段,公司进行大量算法实验以寻找合理科学的解决方案,产品经理、算法工程师、软硬件开发工程师和测试团队密切配合,在产品负责人的协调下进行多次短平快的软件原型迭代,每一次迭代都会在产品实际使用场景中进行反复实验确认,通过与客户持续沟通,调整和优化,确认产品最终形态的各功能模块和参数指标,并明确研发周期。在整个过程中,算法团队负责完成实验场景的建设和数据收集,并进行验证性实验;软件开发团队负责针对应用场景进行原型验证和开发;智能硬件团队负责对硬件产品的相关指标进行可行性实验和评估。

  (3)在产品研发阶段,产品经理将总结可行性验证阶段的成果,转化为产品功能指标及开发任务,确保产品交付节点和产品定义与用户预期保持一致;算法和工程团队协同完成算法模型设计开发、数据收集清洗、功能特性开发等工作;测试团队按照产品定义对产品每个开发版本进行验收,并完成自动化测试脚本;智能硬件团队完成新硬件产品的选型评估和整体设计,有效评估产品适用性、稳定性、可靠性、国产化率等特性,并负责设备软件开发和集成,交付少量可以进行测试认证的工程样机。该阶段产品会发布多个内外部测试版本,在实践中进行快速迭代。

  (4)产品发布阶段是在产品完成核心功能开发后,产品经理建立产品的标准文档、销售价格、实施方案、售后体系,通过与质量、市场、销售等部门确认,满足目标市场的销售条件时,产品正式发布;新的硬件产品会在这一阶段完成小批量验证和量产导入,实现加工生产工艺所需要的工装硬件和工具软件;测试团队进行大量密集的现场测试,确保产品满足产品定义的各类功能指标,并完成质量验收。这一阶段的完成标志产品正式版本发布。

  (5)产品运营阶段在产品正式发布后,产品经理结合市场反馈与发展趋势,制定多个后续产品版本,不断创新,推出符合市场需求的产品新版本,以对产品进行持续的运营、维护和改进。

  针对标准硬件、配件及服务类采购,公司直接向供应商提出待采购产品或服务的需求,供应商按照指定的时间和地点进行交付;针对定制化硬件,公司采购主要原材料并发货至委外加工厂,由其进行生产加工。公司选择专业的代工厂,依托其已有的完善的品质控制、生产制造管理和硬件设施进行专业的代工生产。公司通过新产品导入、质量检验标准发布、生产工艺发布、测试检验工具发布等方式确保产品生产的有效性、一致性和稳定性。

  公司结合下业的业务特点与主要产品的市场定位,在直接销售体系的基础上,积极开发渠道商,向终端客户或渠道客户(含集成商)销售人工智能产品及解决方案,使产品以不同的方式触达更多的客户,提供更加及时、高效的销售服务。其中终端客户是指直接使用公司产品及解决方案的各行业领域客户,包括金融机构、政府部门、公安机关、企事业单位等;集成商是指承担系统集成、安装部署、运营维护等职能的企业,包括终端客户的项目总包方或其指定的工程服务商等。公司与客户直接对接需求,通过商务谈判、参与招投标等方式获取订单。公司建立了完善的直销服务体系,目前已在全国划分了华东、华中、华北、东南、西南、东北、西北七个大区进行区域化和行业化的矩阵式管理,以提供及时、高效的销售服务。

  二、 核心技术与研发进展 1. 核心技术及其先进性以及报告期内的变化情况 公司打造了底层AI技术平台——深瞳大脑,深瞳大脑作为公司核心技术的驱动平台,赋能 公司人工智能产品及解决方案的技术实现。深瞳大脑包含数据平台和训练平台,由数据采集、数 据预处理、数据标注、模型训练、模型优选、数据管理等模块组成。 数据平台支持多源多模态数据的自动收集和清洗归类,通过构建自动化处理为主、人工标注为辅的标注体系,形成海量增长的标签数据池,有效节省标注成本,提高了算法模型的研发效率;通过组建具有专业背景的标注团队,用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据,同时通过数据团队对开放数据的收集和挖掘,为公司在海量数据下训练高水平模型做好数据准备;训练平台则有效提高了模型训练的自动化水平,降低算法多平台部署应用的迁移难度,为算法高效生产及快速商业化应用奠定了重要基础;训练平台同时支持在海量数据中进行挖掘,主动触发模型更新训练,可以有效的提高算法的准确率和生产效率,并进一步提高产品的交付能力。目前,公司深瞳大脑可支持数十亿训练数据、数亿类别任务,数百亿参数多模态大模型的训练。训练平台生产高质量的算法,推动应用的落地,数据平台收集应用产生的高质量数据又促进算法的提升,从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环,为公司的高效研发创新与产业应用提供了有力支持。

  公司利用自研的底层 AI 技术平台深瞳大脑对数十亿训练数据进行清洗和预处理,并基于大规模数据训练数百亿参数的大模型,在海量数据下,研发了基于图像、语言、语音多种模态的弱监督大模型训练算法,节省了大量数据标注资源。针对海量数据中存在噪声的问题,研发了标签重写算法,高效地提升了数据质量。上述算法已投稿到国际顶级会议 ICLR2023、ICCV2023 和ECCV2024并被接收,公司已在业务中利用该大模型提升少样本场景的准确率,在复杂场景中效果远优于传统小模型。结合高质量的语言模型,公司正在研发多模态大模型,该模型能接受图像、语言等多种模态的输入,能够完成多模态融合理解,提升业务的应用潜力。

  跨平台模型训练技术用于简化AI算法生产,该技术基于自主研发的训练框架,和自主研发的预训练模型可实现常用业务AI算法的一键式训练,为常见业务中的分类、检测、分割等算法提供便捷快速的实用模型。针对不同应用场景的算法开发,公司自主研发的跨平台模型训练技术可将训练任务管理平台产出的模型自动发布到各种类型的显卡或平台,包括英伟达显卡、海思系列芯片、华为昇腾系列芯片、算能计算平台等,无需人工干预,从而达到模型快速高效交付的目的,可有效的降低研发成本,有助于提升产品的市场竞争力。基于自主学习的训练平台解决方案,也已经在公司多个重点项目上线,实施后大量长尾业务的迭代周期大幅缩短,准确率提升效果显著。

  3D立体视觉一般通过结构光、激光雷达等特殊传感器采集得到场景的深度信息,再利用深度信息和可见光信息一同计算出场景的三维图像。

  多目传感器标定与深度估计技术使用一对成本更为低廉的可见光相机组成双目系统,对场景深度信息进行估算,在达到普通结构光相机精度的同时,提高了相机的可靠性和易用性,并能覆盖更多的结构光相机无法工作的光线条件和场景。基于这项技术的输出,使公司的算法能更好地适应多种不同的场景和目标,进而对人体、物体、场景进行高精度的重建。

  运动姿态分析技术通过采集不同场景下人体姿态数据,通过自主研发的三维人体姿态估计算法,能够解决人体关键点数据采集不准确或不稳定的问题。公司基于单目相机的三维重构技术结合动作模型库及人体运动功能学的特点,优化了使用单目相机获取三维人体关键点的效果,解决了基于二维人体关键点进行判断的难题,使得运动姿态分析算法在三维人体上做出更为精准的判断,进而可以应用在体育健康与行为分析领域对人体三维姿态的准确识别与分析。

  运动姿态分析技术在智慧金融领域可以协助银行客户进行员工履职分析与管控,人员重点区域违规管控(如非授权人进入、员工缺岗等)、人员操作异常管控(如单人加钞、大额现金遗留等)、人员动作异常管控(如异常倒地、打架、各类防护舱业务等)等项目均达到较高的检测精度;而在体育健康领域,该技术可评判用户动作是否完成及标准程度,评判仰卧起坐、引体向上、跳绳、篮球交替运球、篮球护球训练等17项基础测试和训练动作时,也可具备较高水平的检测精度,公司在由北京图象图形学学会、清华大学、蚂蚁安全实验室等机构联合发起第一届花样滑冰动作识别挑战赛中,运用领先的运动姿态分析技术获得了冠军。3D重建与立体视觉分析技术在轨交运维场景可将离散的局部列车零部件数据进行融合和重构,得到列车标准模型,将几何模型分析、深度学习等技术运用到列车标准模型、点云数据、图片等多维度数据,进行零部件匹配和故障诊断。公司基于深度学习的点云配准技术已在多个学术数据集上取得第一,通过点云几何结构和基于Transformer的多层特征投票机制提升正确匹配点云比例,提升点云配准精度,在真实业务测试集上旋转向量误差小于 1 度、平移向量误差小于 0.3mm,该技术对产品落地起到了至关重要的作用。目前,公司产品已覆盖列车常见的190余种故障项点,项点处理速率超过20,000个/小时,在高级重要性项点的故障诊断成功率大于 95%,对于高精度测量的项点,测量精度到达亚毫米级别。

  企业具有国内领先的车辆识别技术,能够运用高精度目标检测与跟踪技术对大陆号牌、港澳号牌、非机动车号牌等多种类型的车牌进行多种尺寸和角度的识别,支持倾斜角度在45°范围内的车牌,准确率在 99%以上。同时,公司支持的机动车、非机动车、人体属性识别多达 50 余项,重点属性识别准确率超过95%。

  在对交通场景中车辆进行分析时,公司结合在人脸识别技术上的优势研发了多目标属性识别与对象关联技术。该技术能将车内驾驶员与车辆绑定,协助交通管理部门和公安部门查找可疑人员,提供破案线索。由于车内光线较暗、抓拍受挡风玻璃干扰、司乘人员人脸姿态不受控、人脸有遮阳板墨镜口罩等遮挡的原因,普通的人脸识别算法都会有较大的下降,公司在人脸识别技术上的优势能做到在以上困难环境下仍能达到较高的识别率。

  公司研发的交通场景理解及事件检测识别技术,基于自适应交通场景理解和车辆特征识别的技术能力,无需人工标注,可自动化识别闯红灯、不按导向行驶、不礼让行人等11种交通违法场景,同时结合车辆重识别技术可准确定位车辆位置,实现对交通视频的自动分析、事件预警和违法事件的自动审核。

  公司拥有完全自研的人脸识别算法和引擎技术,在多种光线条件、人脸角度的场景下都能达到较高的识别准确度。公司在研发过程中开源了TrillionPairs和Glint360K两个人脸识别数据集以及PartialFC训练代码,其中PartialFC相关论文已被视觉顶尖会议CVPR2022接收,推动了行业技术的发展。公司的人脸识别技术在公开数据集MegaFace上识别准确率达到99.1%。公司在公安部治安管理局亿级人像算法测试中,1比1人像比对测试万分之一误识率下的通过率为99.97%,5万样本比1亿级人像比对测试中首位命中几率大于98%,均高于行业平均水平。

  公司研发的百亿级人员聚类技术可支撑上万路摄像头接入并实时完成动态聚类,支持室内场景和光照、质量和姿态等都不受控的室外复杂场景中的大规模商用。

  为了达到上万路摄像头接入并实时完成动态聚类的应用要求,公司研发了海量数据以图搜图技术。公司研发的以图搜图引擎支持多架构、不同计算设备上的图片检索功能。针对检索频率高实时要求强的场景,以图搜图引擎支持英伟达全系显卡以及华为计算卡的图片检索。针对检索频率低实时要求不强,但图片数量较大的场景,单机可实现上亿人脸图片秒级返回,集群可实现数十亿级图片秒级返回。针对海量图片检索场景,以图搜图引擎实现了单机检索 30 亿人脸图片 20秒内返回结果的性能。配合集群可实现百亿级图片数十秒检索的性能。针对上亿特征占用显存巨大的问题,公司研发了短特征技术,利用该技术能节省至少 4 倍显存,同时召回率达到 99.9%。

  人脸属性表达技术在公共安全等场景具有广泛应用,同时也能辅助大规模人员聚类。公司研发的人脸属性包括年龄、性别、种族、表情、姿态、遮挡、模糊等多项属性。该技术使用单模型、多任务协同训练策略,利用各个属性任务之间的相关性来辅助训练单个模型,可在缩减运算资源的同时保证每个属性的精度。

  公司多场景广覆盖人脸活体识别技术可应用在闸机口等通行相关的场景,公司已积累了千万级的攻击样本,可防止相关人员通过打印照片、屏幕、3D面具等非活体人脸通过闸机。

  公司将实时定位与建图技术、机械臂视觉反馈技术、机器人路径规划与自主导航技术运用于轨交运维机器人等场景,算法适应性良好,机器人该场景中,以最高1m/s的速度做无碰撞运动,达到轨交运维应用所需的技术水平。其中,机器人实时定位与建图技术,又称SLAM技术,在室内和半户外场景下拥有良好的定位精度,在结构化的室内场景下,定位精度可达毫米级,在工业现场的半户外场景下,定位精度可达厘米级。同时,公司针对SLAM普遍算力要求比较高的问题做出了优化,完成SLAM模块向特定型号嵌入式主板的迁移和适配工作;机械臂视觉反馈技术,又称手眼协同技术,在机械臂重复性动作的场景中收到良好效果,得到视觉反馈之后的机械臂定位,较普通机械臂定位的精度有较大提升。同时,在保证精度的前提下,时间延迟不超过1秒,保证了精度和实时性;机器人路径规划与自主导航技术,包含机器人定点巡逻、远程临场、人员跟随等功能模块,运用于自动化检修场景中。

  公司的机器人虚拟示教技术,可以通过高精度3D重建技术,搭建虚拟列车检修空间,构建一个包含作业坑道、列车、机器人等元素,同时考虑物体碰撞、真实设备性能、环境噪声等因素的虚拟机器人作业空间。在虚拟空间内进行机器人示教,经过控制虚拟空间中的机器人进行采集位置确认工作,支持多人协作和远程操作,极大缓解项目实施过程中对线倍以上的实施速度。

  公司的机器人遥感技术则通过将虚拟点位下发给机器人,通过坐标空间变换、运动分解、轨迹规划等技术,使机器人获取在物理空间中可执行的动作指令,该技术既支持异步动作执行,也支持在线的虚拟机器人-真实机器人实时动作执行。为提升机器人自主规划和控制能力,公司将自主研发的多模态大模型作为机器人的大脑,使其逐步向具身智能靠拢。

  基于先进的人体跟踪和姿态分析技术,以及领先的三维场景重建技术,公司自主研发了“深瞳灵境”全新沉浸式交互感知系统,通过自研的边端结合的软硬件一体解决方案,深瞳灵境创新性的实现了多项全新技术和系统,包括支持远距离精确同步的多相机协同系统、在投影场景下完成人体成像的光学方案、高度精确的3D人体姿态重建技术等,能够在全国产高性能AI处理芯片支持的相机和边缘智能计算设备上实现完整的非侵入式人姿动捕方案。

  同时,公司还自主开发了游戏道具实时交互系统,通过部署环境光标和为人员佩戴或在道具上装载自研接收感应装置,依据环境光标,实时计算出位置和姿态,为用户更好的提供高度代入的交互体验,在给予用户沉浸体验的同时,通过高速计算系统使系统给出准确的交互反馈,达到了声、光、动一体的全新交互体验。

  公司利用多年积累的人体姿态估计技术和三维重建技术,建设了完整的软件框架来支持上层内容开发者,通过标准接口和标准能力,允许开发者快速完成交互内容建设,无需额外的门槛即可得到AI能力的加持。基于深瞳灵境解决方案,公司已在互动娱乐、文旅博展、教育培训创新教育等多个方向展开试点探索。

  截至报告期末,公司及控股子公司、孙公司共计拥有有效专利(不包含权利终止和转让)53项、有效软件著作权(不包含权利终止和转让)159项。

  1、研发全生命周期运营、一站式的数据治理平 台,包含数据集成、规范设计、数据质量监控、 数据资产管理、数据服务、数据安全等功能,支 持行业知识库智能化建设,支持大数据存储、大 数据计算分析引擎等数据底座,构建从数据接入 到数据分析的端到端智能数据系统,实现数据平 台数字化转型。 2、研发基于主动学习机制的自动化算法模型训练 生产系统,服务于公司的所有的领域,平台可满足 公司各产品线所需算法模型的需求,获取和挖掘 原始业务数据,为各业务领域提供高识别率的算 法模型。 3、完成智慧金融领域的大模型和知识库建设,能 够从监控视频中识别危险和异常行为,利用大模 型的表达能力,提升复杂场景的识别精度。 4、实现机器人在室内和半户外场景拥有稳定的自 动驾驶能力,达到毫米级精度。并实现实时时定 位与建图技术(SLAM)、移动体的轨迹规划与运 动控制技术、多机调度与协同技术。 5、提升大规模人群中人脸遮挡的算法识别能力, 优化带口罩、带帽子及质量较差图像的识别效 果。 6、研发自有图像预训练大模型,实现视频分类、 图片分类、少样本检测模型、少样本事件任务, 提升行为任务效果。 7、研发局部特征匹配算法,应用在依赖图像精确

  配准方向,也为后续目标定位、异常检测、多图 像融合、图像校对等任务提供支持。 8、研发基于单目的人体3D姿态估计算法和人体 表面重建算法,使金融、体育等场景中运动姿态 表达达到传统多目算法精度。 9、研发运动场景下的智能算法,实现对非标准动 作的评价与纠正,使多类运动项目达到或超越行 业标准的识别精度。 10、预研自有多模态大模型和有关技术,使其在 业务场景应用落地。

  1、完成研发具有实时智能、自主控制能力的工业 巡检机器人设备和交互系统,可适应任何场景和 列车,实现空间内的低速无人驾驶、机械臂视觉 引导、远程示教等功能,具有故障智能诊断、缺 陷自动定位、障碍物自主感知的能力。 2、完成研发一套高检测效率、高准确性、轻便、 快装的工务线路巡检设备,实现自动快速检测轨 道状态、缩短检修时间目标,完成线路巡检的数 字化、标准化流程建设,实现降本增效且适应提 速、高密度行车的要求。 3、完成研发面向轨交行业的可穿戴AI设备,基 于自研的算法、应用和硬件提供标准作业流程履 职助手,提高作业过程的规范性和安全性。 4、打造针对多种体育场景的三维运动交互产品及 多目协同解决方案,可支持100+的运动训练与考 试项目,具备视觉算法精度高、运动姿态评价准 的特点,体育运动解决方案已初步研发完成,在 多个用户场景持续迭代中;打造满足国家体质健 康统测、九年级中考、高中会考等场景下的人工 智能体育考试和评价方案,支持30+考核科目,并 结合体育考试系统平台,实现体育考试中组考、

  1和2、应用 于飞机、铁 路、公路、 桥梁等工业 检修领域。 3、应用于轨 交行业标准 作业流程的 数字化、智 能化场景, 及其它关注 生产安全和 生产质量的 工业巡检场 景。 4、应用于学 校、教培等 技能训练和 考试领域。 5、应用于文 旅、文博、

  检录、考试、成绩仲裁、检出等全流程管理。 5、开发面向沉浸式交互体验的基础设施、计算设 备、游戏应用和管理平台,软件方面,通过自研 的虚拟ID技术、视觉动捕技术、空间定位技术、 数字孪生技术,打造可部署在不同体量的沉浸式 体验场景;硬件方面,应用公司自研的高性能智 能摄像机产品和边缘计算产品,实现便捷易部署 的深瞳灵境感知系统,支撑大规模沉浸式交互系 统的商业化落地;打造深灵之心运管平台,提供 其全生命周期管理,包括设施管理、内容分发、 场馆运营支撑、开发者管理等。

  实现面向银行的智能视频图像分析和物联网解决 方案,覆盖云边端架构,具有合规操作监控、风 险事件预警、运营效率分析、大模型预训练、物 联网管理等功能。

  推出面向公安行业的视图大数据解决方案,开发 集视图大数据系统、视图库系统、地图服务、运 维管理平台、数据治理系统、多生物特征管理等 系统为一体的安防大数据平台。

  应用于公安 业务场景, 包括但不限 于科信、刑 侦、图侦等 业务领域。

  通过接入路口的高清摄像机视频流,基于视频图 像结构化识别算法引擎,完成路通参与者的 视觉识别,同时对路口各个方向,进行视频融 合,再结合雷达的探测数据,依赖雷视拟合技 术,完成雷达和视频数据的融合,最终形成各路 口完整的感知融合数据。

  实现车载移动状态下各类违背法律规定的行为的分析,包括 压线、占用公交车道、不礼让行人、占用应急车

  道、非机动车不戴头盔、非机动车超载等20余种 违背法律规定的行为;支持场景包括城市、高速、农村、铁 骑;支持记录违法车辆结构化信息及GPS位置; 支持报警记录的短视频及图片输出;支持车辆布 控报警及车辆实时结构化;支持行车记录视频存 储及配置;支持RTSP协议的视频流接入及远程预 览;支持远程升级。

  推出面向加油站智能化、数字化升级改造场景的 智慧油站解决方案,通过自研算法、引擎、应用 软件和硬件为加油站的经营决策提供量化数据支 撑,为加油站的安全管理提供智能化方法,为其 现场服务水平提供衡量指标。

  运用AI和可控光合作用等技术方法,开发 高效的光反应器和自动化控制工艺,实现稳定、 高产的微藻养殖技术并进行试产,提供以微藻为 基础的稳定饲料来源;建立一套主要是基于太阳 光、空气和水的具有较高自动化程度的自洽系 统,自组织的持续稳定经济的生产某种特定藻 类,并以该藻类作为生物质原料,进行深入开 发。

  研发无人机自主飞行负载模块,构建不依赖于卫 星定位的自主无人机系统,从事工业巡检任务。

  应用于铁路 公务段、桥 梁边坡、通 讯铁塔及设 施、采矿 业、电力、 建筑等领域 的工业巡 检。

  依托公司多年嵌入式硬件平台的积累,开发具有 不同算力、不同业务应用的国产化边缘计算产 品,输出公司领先的AI算法能力。通过云边结 合,实现算法动态从云端下发到边缘端,支持灵 活的规模化部署和运维。

  提供跨平台统一的系统环境、服务接口、打包升 级方案和稳定高效的底层操作系统,开发便于管 理、支持多种设备运维方式、支持算法下发、灵 活部署的智能物联网平台。

  开发支持不同算法模型的多目智能摄像机产品, 具有高算力、帧同步、姿态识别、场景感知等能 力。

  完成语音检索、对话呈现、工作量化等基础功 能,在业务数字化分析和风险防控能力上达到金 融行业的要求。

  开发面向线下场景、以降本增效为目标的智能认 知系统,提供由端到云的整体解决方案,包含视 频图像的结构化识别、对比、聚类等基础能力, 通过大数据分析提供快速、准确的通用功能和稳 定、可靠的服务,满足各类场景的业务需求。

  注:项目1、2的累计投入金额超过募集资金累计投入金额的部分为根据研发费用分摊表分摊的间接费用。(未完)