哈尔滨工业大学科研成果专场推介——人工智能与新兴软件领域
一、成果介绍
1.中文自然语言处理基础技术开源平台(计算学部)
【成果简介】针对自然语言处理技术入行门槛高,准确率、效率偏低,缺少共享数据和程序资源,重复开发现象严重,结果可视化差,错误分析困难,较难真正支持各类应用研究等众多问题,研发了一整套高效、高精度的自然语言处理系统–语言技术平台,其已成为中文自然语言处理领域影响力最大的开源基础技术平台(http://ltp.ai/)。相关研究成果荣获2010年中国中文信息学会颁发的“钱伟长中文信息处理科学技术奖”一等奖和2016年黑龙江省科技进步一等奖。
【技术指标】分词性能指标可达98.7(F1),词性标注可达98.5(ACC),命名实体识别可达95.4(F1),语义角色标注可达80.6(F1),依存句法分析可达89.5(LAS),语义依存分析可达75.2(LAS)。新版LTP对分词、词性标注、命名实体识别的速度进行针对性优化,多线程可获得17.17倍的速度提升,处理速度可达21581.48句/秒。
【应用前景】该技术可广泛应用于文本挖掘、机器翻译等中文自然语言处理领域。目前,已共享给国内外600余家研究机构签署协议免费使用,并以开源的形式发布,在GitHub获4,600余星标。
2.面向自然语言处理通用对话领域的“活字”大模型(计算学部)
【成果简介】针对大规模语言模型在自然语言处理的通用领域取得的成功及该技术在广泛的应用场景中展示了强大的潜力,团队自主研发并开源了通用对话大模型“活字”。该模型在BLOOM-7B基础上,通过指令微调后在标准的中/英文基准与主观测评上均取得优异的效果,同时支持多语言对话能力;人工构造了更多指令微调模板,使得指令微调的数据更加丰富;基于多轮对抗攻击,以SFT形式手动设计安全数据,强化模型回复的安全性和合规性;通过人类反馈的强化学习(RLHF)进一步优化了模型回复质量,使其更加符合人类偏好。
【技术指标】“活字”大模型拥有70亿参数,可以处理长度为2048的中/英文序列。C-Eval中文知识指标为38.19%,MMLU英文知识指标为37.05%。
【应用前景】“活字”大模型的多语言支持和强大的对话能力使其在多个领域显示出广泛的潜力。该模型可被应用于提高客户服务效率,通过自动化和即时响应减轻人工负担。在教育领域,它可以作为学习工具,辅助语言学习和练习。其跨语言交流的功能促进了国际旅游和商务中的沟通。此外,“活字”大模型拥有处理和分析大量文本的能力,可以用于研究和数据分析,帮助从复杂的文本中提取有价值的洞见。
3.科教版科学计算与系统建模仿真软件(计算学部)
【成果简介】科教版科学计算与系统建模仿真软件SE-MWORKS,基于苏州同元MWORKS开放平台与开放架构,面向国内高校科研、教学领域的典型需求打造,目前包含了15个工具箱、10个模型库、10本系列教材及教学配套资源、3个虚拟仿真实验教学平台,并提供了210个科教领域案例。
【技术指标】SE-MWORKS的工具箱与模型库覆盖航空航天、机器人与自主系统、汽车、数学优化、电气工程、船舶水声等领域,能够初步支撑相关科学研究和装备研发任务。
【应用前景】该软件已经在四所学校的上百门课程和十余个科研项目中得以应用,取得了良好的验证效果。通过高校推广等行动,将SE-MWORKS推广至更广阔的高校范围,培养更多高校师生形成对国产SEMWORKS的使用习惯,在科教领域完成对国外竞品的自主化替代。
4.可控视觉内容生成(计算学部)
【成果简介】该项创新成果通过融合自然语言处理领域的知识,开发有效视频及三维内容的预训练生成模型,实现在极少数或单一图像样本的条件下,从广泛视觉内容生成转向特定视觉元素的个性化视觉内容生成,建立了一套数实融合智能分析方法体系。
【技术指标】在3D生成模型方面优于OpenAI的ShapeE和谷歌的Dreamfusion的性能;视频生成模型优于腾讯Tuna-a-Video的性能;定制化生成取得与谷歌的DreamBooth和CMU的CustomDiffusion相当的性能,伪词生成速度提升100倍以上;在零样本图像分类和零样本指代分割任务上分别优于OpenAI的CLIP和谷歌的Global-LocalCLIP的性能。
【应用前景】该项创新成果有望重塑本省数字内容的生产流程与交互方式,为互联网和元宇宙等前沿领域提供全新的基础架构和增强生产力工具。此外,这种融合语言描述和知识库的可控视觉内容生成技术,将在教育、媒体创意产业、自动驾驶、工业制造等多个领域发挥关键作用,提升信息呈现的质量和效率,激活并推动相关应用领域的知识边界向前延伸。
5.群体智能自主作业智慧农场(计算学部)
【成果简介】针对典型作物农机作业自主性弱、协同性差等问题,团队将新一代人工智能技术与大规模种植农业生产相结合,聚焦典型作物农机群体自主作业应用场景,以水稻、玉米、小麦等大田作物“耕、种、管、收”全流程的自主作业为研究对象,攻克农场环境自适应感知与认知,自主作业控制,群体智能协同作业、智慧农场调度、管理与协同等关键技术,突破大型农场中感知、认知自适性不高,作业流程自主控制、自主管理受限等瓶颈,实现群体实时无线通信、嵌入式认知计算、人机自主协同等技术,构建人机共融、自主协同的智慧农场。
【技术指标】管理调度跨环节群体智能自主农机100台套以上,实现“耕、种、管、收”主要环节人机融合群体智能自主作业,工作时间不少于10小时,实现同环节5台套以上农机自主协同作业。相比传统作业方式,实现减少用工50%。【典型应用】2023年,在北大荒二九〇农场完成水稻、小麦和玉米示范种植1500亩,在建三江七星农场完成水稻示范种植5000亩。2024年,将在在七星农场开展万亩对比示范种植。
6.刑事执行协同办案监督控制应用系统(计算学部)
【成果简介】针对跨部门刑事执行协同办案理论不够完备、技术不够规范和智能化程度有待提高等问题,团队在监督控制模型与效能评价方法研究和多源异构信息智能处理技术研究2项基础研究基础上,研发了刑事执行协同办案监督控制应用系统平台,形成了包括司法系统内部多级监督、司法检察跨部门协同监督以及司法领域与社会生活融合促进三个方面的刑事执行监督控制总体解决方案,促进司法部门、检察部门的高效协同,实现信息互通共享,加强突发事件的应急处理能力,有力促进公共安全和社会稳定。
【技术指标】可有效提升监督效率,可节省人力约50%,实现5种异常行为督导,平均准确率92%以上,可接入60万路视频,可同时在线用户数目达1万,涵盖国家级、省级司法行政机关,跨平台实现检察系统互联。
【应用前景】该技术可广泛应用于刑事执行监督、大数据法律监督等司法检察领域。已在哈尔滨监狱、松滨监狱、牡丹江监狱及佳木斯监狱开展面上应用示范,在吉林、天津等8省市共计14家单位进行了点上应用示范。
7.漏洞相似代码快速搜索引擎(计算学部)
【成果简介】针对更高效地构建高质量软件问题,团队将人工智能赋能软件工程,研究软件缺陷检测及预测、漏洞挖掘、错误定位、软件修正、克隆代码检测及维护等技术。团队与华为公司合作研究“相似漏洞挖掘算法”,研究开发了分布式增量式索引的大规模代码搜索引擎,使之能有效支持大规模代码中的相似漏洞搜索。该搜索引擎支持十余语言的相似漏洞检测,支持对远程配置库创建索引,既支持关键字也支持代码片段搜索,并分析源代码的语法信息,支持多种模糊度语义级别的查询,从而可以提高搜索精度。增量式的多版本软件演化分析,具有良好的可扩展性,可快速分析大规模代码。
【技术指标】10万代码行达到1分钟内完成创建索引能力;100万代码行,实现索引时间5分钟以内完成创建索引能力;500万代码行,实现索引时间20分钟以内完成创建索引能力。
【应用前景】该技术可广泛应用于软件漏洞挖掘、相似代码检测,目前已在华为公司内部进行使用。
8.基于图像的室内定位导航系统(电信学院)
【成果简介】室内环境属于卫星拒止环境,无法使用北斗、GPS等定位导航技术。该系统针对目前室内定位导航技术精度不足、稳定性差、部署设备的复杂性以及复杂环境下应用受限等问题,研发了基于图像的高精度室内定位导航技术。该系统基于计算机视觉和人工智能技术,突破了传统定位方法对环境依赖性强和信号干扰大的局限,通过智能算法优化,实现了在复杂环境下的精准定位与路径规划。通过模块化的科学设计,建立了图像特征提取与匹配优化策略,显著提高了定位精度和系统稳定性,减少了对大量硬件设备的依赖,降低了部署和维护成本,推动了室内定位导航技术的创新发展。该技术的研发建立了室内定位的新范式,为智慧城市建设和智能化生活方式提供了先进路径,为我国数字化转型和高质量发展提供了重要技术支撑。
【技术指标】终端用户使用普通手机即可实现实时定位导航,室内使用环境也无需任何硬件、线路的安装与改造,具有通用、友好的特性,成本低,可拓展性强。定位导航精度可达到亚米级,定位性能满足大部分室内定位导航需求。支持图像识别、增强现实AR、语音识别、远程语音与图像传输等功能。该系统利用5G+互联技术,提供精准的室内定位导航服务,具有“高”普适性、“高”灵活性、“高”空间精度、“低”硬件需求等特性。
【应用前景】该技术可广泛应用于市民大厦、商场、机场、火车站、医院、图书馆、博物馆、办公楼等大型室内场所的导航定位。不仅可以提供常规的室内定位导航功能,也可以为视障人士、老弱病残等特殊群体提供定位导盲辅助功能。
9.农业遥感AI大模型(电信学院)
【成果简介】针对我国耕地分布不均匀、耕地质量总体偏低、作物种植类型复杂,人工调查成本高、周期长、动态实时监测难等严峻问题,利用遥感监测技术大尺度、高时效性等特点,研发了农业遥感AI大模型。该成果基于遥感基础模型技术,对海量多维异构多模态遥感数据进行统一表征利用,构建了面向农业应用场景具有多源遥感数据快速智能解译能力的农业遥感大模型。该成果的研发建立了农业场景遥感应用的新范式,为我国耕地资源动态监测、非农非粮化实时检测、作物种植类型快速统计、作物估产、受灾评估等应用提供了通用的解决方案,为我国粮食安全、黑土地保护、坚守18亿亩耕地红线的监测提供了科技支撑。
【技术指标】耕地提取精度达95.7%、作物分类精度达92.2%、耕地非农化检测精度达90.6%。
【应用前景】该技术可广泛应用于耕地资源监测、作物种植面积统计、作物产量估计、自然灾害受灾面积评估、农业保险定保理赔等领域。
10.校园霸凌检测技术(电信学院)
【成果简介】针对校园霸凌愈演愈烈的趋势,研发了基于多模信息的校园霸凌检测技术。该技术基于机器学习方法,打破了传统有人值守的监控方式,研发了无需用户操作的主动式校园霸凌检测及告警系统,通过图像/视频、声音、传感数据等多模态信息融合,从多维度对可能存在的暴力行为、言语欺凌等霸凌事件进行实时检测,以无线自组网的方式构建分布式监控网络,并可在检测出霸凌事件后自动告警并对嫌疑人进行跨域跟踪,以及时制止霸凌事件,保护受害者。
【技术指标】在中低端配置的硬件平台上,暴力行为检测的平均识别准确率可达95%以上,普通话言语欺凌的平均识别准确率可达90%以上,多目标跟踪的平均精确率可达92%以上。
【典型应用】该技术可应用在校园、监狱、火车站、商场等场景,充分利用目前国内发达的视频监控网络,用先进技术引导市场发展,促进未来监控安防设备的智能化,带动相关产业活力,切实保护人民生命财产安全。
二、联系方式
如您对以上成果有进一步合作交流意向,请与我们工作人员联系对接。
房经理 0531-86196383
亓经理 0531-86196382