“青年科技工作者园地”举行第164次活动
时间:2025年5月29日(下周四) 下午 2:30
地点:计算中心二楼会议室
主持人:毕玉江老师
腾讯会议:866-651-690
报告相关信息如下:
报告人:张玄同
报告题目:Rucio分布式数据管理软件的开发和项目管理
报告简介:Rucio是ATLAS实验基于网格架构开发的一个分布式数据管理软件,本报告将介绍报告人在Rucio项目内的开发工作和对Rucio项目开发流程和管理模式的理解。
报告人:刘媛媛
报告题目:一种基于transformer架构的源代码漏洞检测模型:通过联合token和语句表示学习
报告简介:知识图谱在科研领域人工智能(AI4S)发展所需的结构化知识表示、推理能力增强、跨学科融合促进等方面具有重要作用。北京谱仪(BESIII)实验大量的文献数据是发展相关领域知识图谱构建的重要基础,但传统的构建知识图谱方法面临挑战。本报告以粒子物理BESIII实验为切入点,阐述如何利用大语言模型实现高能物理知识图谱的自动化构建。针对现有技术的不足,本研究提出基于大语言模型的本体构建方法和知识抽取方法,并实现高能物理领域知识图谱构建框架。该研究旨在为快速构建领域知识图谱提供新的思路,推动体系化领域知识的形成和提升 AI 在高能物理中的应用。
报告人:符世园
报告题目:面向先进光源的高效数据IO方法研究
报告简介:先进光源每年产生海量数据,具备多样化、多模态的特点,IO瓶颈成为限制科学计算效率的重要因素。针对该问题,本方法首先设计实现了daisy-io,面向多样化学科应用统一IO接口,集成了通用化的数据IO加速方法,比如并行、预取等方法,实现对不同数据的读取加速;其次,构建数据流平台,避免数据落盘再读导致的IO瓶颈问题,主要包括流接收、流解析和流暂存模块;最后,为进一步加速数据流传输,设计实现轻量级低延迟的序列化方法和专用压缩方法。通过上述方法,加速光源数据读写速度,屏蔽底层数据来源、数据格式的差异性。
附件下载: