详细信息
分类信息:
>>学科导航分类法 _工学 _计算机科学与技术 _计算机应用技术
封面图片 自有资源  
无权查看内容文件信息  
题名 科学工作流重用关键问题研究
姓名 陈久强
院系 信息科学与工程学院
专业 计算机应用技术
学位名称 工学硕士
外文题名 Research on scientific workflow reuse
第一导师姓名 张瑞生
关键词 科学工作流;溯源(provenance);串并联图(series-parallel graph);Taverna;科学工作流查询
外文关键词 scientific workflows;provenance;provenance-equivalent;series-parallel graphs;query workflow structures
学科 工学
摘要 科学实验经常通过科学工作流来执行,其任务通常被连接在一起形成错综复杂的嵌套图结构。随着工作流的发展,科学工作流及其执行状态图结构的复杂度与日俱增,这直接导致科学工作流基于结构的检索功能无法得以实现,更对科学工作流的重用产生了直接影响。本篇论文主要针对科学工作流结构复杂影响其重用进程的问题开展了以下几方面的研究:第一,我们提出了一种可以将科学工作流结构转化为简单图形结构(串并联结构)的算法,并定义了科学工作流溯源信息等价模型对算法的有效性和合理性进行了验证;第二,我们更进一步研究了基于串并联结构如何开展基于工作流结构的查询,并提出了一种工作流结构比较算法;第三,我们针对以上两种算法分别开发了一款实用工具,第一款工具SPFlow可将所有非串并联结构的Taverna工作流转化为串并联结构,而第二款工具DDFlow可以比较两个工作流执行状态图的异同;第四,我们的解决办法都在一个比较大的真正的工作流集合上做了实验分析,特别针对的是Taverna工作流系统。
外文摘要 Bioinformatics experiments are usually performed by using scientific workflows in which tasks are chained together forming very intricate and nested graph structures. For several reasons, the complexity of workflow and its execution is increasing over time, which has a clear impact on scientific workflows reuse. The global aim of this thesis is to enhance workflow reuse. Firstly, this requires us to provide a feasible strategy able to reduce the complexity of workflow structures while preserving provenance to ensure that the result is right. The SPFlow algorithm which is able to transfer any workflow into sp structure while provenance-preserving and its associated tool are thus introduced. Then based on the optimized structure of workflow we explore a reasonable method of scientific workflow structure query. For the comparison of workflow structure, we have developed a useful tool. Our solutions have been systematically tested on large collections of real workflows, especially from the Taverna system.
研究领域 科学工作流
保存本页    打印本页