GSEA_基因富集分析
哈尔滨工业大学 生物网络分析实践报告 学生姓名:荆树吉 学号: 25S103248 学院: 计算机科学与技术学院 指导教师:李杰 2026年 6 月 5 日 实验三:基因集富集分析实验目的用于判断预先定义的基因集合在两种生物学状态(如表型)之间是否存在具有统计学显著性的一致差异。 实验内容使用GSEA客户端进行基因富集分析,并完成图片和数据的整理 实验步骤算法的要求与实验步骤不同 实验的步骤比较简单 下载对应的数据,分别为kegg-20.gmt,对应数据的20个基因通路。 2.phenotype 对应为69个个体的表型。 probe.gct对应为对应的基因的基因表达谱。 直接输入到对应的位置即可 1.上传文件 图 1 文件上传 2.填写对应的参数 图 2 参数填写与调整 将对应的最小的通路的参数的限制调整为10 因为有一个通路是14个基因,这样的设置就可以访问到所有的通路。 图 3 实际详细参数 上面为参数列表 实验算法:实验的算法为GSEA算法: 数据准备与预处理 输入数据:基因表达矩阵(样本 × 基因)、表型标签(如肿瘤 / 正常、...
short_path_gene_find
哈尔滨工业大学 生物网络分析实践报告 **学生姓名:**荆树吉 学号: 25S103248 学院: 计算机科学与技术学院 **指导教师:**李杰 2026年5 月 25 日 实验二**: 构建信号网络且发现关键路径**实验目的掌握构建信号网络的方法,识别具有统计意义的最短路径和疾病基因的关键路径 实验内容完成信号网络的构建,用摄动法确定基因间的最短路径,找到含有疾病基因的关 键路径. 实验要求1.快速计算两个基因间的最短路径 2.用p值检验定义最短路径 3.定义疾病基因中的关键路径。 4.给出显著性路径上的关键疾病基因 实验步骤1、从多个生物通路网站上抽取通路信息。 2、整合多个通路构建生物信号网络。 3、生物信号网络进行预处理(删除重复的连接及孤立点等) 4、根据疾病基因表达谱计算信号网络边的权值 5、从O0MIM疾病知识库,抽取疾病相关基因 6、多次扰动信号网络,计算疾病基因之间的最短路径,获得最短路径的统计值 7、识别具有显著性的最短路径上的疾病基因 实验算法实验的主要算法为迪杰斯特拉算法,用来进行统计检验的方法是置换检验方法 迪杰斯特拉法: 核心:求带权无负权图...
protein modelue finding
哈尔滨工业大学 生物网络分析实践报告 学生姓名:荆树吉 学号: 25S103248 学院: 计算机科学与技术学院 **指导教师:**李杰 2026年 5月 12日 实验一: 基于蛋白互作网络的关键模块发现算法实现及功能注释实验目的:通过对整合的蛋白互作网络分析, 深刻理解识别生物网络关键模块的算法并对模块功能进行基因本体注释. 实验内容:整合已有的蛋白互作网络资源和疾病相关基因,实现网络模块识别方法并识别重要的蛋白网络模块. 实验要求:实现网络模块识别方法并能利用统计方法检验所识别的模块的统计显著性. 实验步骤:1、从多个网站下载小的蛋白互作网络 2、将多个小的蛋白网络整合成一个大的蛋白互作网络 3、实现网络模块识别算法, 并利用这些算法从蛋白网络上识别出重要的蛋白网络模块 4、对关键模块进行生物功能注释 5、对关键模块进行显著性统计分析 6、编写网络可视化程序,将发现的重要功能模块用不同的颜色从网络上标示出来。 7、比较不同算法的网络模块分析结果,并分析差异的原因 实验算法:1. Label propagation(标签传播算法)算法: 每个节点赋予一个标签...
数据结构
第一章 绪论1.0数据结构在学什么 数据结构在学什么? 1.1数据结构的基本概念 1.2算法和算法评价 第二章 线性表2.1线性表的定义和基本操作 2.2线性表的顺序表示 2.3顺序表的链式表示单链表 双链表 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657//定义双链表typedef sturct dnode{ //定义双链表结点类型 elemtype data; //数据域 struct dnode *prior,*next; //前驱与后继指针}dnode, *dlinklist; //初始化双链表bool initdlinklist(dlinklist &L){ L = (dnode *)malloc(sizeof(dnode)); //分配一个头结点 if(...
生成式对抗网络
生成式对抗网络(GAN)传统的对应的架构,生成架构 用network当作生成器,每一次随机生成对应的z,知道对应的分布是简单的,已知的均匀分布或者是正态分布,network的输出变成复杂的范围。 这样的网络就叫做生成器。 为什么要选择分布?训练资料是不断录制的影片,影片中小精灵的位置预测。传统的网络预测会让小精灵进行分裂,同样的转角会产生两种不同的结果,两种训练资料,进行两面讨好,就会同时向左向右转。让机器的输出是有几率的为其解决方法。加上一个分布包含向左转和向右转。 当我们的任务需要一点创造性时,同样的输入,多种不同的输出。 让人们进行画图的工作会产生不同的结果,比如画一个红色的眼镜的人。 采用聊天的方法,去生成对应的图片。 这样我们就要生成式对抗网络。 GAN的基础原理淦,就是这么读。有很多种的英文字母,取名是很难的。 机器生成二次元人物的脸。 输入一个正态分布,生成一个低维的向量,会生成一个二次元人物的脸,产生一个非常高维的向量,输入不同,输出就会不同。选择一个简单的分布函数。 Discriminator输入一张图片,输出一个数字,判断一个图片是二次元人物的可能性...
计算机组成
第一章 计算机系统概述本章知识回顾 本章总结1)计算机由哪几部分组成?以哪部分为中心?计算机由运算器、控制器、存储器、输入设备及输出设备五大部分构成,现代计算机通常把运算器和控制器集成在一个芯片上,合称中央处理器。 在微处理器面世之前,运算器和控制器分离,而且存储器的容量很小,因此设计成以运算器为中心的结构,其他部件都通过运算器完成信息的传递。随着微电子技术的发展,同时计算机需要处理、加工的信息量也与日俱增,大量IO设备的速度和CPU的速度差距悬殊,因此以运算器为中心的结构不能满足计算机发展的要求。现代计算机已发展为以存储器为中心,使 IO 操作尽可能地绕过 CPU,直接在IO设备和存储器之间完成,以提高系统的整体运行效率。 2)主频高的 CPU 一定比主频低的 CPU 快吗?为什么? 衡量CPU运算速度的指标有很多,不能以单独的某个指标来判断CPU的好坏。CPU的主频表示CPU内数字脉冲信号振荡的速度,主频和实际的运算速度存在一定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度还要看CPU的流水线的各方面的性能指标(架构、缓存、指令集、CPU的...
计算机网络笔记
第一章 计算机网络体系结构1.1计算机网络概述1.1.1计算机网络的概念 由若干节结点(node)和链接这些节点的链路(link)组成。结点可以是计算机、集线器、交换机、路由器等 计算机网络 主要功能:数据通信(信息共享)、资源共享 |路由器连接| 互连网(internet) 多个计算机网络通过路由器互相连接而成 计算机网络的概念 |世界上最大规模的互连网| 可使用任何通信协议 互联网(Internet) 或译为因特网。特指全世界最大的计算机网络,由各大ISP和国际机构组建 使用tcp/ip协议族作为通信规则 ISP(Internet Service Provider),互联网服务提供商 其他拓展 集线器、交换机用于链接统一网络内的不同节点;路由器用于连接不同的网络 家用路由器=路由器+交换机+其他功能 1.1.2计算机网络的组成与功能 主机,即端系统(end system)–如电脑手机物联网设备 内部安装网卡 硬件 通信设备–如集线器,交换机,路由器 |将主机数据发...
操作系统笔记
第二章 进程与线程2.1线程的属性①线程是处理机调动的单位。 ②多cpu计算机中,各个线程可占用不同的CPU ③每个线程都有一个线程ID,线程控制块(TCB) ④线程也有就绪,阻塞运行三种基本状态 ⑤线程几乎不拥有任何系统资源 ⑥同一进程的不同线程间共享进程的资源。 ⑦由于共享内存地址空间,同一进程的线程间通信甚至无需系统干预 ⑧同一进程中的线程切换不会引起进程切换 ⑨与⑧相反 ⑩切换同进程内的线程,系统开销很小 ⑪切换进程,系统开销很小。 2.2调度三种调度的联系对比 调度方法 细节描述 数据流动方向 发生频率 状态转换 高级调度(作业调度) 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 外存->内存(面向作业) 发生频率最低 不存在->创建态->就绪态 中级调度(内存调度) 按照某种规则,从挂起队列中选择合适的进程将数据调回内存。 外存->内存(面向进程) 中等 挂起态->就绪态(阻塞挂起)->阻塞态 低级调度(进程调度) 按照某种规则从就绪队列中选择一个进程为其分配处理机 内存->CPU 最...
