Medical Data Science Roadmap
R语言基础语法
数据结构与转换
数据读写
数据导出
用R基本包
用dplyr包
数据框的合并
缺失值处理
数值型描述分析
分类变量列联表
组间差异的比较
变量间的相关性
用R基础作图系统
ggplot2和其他图
综合案例1
综合案例2
线性回归分析
Logistic回归分析
Poisson回归分析
生存分析和聚类分析
医学数据操作
基本统计分析
医学数据可视化
R语言基础
常用分析模型
线性回归模型
logistic回归模型
Poisson回归模型
Python基础
Python基础语法
变量类型
运算操作
条件、循环、函数
Numpy
创建数组对象
数组操作及运算
文件读写
综合实战
Pandas
数组结构
基本操作及数组处理
数据清洗核心操作
综合案例
数据可视化
Matplotlip绘图基础
实现SCI绘图
Pandas数据处理与绘图
Seaborn数据可视化
数值型变量统计描述
数值型变量假设检验
分类变量统计分析
单因素生存分析
机器学习和深度学习
线性模型与广义线性模型
临床预测模型要素
临床预测模型实现流程
深度学习算法入门和模型举例
Matplotlib绘图基础
基本操作及数据处理
机器学习专项讲解
模型构建、评价、列线图、模型可解释性
AI医学影像应用
医学影像基础、深度学习应用、图像预处理、分割技术及迁移学习
观察性研究
因果关系、交互作用、中介作用
诊断试验研究
ROC曲线、灵敏度、Kappa值
临床数据分析
因果分析入门:肾结石手术 VS 超声波治疗
先定义因果关系,用例说明混杂因子。再以肾结石手术为例,强调因果重要性,模拟数据。最后,实战分析,用IPTW估计治疗差异
亲手搭建一个糖尿病及并发症风险预测模型
使用XGBoost模型预测患者血糖值,并分析模型的效果与使用特点
心梗后阿司匹林治疗的Meta分析
借助心梗后服用阿司匹林能否降低死亡率这一经典案例,分享 meta 分析标准流程,探讨异质性,并提供令人信服的临床解释
观菌识人 根据肠道菌种类和数量预测年龄
采用来自中国的2000 多名调查者的肠道微生物的16S 数据,使用XGBOOST和PLSRegression,来构建预测宿主年龄及BMI的模型
使用 Logistic 回归预测心脏瓣膜手术风险
以心脏瓣膜手术数据为例,用R语言构建逻辑回归模型预测每个患者的死亡风险,通过区分度与校准度这两个指标来评估风险模型的性能
中医证型关联规则项目实战
借助三阴乳腺癌患者的病理信息,挖掘患者的症状与中医证型之间的关联关系。 对截断治疗提供依据,挖掘潜性证素
乳房筛查、疼痛指数等聚类数据集的数据回归模型的构建
介绍聚类模型的定义、特征与应用,通过三个实例了解不同类型聚类数据的建模过程,以及模型的诊断、评估与解读
职业与心理疾病关系的建模研究
本分析使用机器学习构建预测模型,探索职业类型与心理疾病之间的相关性,并比较K-Means、决策树、随机森林、SVM等几种预测模型的结果
基于一维卷积神经网络的抑郁指数预测
基于活动传感器数据搭建回归卷积神经网络,预测抑郁状态
医疗影像分析
基于CNN实现细胞识别分类
主要对感染和未感染的图像细胞进行识别分类
基于U-net的膀胱肿瘤检测
本项目完成对膀胱壁边缘以及膀胱肿瘤检测,为医生决策起到一定作用
如何利用生成对抗网络(GAN)生成医学图像
运用Gan生成医学图像,数据增强,扩充数据集,优化模型表现
使用开源工具改善糖尿病性视网膜病变图像的质量
本项目的目标是提高图像质量,以期给预测做个铺垫,使用免费和开源工具改善糖尿病性视网膜病变的图像
生物信息学
Biopython中文文档
Biopython致力于通过创造高质量的和可重复利用的模块及类,从而使得Python在生物信息学中的应用变得更加容易
肺癌尿液代谢组学分析与统计建模
一个肺癌案例,串起假设检验、回归分析与常见机器学习模型
关于DNA序列分类问题的分析
DNA序列上存在着数以亿计的序列位点,当生物信息发生基因突变时,则其DNA序列上的某些位点会产生突变,因此找到这些位点对区分耐药组和敏感组有很大帮助
电子健康记录分析
基于ModelWhale平台讲解EHR数据分析基本流程及方法
探索性数据分析常用的临床模型
电子病历二次分析过程中数据预处理常见的各种方法
介绍电子病历二次分析过程中数据预处理常见的各种方法,并结合Python实际代码进行讲解
临床NLP——从病例记录预测患者是否再次入院
利用BERT,结合病例的记录来看病人康复情况。是AI+电子病历的良好使用场景
流行病学和公共卫生数据科学
2022上海疫情数据预处理与时空分析
项目包含数据清洗与预处理、地理编码、各区疫情和疫情小区可视化、人口密度分布、数据挖掘与预测模型
SIR传播模型的科普和预测
对于几个疾病模型做的一些概念性描述(科普),并进行了简单的编程实现
药物发现和基因组学
作用机制(MoA)预测
Kaggle竞赛作用机制(MoA)预测 你能改进基于生物活性的药物分类算法吗
降维方法和RDKit做药物分子的化学空间分析
这是使用RDKit和降维方法PCA和t-SNE(sklearn)进行化学空间分析和可视化的快速教程
“默克”杯逆合成反应预测大赛
基于给定的化学反应数据建立模型,从而可对任给定的反应试剂和反应产物数据,模型输出该化学反应的反应物
医学大数据与临床研究
前往查看
自然语言处理NLP
数据分析
机器学习