扫一扫 添加小助手
服务热线
13818320332
扫一扫 关注我们
一、临床数据库
01 NCDB
网址:https://www.facs.org/quality-programs/cancer/ncdb
美国国家癌症数据库(National Cancer Database, NCDB)是经国家认证的,由美国外科医师学会和美国癌症学会联合组建的,它是一个基于医院登记数据的临床肿瘤学数据库,来源于超过1500多个癌症委员会认证的机构。NCDB数据库可用于分析和跟踪恶性肿瘤患者的治疗过程和结局。数据库代表了全美超过70%的新诊断癌症病例和超过三千四百万个历史记录。
02 SEER
网址:https://seer.cancer.gov/
SEER(Surveillance, Epidemiology, and EndResults Program)是美国癌症统计的权威来源。SEER数据库可提供癌症统计信息,以减轻美国人口中的癌症负担。SEER数据库由美国国家癌症研究所(National Cancer Institute,NCI)癌症控制和人口科学部(Division of Cancer Control andPopulation Sciences, DCCPS)的监视研究项目(SurveillanceResearch Program, SRP)提供支持。
03 TCGA
网址:https://cancergenome.nih.gov/
美国癌症基因组图谱(The Cancer Genome Atlas, TCGA)是由美国国家癌症研究所(National Cancer Institute, NCI)和国家人类基因组研究所(NationalHuman Genome Research Institute, NHGRI)合作开发的,目前它包含了33种癌症的数据,每种癌症都涉及关键基因组变化的全面、多维的图谱。TCGA数据库储存有2.5PB的数据,对超过1.1万多名患者的肿瘤组织及配对正常组织进行描述,目前已被广泛应用于研究领域。这些数据已为独立研究人员进行的癌症研究或者TCGA研究网络出版物做出了超过1千多项的贡献。
在TCGA中直接下载数据的方法较为繁琐,但是有多个网站提供TCGA数据(包括表达和临床等)完善的整理,以下是其中整理最为完整和可靠的:
GDAC: http://gdac.broadinstitute.org/
Cancer Browser: https://genome-cancer.ucsc.edu/
cBioportal: http://www.cbioportal.org/index.do
04 METABRIC
网址:http://molonc.bccrc.ca/aparicio-lab/research/metabric/
网址:https://ega-archive.org/dacs/EGAC00001000484
国际乳腺癌协会的分子分类数据库(Molecular Taxonomy of Breast Cancer International Consortium, METABRIC) 是一个加拿大-英国联合项目,旨在根据有助于确定最佳治疗过程的分子特征将乳腺肿瘤进一步分类。我们迄今为止已经根据肿瘤的基因指纹将乳腺癌重新分类为10个全新的类别。这些基因可以对乳腺癌生物学提供迫切需要的洞察力,使医生能够预测肿瘤是否会对某种特定的治疗产生反应。肿瘤是否有可能扩散到身体的其他部位,或者治疗后是否有可能复发。
05 GEO
网址:https://www.ncbi.nlm.nih.gov/geo/
基因表达库(Gene Expression Omnibus,GEO) 是一个支持微阵列实验的最小信息(MinimumInformation About a Microarray Experiment, MIAME)兼容数据提交的公共功能基因组数据存储库。可接受基于数组或序列的数据。提供相关工具帮助用户查询和下载实验和管理基因表达谱。
06 WHO Mortality Database
网址:http://www.who.int/healthinfo/mortality_data/en/
世界卫生组织死亡数据库(WHO Mortality Database)是对各个成员国的居民登记系统按照年龄、性别和死因汇编的每年死亡数据。
07 Orphanet
网址:http://www.orpha.net/consor/cgi-bin/index.php?lng=EN
Orphanet数据库是为所有用户提供罕见病和罕见病药物信息的开放门户,目的在于提高罕见病的诊断、护理和治疗效果。
08 DGV
网址:http://dgv.tcag.ca/dgv/app/home
基因组变异数据库(Database of Genomic Variants, DGV)目的是提供人类染色体结构变异的概况信息,数据库记录了一系列基因变异与表型相关的信息,数据库信息持续更新中。
09 DECIPHER
网址:https://decipher.sanger.ac.uk/index
利用染色体组分资源建立人类染色体不平衡和表型数据库(Database of Chromosomal Imbalance and Phenotype in Humans using Ensemble Resources, DECIPHER)是目前分子遗传学中最重要的生物信息学数据库之一。用户可以通过检索数据库,发现一系列相关的遗传疾病信息,包括变异位点、临床表型等,提高临床诊断效能。DECIPHER数据库包含了超过200家研究中心上传的超过1万例的案例信息。
10 OMIM
网址:http://www.omim.org/
在线人类孟德尔遗传数据库(Online Mendelian Inheritance in Man, OMIM)是目前分子遗传学中最重要的生物信息学数据库之一。数据库持续更新,主要着眼于可遗传的或遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关其他数据库。
11 Comparative Toxicogenomics Database
网址:http://ctdbase.org/
比较基因组数据库(Comparative ToxicogenomicsDatabase, CTD)是一个强大的、公开可用的数据库,旨在提高人们对环境暴露如何影响人类健康的了解。它提供了关于化学基因/蛋白质相互作用、化学疾病和基因疾病关系的相关信息。这些数据与功能和路径数据相结合,以帮助验证关于环境影响疾病的机制假设。
12 Kaplan Meier Plotter
网址:http://kmplot.com/analysis/
Kaplan MeierPlotter是一个包含5种癌症(乳腺癌、卵巢癌、肺癌、胃癌、肝癌)的mRNA表达谱芯片公共数据库,从中能够获得基因表达与疾病预后的信息
二、生物信息学数据库
Database
1. Meta databases
元数据库,合并不同来源的相关数据以更新的或更加方便的形式提供新的数据,通俗的讲就是数据库的数据库,代表性的数据库主要有以下几个:
ConsensusPathDB
网址:http://consensuspathdb.org/
描述:分子功能互作数据库,基于32个公共数据库,整合了人类蛋白质相互作用,遗传相互作用信号,代谢,基因调控和药物 - 靶标相互作用的信息。
Entrez
网址:https://www.ncbi.nlm.nih.gov/Class/MLACourse/Modules/Entrez/complex_boolean.html
描述:Entrez跨数据库全局查询搜索系统是一个联合搜索引擎或门户网站,允许用户在NCBI网站上搜索许多离散的健康科学数据库。
Neuroscience Information Framework
网址:https://neuinfo.org//
描述:整合了数百种神经科学相关资源,包括实验,临床和转化神经科学数据库,知识库,地图集和遗传/基因组资源等。
GeneCard
网址:https://www.genecards.org/
描述:自动整合125个数据库,包含基因组、转录组、蛋白组、遗传、临床和功能信息的庞大人基因组数据库。
Ensembl Genomes
网址:http://ensemblgenomes.org/
描述:该项目由EMBL运营,提供细菌、原生生物、真菌、植物和无脊椎动物后生动物的基因组数据。
NGS基础 - 参考基因组和基因注释文件
NGS基础 - GTF/GFF文件格式解读和转换
UCSC Genome
网址:http://genome.ucsc.edu
描述:主要是动物基因组信息,基因组注释,基因组保守性和基因组共线性数据。
UCSC XENA - 集大成者(TCGA, ICGC)
UCSC基因组浏览器
Human protein atlas
网址:http://www.proteinatlas.org/
描述:人体蛋白在细胞、组织、病理条件下的表达
ICGC数据库使用
2. Model organism databases
模式生物数据库,为深入研究模式生物提供生物数据,如:
Personal Genome Project
网址:https://www.personalgenomes.org/
描述:来自世界各地的100,00名志愿者的人类基因组计划。
Mouse Genome Database(MGD)
网址:http://www.informatics.jax.org/
描述:MGD数据库是整合了国际上实验室小鼠生物数据的资源库,提供小鼠相关的基因组、综合遗传等信息。
Rat Genome Database (RGD):
网址:https://rgd.mcw.edu/
描述:大鼠基因组数据库。
PomBase
网址:https://www.pombase.org/
描述:裂殖酵母Schizosaccharomyces pombe的知识库。
Saccharomyces Genome Database (SGD):
网址:https://www.yeastgenome.org/
描述:酵母模型生物的基因组数据库
TAIR
网址 https://www.arabidopsis.org/
描述:最全的拟南芥资源数据库。政府为我们付费购买了使用权,以至于不少人没感觉到TAIR已经收费了。
Legume Information System (LIS)
网址:https://legumeinfo.org/
描述:豆科植物的基因组数据库。
Wormbase:
网址:https://wormbase.org/#012-34-5
描述:关于线虫模式生物秀丽隐杆线虫的生物学和基因组在线生物数据库,还包含其他相关线虫的信息。
Xenbase:
网址:http://www.xenbase.org/entry/
描述:模式生物非洲爪蟾(Xenopus tropicalis)和非洲爪蟾(Xenopus laevis)的基因组数据库。
Zebrafish Information Network:
网址:http://zfin.org/
描述:斑马鱼的基因组数据库。
FlyBase:
网址:http://flybase.org/
描述:模式生物果蝇的基因组数据库。
UCSC Malaria Genome Browser:
网址:http://enacademic.com/dic.nsf/enwiki/7907997
描述:UCSC疟疾基因组浏览器是研究疟疾(如恶性疟原虫等)基因组的生物信息学研究工具。
3. Nucleic acid databases
3.1 DNA databases
核酸数据库分为一级数据库(Primary databases)和二级数据库(Secondary databases)
3.1.1 一级核酸数据库
下面三个数据库是核酸的主数据库,存储来自所有生物的核酸序列,接受用户提交核酸序列,每天交换更新数据以实现他们之间的最佳同步。
DNA Data Bank of Japan
网址:https://www.ddbj.nig.ac.jp/index-e.html
EMBL (European Bioinformatics Institute)
网址:https://www.embl.org/
NCBI (National Center for Biotechnology Information)
网址:https://www.ncbi.nlm.nih.gov/
生信软件系列 - NCBI使用
如果你经常用PubMed,那么这个插件将非常好用!
一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
3.1.2 二级核酸数据库
数目很多,先列出一些,欢迎补充:
23andMe’s database
网址:https://www.23andme.com/en-int/
描述:23andMe是一家私营的个人基因组学生物技术公司 ,主要业务是基于唾液对消费者进行基因检测,并向客户提供基因检测报告。
OMIM (Online Mendelian Inheritance in Man):
网址:https://omim.org/
描述:一个管理人类基因和人类遗传疾病特征的数据库。
RefSeq
网址:https://www.ncbi.nlm.nih.gov/refseq/
描述:参考序列数据库收集了从病毒、细菌到真核生物等主要生物的核酸序列(DNA、RNA)及其蛋白质常产物。
1000 Genomes Project:
网址:http://www.internationalgenome.org/
描述:2008年1月启动的项目,对来自不同种族群体的一千多名匿名参与者的基因组进行了分析,并将数据公布于众。
SNP / Disease Databases
网址:https://www.snpedia.com/
描述:人SNP位点对表型的影响和贡献度数据库
3.2 Gene expression databases
这些数据库收集基因组序列,注释并分析他们,以提供公共访问。主要包括:
ArrayExpress
网址:https://www.ebi.ac.uk/arrayexpress/
描述:功能基因组数据存档;存储来自EMBL的高通量功能基因组学实验的数据;展示方式很炫酷。
Bioinformatic Harvester
网址:Ensembl: http://asia.ensembl.org/index.html
描述:为人类,小鼠,其他脊椎动物和真核生物基因组提供自动注释的数据库
BioGPS
网址:http://biogps.org/#goto=welcome
描述:强大的基因和蛋白表达注释平台
Gene Disease Database
基因疾病数据库,通过整理表型-基因型关系和基因-疾病机制,以及多种复合相互作用来理解复杂疾病的潜在机制。主要数据库如下:
5.1 The Comparative Toxicogenomics Database (CTD)
网址:http://ctdbase.org/
5.2 The Universal Protein Resource (UNIPROT)
网址:https://www.uniprot.org
5.3 The Online Mendelian Inheritance in Man
网址:https://www.ncbi.nlm.nih.gov/omim
5.5 The Ensembl genome database project
网址:http://www.ensembl.org/
5.6 The Gene Disease Associations Database DisGeNET
网址:http://www.disgenet.org/
Gene Expression Omnibus (GEO):
网址:https://www.ncbi.nlm.nih.gov/geo/
描述:来自美国国家癌症研究所(NCI)的公共功能基因组数据库,它支持基于阵列和序列的数据,并提供了用于查询和下载基因表达谱的工具。
NGS基础 - 测序原始数据下载
测序文章数据上传找哪里
3.3 Phenotype databases
PHI-base:
网址:http://www.phi-base.org/
描述:病原体 - 宿主相互作用数据库。
细胞表型数据库
网址:https://www.ebi.ac.uk/fg/sym
描述:基于RNAi的细胞表型收集
dbGAP
网址:https://www.ncbi.nlm.nih.gov/gap
描述:基因型-表型数据库,来源于GWAS、医学测序、分子诊断等
The Human Phenotype Ontology
网址:https://hpo.jax.org/app/
描述:人类疾病表型描述的标准化术语,类比于Gene Ontology. 现有13000个条目和156,000关于遗传病的注释。
GWAS central
网址:https://www.gwascentral.org
描述:包含2,974,967个SNP与829个MeSH疾病、表型之间的69,986,326个关联。
European genome-phenome archive
网址:https://ega-archive.org
描述:生物医学研究中涉及的遗传和表型数据关联库
Monarch
网址:https://monarchinitiative.org
描述:基因型-表型数据库,表型相似性度量
Cellular Phenotype Database
网址:http://www.ebi.ac.uk/fg/sym
描述:存储来自高通量表型研究的数据,可以搜索感兴趣的表型并检索相关靶基因和RNAi
GenomeRNAi
网址:http://www.genomernai.org/
描述:包含来自果蝇和人RNA干扰筛选的表型数据库
Genomics of Drug Sensitivity in Cancer
网址:http://www.cancerrxgene.org/
描述:筛选了多种抗癌疗法人类癌细胞系,通过与基因组数据关联以识别药物靶标,同时为临床应用提供信息
GenomeCRISPR
网址:http://genomecrispr.dkfz.de/
描述:用于高通量CRISPR / Cas9筛选实验的数据库
Cellular Microscopy Phenotype Ontology (CMPO)
网址:www.ebi.ac.uk/cmpo/
描述:CMPO为描述与整个细胞、细胞成分、细胞过程和细胞群体有关的表型特性提供了一种物种中立的词汇。
Human Phenotype Ontology (HPO)
网址:https://hpo.jax.org/app/
描述:提供了人类疾病中表型异常的标准化词汇
3.4 RNA databases
miRBase
网址:http://www.mirbase.org/
描述:存储microRNA序列和注释的数据库。
Rfam:
网址:http://rfam.org/
描述:一个包含非编码RNA(ncRNA)家族和其他类型RNA信息的数据库。
RNAcentral
网址:https://rnacentral.org/
描述:非编码RNA序列数据库。
4. Amino acid / protein databases
4.1 Protein sequence databases
Swiss-Prot/Uniprot
网址:https://www.uniprot.org/
描述:结合了从文献中提取的信息和生物鉴定者评估的计算分析,是一个手动注释的非冗余蛋白质序列数据库。
Database of Interacting Proteins (Univ. of California)
网址:https://dip.doe-mbi.ucla.edu/dip/Main.cgi
描述:记录了实验确定的蛋白质之间的相互作用。
DisProt:(打不开了)
网址:http://www.disprot.org/
描述:用于注释文献中的蛋白固有无序区域(IDRs)
2018Cell系列最好的调控方式-相变,最强综述,未来以来,你在哪
InterPro:
网址:https://www.ebi.ac.uk/interpro/
描述:通过整合多个蛋白相关数据库,提供了一个方便的对蛋白序列进行功能注释的平台,包括对蛋白质家族、结构域、功能位点的预测。
MobiDB:
网址:http://mobidb.bio.unipd.it/
描述:内在蛋白质紊乱注释数据库。
neXtProt:
网址:https://www.nextprot.org/
描述:人类蛋白质数据库。
Pfam:
网址:http://pfam.xfam.org/
描述:Pfam是蛋白质家族的数据库,包括使用隐马尔可夫模型生成的注释和多序列比对。
PRINTS
网址:http://130.88.97.239/PRINTS/index.php
描述:蛋白质序列指纹图谱数据库,所谓蛋白质的指纹是指一组保守的序列基序,用于刻画蛋白质家族的特征。
PROSITE:
网址:https://prosite.expasy.org/
描述:收集了有显著生物学意义的蛋白质位点和序列模式,并能根据这些位点和模式快速并可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。
Protein Information Resource
网址:https://pir.georgetown.edu/
描述:是一个全面的、经过注释的、非冗余的蛋白质序列数据库。可帮助研究者鉴别和解释蛋白质序列信息,研究分子进化、功能基因组,进行生物信息学分析。
SUPERFAMILY:
网址:http://supfam.org/SUPERFAMILY/
描述:一个包含所有蛋白质和基因组结构和功能注释的数据库。
4.2 Protein structure databases
Protein Data Bank (PDB)
网址:http://www.rcsb.org
描述:一个专门收录蛋白质及核酸的三维结构资料的数据库,以下为PDB成员网站
1.1 Protein DataBank in Europe (PDBe):https://www.ebi.ac.uk/pdbe/
1.2 ProteinDatabank in Japan (PDBj):https://pdbj.org
1.3 Research Collaboratory for Structural Bioinformatics (RCSB):https://www.rcsb.org
1.4 Worldwide Protein Data Bank:http://www.wwpdb.org/
The Protein Protein Interaction Inhibition Database (2PI2db):
网址:http://2p2idb.cnrs-mrs.fr
描述:收集了已通过X射线晶体学或核磁共振表征的蛋白质-蛋白质、蛋白质-调节剂复合物结构。
4.3 Protein model databases
ModBase:
网址:https://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
描述:一个注释比较饭白纸结构模型的数据库。
Protein Model Portal (PMP):
网址:https://www.proteinmodelportal.org
描述:结合了数个蛋白质结构模型数据库的元数据库,提供模型构建和质量评估等多种交互式服务。
Similarity Matrix of Proteins (SIMAP):
网址:http://cube.univie.ac.at/resources/simap
描述:基于FASTA序列计算的蛋白质相似性数据库。
Swiss-model:
网址:https://swissmodel.expasy.org
描述:致力于同源蛋白质的3D结构建模。
4.4 Protein-protein and other molecular interactions
BioGRID
网址:https://thebiogrid.org
描述:蛋白质与遗传相互作用数据库。
string
网址:http://string-db.org/cgi/help.pl?subpage=api
描述:用于检索相互作用基因/蛋白质的搜索工具
IntAct
网址:https://www.ebi.ac.uk/intact/
描述:为分子交互研究提供免费的开源数据库系统和分析工具。
5. Signal transduction pathway databases
NCI-Nature Pathway Interaction Database
网址:http://biogps.org/plugin/259/nci-nature-pathway-interaction-database/
描述:http://www.ndexbio.org/#/ (原来的PID迁移到此新数据库)。
NDEx提供了一个开源框架,科学家和机构可以共享、存储、操作和发布生物网络知识。
Netpath
网址:http://www.netpath.org/
描述:人类信号转导通路数据库,拥有45个信号通路,包括在免疫系统调节和癌症调节中起主要作用的通路。
Reactome
网址:https://reactome.org/
描述:该库覆盖了19个物种的通路研究,包括经典的代谢通路、信号转导、基因转录调控、细胞凋亡与疾病。
reactome相关推文:
生物AI插图素材获取和拼装指导
没钱买KEGG怎么办?REACTOME开源通路更强大
WikiPathways
网址:https://www.wikipathways.org/index.php/WikiPathways
描述:该数据库收录了超过20个物种的通路,其中人类的通路就包含了800多个通路,涵盖了约7500种基因。此外,它还包含了超过1000个代谢产物的通路。
6. Metabolic pathway and protein function databases
代谢途径和蛋白质功能数据库
BiGG Models
网址:http://bigg.ucsd.edu
描述:该数据库将70多种已发表的基因组规模的代谢网络整合到了一起,并且有一组标准化的BiGG ID。
BioCyc Database Collection:
网址:https://biocyc.org
描述:收集了14558个通路/基因组数据库,每一个数据库描述了单个有机体的基因组和代谢通路,同时提供多种用于组学数据导航和可视化的分析工具。
BRENDA:
网址:http://www.brenda-enzymes.org
描述:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。
HMDB
网址:http://www.hmdb.ca
描述:人类代谢组数据库,包含有关人体中发现的小分子代谢物的详细信息。
KEGG PATHWAY Database
网址:https://www.kegg.jp
描述:KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。
Reactome(同上)
WikiPathways(同上)
7. Additional databases
7.1 Exosomal databases
外泌体是一类可以由多种细胞类型分泌的胞外囊泡,与其他胞外囊泡如核外颗粒体和凋亡小体不同,外泌体是内吞起源的。外泌体在疫苗、药物递送、细胞间通信的作用以及其作为生物标志物的一种可能来源以及引起了研究人员的极大兴趣,导致外泌体相关研究呈现井喷趋势。相关数据库如下:
ExoCarta
网址:http://www.exocarta.org
描述:是一个关于外泌体蛋白、RNA、脂质体的手工数据库。
exoRBase
网址:http://www.exorbase.org
描述:将不同疾病血来源外泌体中的circRNA, lncRNA和mRNA进行整理的数据库。
7.2 Mathematical model databases
Biomodels Database
网址:http://biomodels.caltech.edu
描述:生物模型在线数据库,主要存储数量型生物化学模型。
7.3 Taxonomic databases
BacDive
网址:https://bacdive.dsmz.de
描述:提供有关细菌和古细菌生物多样性的菌株相关信息。
EzTaxon-e
网址:https://www.ezbiocloud.net
描述:基于16S核糖体RNA基因序列鉴定原核生物的数据库。
7.4 Radiologic databases
The Cancer Imaging Archive (TCIA)
网址:http://www.cancerimagingarchive.net
描述:包含常见肿瘤(肺癌、前列腺癌等)医学图像(MRI、CT等)及相应临床信息(治疗方案细节、基因、病理等)的大规模公用数据库。
Neuroimaging Informatics Tools and Resources Clearinghouse
网址:https://www.nitrc.org
描述:神经影像信息学工具和资源交换中心。
8. Wiki-style databases
Gene Wiki
网址:https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki
描述:一个基于wiki的基因信息数据库
9. Specialized databases
Barcode of Life Data Systems
网址:http://www.boldsystems.org
描述:DNA条形码数据库(即生物体内能够代表该物种的、标准的、有足够变异的、易扩增且相对较短的DNA片段),并提供一个分析DNA序列的在线平台。
The Cancer Genome Atlas (TCGA)
网址:https://cancergenome.nih.gov
描述:提供使用高通量技术获得的癌症样本数据,包括基因表达谱、拷贝数变异、SNP基因分型、全基因组DNA甲基化等。
Cellosaurus
网址:https://web.expasy.org/cellosaurus/
描述:细胞系的在线资源库。
Comparative Toxicogenomics Database (CTD)
网址:http://ctdbase.org
描述:CTD(比较毒物遗传数据库),为研究人员提供了集中、综合的各种不同类型分子以及来自各种生物体的毒理学数据。
DiProDB
网址:http://diprodb.fli-leibniz.de
描述:收集和分析热力学,结构和其他二核苷酸特性的数据库。
Dryad
网址:http://datadryad.org
描述:存放优质数据资源的场所,使科学出版物背后的数据可被发现、可重复使用、可引用。
Edinburgh Mouse Atlas
网址:http://www.emouseatlas.org/emap/home.html
描述:小鼠胚胎原位基因表达数据库。
EPD Eukaryotic Promoter Database
网址:https://epd.vital-it.ch/index.php
描述:真核基因启动子数据库,提供从EMBL中得到的真核基因的启动子序列,帮助实验研究人员、生物信息学研究人员分析真核基因的转录信号。
FINDbase (the Frequency of INherited Disorders database)
网址:http://www.findbase.org
描述:是一个全球治病遗传变异频率的数据库。
HGNC (HUGO Gene Nomenclature Committee):
网址:https://www.genenames.org
描述:负责对人类基因组包括蛋白编码基因, ncRNA基因,甲基因和其他基因在内的所有基因提供一个唯一的、标准的、可以广泛传播的symbol
International Human Epigenome Consortium
网址:http://ihec-epigenomes.org
描述:国际人类表观基因组学会,致力于全球表观基因组学领域的发展。
MethBase
网址:http://smithlabresearch.org/software/methbase/
描述:在UCSC Genome Browser上可视化的DNA甲基化数据库。
Minimotif Miner
网址:http://minimotifminer.org/
描述:短连续功能性肽基序的数据库。
NCI-dbGaP
网址:https://www.ncbi.nlm.nih.gov/gap
描述:人类基因型和表型相互作用的数据库。
PubMed
网址:https://www.ncbi.nlm.nih.gov/pmc/
描述:生命科学和生物医学领域的参考和摘要。
Oncogenomic databases
网址:https://oglandscapes.irbbarcelona.org
描述:用于癌症研究的数据库汇编。
RIKEN integrated database of mammals
网址:http://metadb.riken.jp/metadb/download/SciNetS_ria254i
描述:Riken研究所推广的多个大型项目的综合数据库。
TDR Targets
网址:http://tdrtargets.org
描述:专注于热带疾病药物发现的化学基因组学数据库。
LNCipedia
网址:http://www.lncipedia.org/
描述:人类长链非编码RNA的整合库
NONCODE
网址: http://www.noncode.org/
描述:存储17类(人类,小鼠,牛,大鼠,鸡,果蝇,斑马鱼,小肠,酵母,拟南芥,黑猩猩,大猩猩,猩猩,恒河猴,负鼠和猪)物种非编码RNA(不包括tRNA和rRNA)的数据库
Oncomine
网址:https://www.oncomine.org/resource/login.html
描述:肿瘤相关基因研究的数据库,整合了GEO、TCGA和已发表的文献等来源的RNA和DNA-seq数据
GeneVestigator(GV)
网址:https://genevestigator.com/
描述:一个基因表达的搜索引擎,集成了上万的人工精选、注释的公共芯片实验结果
immuneXpresso
网址:http://immuneexpresso.org/immport-immunexpresso/public/immunexpresso/search
描述:immuneXpresso搜索引擎可自动从PubMed摘要中提取高分辨率细胞 - 细胞因子相互作用网络
三、机器学习数据库
这是一个机器学习医疗数据的策划清单。
此列表仅供参考,请确保您尊重此处列出的任何数据的任何和所有使用限制。
1.医学影像数据
医学图书馆向
13,000名患者注释提供了53,000张医学图像的MedPix®数据库。需要注册。
信息:https : //medpix.nlm.nih.gov/home
ABIDE:自闭症脑成像数据交换:对自闭症内在大脑结构的大规模评估。
539名患有ASD和573名典型对照的个体的功能MRI图像。这些1112数据集由结构和静息状态功能MRI数据以及广泛的表型信息组成。需要注册。
论文:http: //www.ncbi.nlm.nih.gov/pubmed/23774715
信息:http : //fcon_1000.projects.nitrc.org/indi/abide/
预处理版本:http:// preprocessed-connectomes-project。组织/遵守/
阿尔茨海默病神经成像倡议(ADNI)
MRI数据库阿尔茨海默病患者和健康对照。还有临床,基因组和生物制造商的数据。需要注册。
论文:http : //www.neurology.org/content/74/3/201.short
访问:http : //adni.loni.usc.edu/data-samples/access-data/
用于血管提取的数字视网膜图像(DRIVE)
DRIVE数据库用于比较研究视网膜图像中血管的分割。它由40张照片组成,其中7张显示出轻度早期糖尿病视网膜病变迹象。
论文:http : //www.isi.uu.nl/Research/Publications/publicationview/id=855.html
访问:http : //www.isi.uu.nl/Research/Databases/DRIVE/download.php
AMRG心脏地图集 AMRG心脏MRI地图集是奥克兰MRI研究组西门子Avanto扫描仪采集的正常患者心脏的完整标记的MRI图像集。该地图集旨在为大学和学校的学生,MR技术人员,临床医生提供...
先天性心脏病(CHD)地图集 先天性心脏病(CHD)地图集代表成年人和患有各种先天性心脏病的儿童的MRI数据集,生理临床数据和计算机模型。这些数据来自几个临床中心,包括Rady ...
通过磁共振成像评估确定除颤器降低风险,是一项前瞻性,多中心,随机临床试验,用于冠心病和轻中度左心室功能不全患者。主要目标......
MESA 多种族动脉粥样硬化研究是一项在美国的六个中心进行的大规模心血管人群研究(> 6,500名参与者)。它的目的是调查亚临床到临床心血管疾病的表现之前......
OASIS 开放获取系列影像研究(OASIS)是一项旨在使科学界免费提供大脑核磁共振数据集的项目。两个数据集可用:横截面和纵向集。
年轻,中老年,非痴呆和痴呆老年人的横断面MRI数据:该组由416名年龄在18岁至96岁的受试者组成的横截面数据库组成。对于每位受试者,单独获得3或4个单独的T1加权MRI扫描包括扫描会话。受试者都是右撇子,包括男性和女性。100名60岁以上的受试者已经临床诊断为轻度至中度阿尔茨海默病(AD)。此外,还包括一个可靠性数据集,其中包含20个未删除的主题,在其初次会议后90天内的后续访问中成像。
非痴呆和痴呆老年人的纵向磁共振成像数据:该集合包括150名年龄在60至96岁的受试者的纵向集合。每位受试者在两次或多次访视中进行扫描,间隔至少一年,总共进行373次成像。对于每个受试者,包括在单次扫描期间获得的3或4次单独的T1加权MRI扫描。受试者都是右撇子,包括男性和女性。在整个研究中,72名受试者被描述为未被证实。包括的受试者中有64人在初次就诊时表现为痴呆症,并在随后的扫描中仍然如此,其中包括51名轻度至中度阿尔茨海默病患者。另外14名受试者在初次就诊时表现为未衰退,随后在随后的访视中表现为痴呆症。
访问:http : //www.oasis-brains.org/
SCMR共识数据 SCMR共识数据集是从不同的MR机(4个GE,5个西门子,6个Philips)获得的混合病理学(5个健康,6个心肌梗塞,2个心力衰竭和2个肥大)的15个心脏MRI研究)。主要目标......
Sunnybrook心脏数据 Sunnybrook心脏数据(SCD)也被称为2009年心脏MR左心室分割挑战数据,由45个病人和病理混合的电影-MRI图像组成:健康,肥大,伴有梗塞和心脏的心力衰竭。..
访问:http : //www.cardiacatlas.org/studies/
肺图像数据库联盟(LIDC)
初步的临床研究表明,螺旋CT扫描肺部可以提高高危人群的肺癌早期发现率。图像处理算法有可能有助于螺旋CT研究中的病变检测,并评估连续CT研究中病变大小的稳定性或变化。这种计算机辅助算法的使用可以显着提高螺旋CT肺部筛查的灵敏度和特异性,并且通过减少解释所需的医师时间来降低成本。
肺成像数据库联盟(LIDC)倡议的目的是支持一个机构联盟制定螺旋CT肺部影像资源的共识指南,并建立螺旋CT肺部影像数据库。根据这项计划资助的研究人员为数据库的使用创建了一套指导方针和指标,并为开发数据库作为实验台和展示这些方法的指南和指标。该数据库通过互联网向研究人员和用户提供,作为研究,教学和培训资源具有广泛的用途。
具体而言,LIDC倡议的目标是提供:
用于图像处理或CAD算法的相对评估的参考数据库
一个灵活的查询系统,将为研究人员提供评估各种技术参数的机会,并取消确定该数据库中的临床信息,这对研究应用很重要。
该资源将刺激进一步的数据库开发,用于包括癌症筛查,诊断,图像引导干预和治疗在内的应用的图像处理和CAD评估。因此,NCI鼓励研究者发起的拨款申请,在他们的研究中利用数据库。NCI还鼓励研究者发起的赠款申请,这些申请提供了可以改进或补充LIDC使命的工具或方法。
访问:http : //imaging.cancer.gov/programsandresources/informationsystems/lidc
TCIA集合
跨各种癌症类型(例如癌,肺癌,骨髓瘤)和各种成像模式的癌症成像数据集。“癌症成像档案”(TCIA)中的图像数据被组织成特定目标的主题集合。受试者通常具有癌症类型和/或解剖部位(肺,脑等)。下表中的每个链接都包含有关集合的科学价值的信息,关于如何获取任何可用的支持非图像数据的信息以及查看或下载成像数据的链接。为了支持科学研究的可重复性,TCIA支持数字对象标识符(DOI),允许用户共享研究手稿中引用的TCIA数据的子集。
访问:http : //www.cancerimagingarchive.net/
白俄罗斯结核病门户
结核病(TB)是白俄罗斯公共卫生的一个主要问题。最近的情况与MDR / XDR结核病和HIV / TB需要长期治疗的出现和发展相关。许多和最严重的病例通常在全国各地传播到不同的结核病药房。通过使用包含患者放射影像,实验室工作和临床数据的共同数据库,领先白俄罗斯结核病专家关注这些患者的能力将大大提高。这也将显着改善对治疗方案的依从性,并且更好地记录治疗结果。纳入门诊患者入选临床病例的标准 - 入住肺结核和肺结核的RDSC耐多药结核病部门,诊断或怀疑患有耐多药结核病,
访问:http : //tuberculosis.by/
DDSM:用于筛选乳腺摄影的数字数据库
乳腺摄影数字化数据库(DDSM)是乳腺摄影图像分析研究社区使用的资源。该项目的主要支持来自美国陆军医学研究和装备司令部的乳腺癌研究计划。DDSM项目是由马萨诸塞州综合医院(D. Kopans,R. Moore),南佛罗里达大学(K. Bowyer)和桑迪亚国家实验室(P. Kegelmeyer)共同参与的合作项目。华盛顿大学医学院的其他病例由放射学和内科医学助理教授Peter E. Shile博士提供。其他合作机构包括威克森林大学医学院(医学工程和放射学系),圣心医院和ISMD,Incorporated。数据库的主要目的是促进计算机算法开发方面的良好研究,以帮助筛选。数据库的次要目的可能包括开发算法以帮助诊断和开发教学或培训辅助工具。该数据库包含约2,500项研究。每项研究包括每个乳房的两幅图像,以及一些相关的患者信息(研究时间,ACR乳房密度评分,异常微妙评级,异常ACR关键字描述)和图像信息(扫描仪,空间分辨率... )。包含可疑区域的图像具有关于可疑区域的位置和类型的像素级“地面真实”信息。
访问:http : //marathon.csee.usf.edu/Mammography/Database.html
前列腺
据报道,前列腺癌(CaP)在全球范围内是第二大最频繁诊断的男性癌症,占13.6%(Ferlay等(2010))。据统计,2008年,新诊断病例的数量估计为899,000,其中不少于258,100例死亡(Ferlay等(2010))。
磁共振成像(MRI)提供成像技术,可以诊断和定位CaP。I2CVB提供多参数MRI数据集以帮助开发计算机辅助检测和诊断(CAD)系统。访问:http : //i2cvb.github.io/
访问:http : //www.medinfo.cs.ucy.ac.cy/index.php/downloads/datasets
多发性硬化症数据库中的MRI病灶分割
紧急远程骨科X射线数字图书馆
IMT分割
针EMG MUAP时域特征
DICOM图像样本集 这些数据集专门用于研究和教学。您无权重新发布或出售它们,或将其用于商业目的。
所有这些DICOM文件都使用JPEG2000传输语法进行压缩。
访问:http : //www.osirix-viewer.com/resources/dicom-image-library/
SCR数据库:胸部X光片的分割
胸部X光片中解剖结构的自动分割对于这些图像中的计算机辅助诊断非常重要。SCR数据库的建立是为了便于比较研究肺野,心脏和锁骨在标准的后胸前X线片上的分割。
本着合作科学进步的精神,我们可以自由共享SCR数据库,并致力于在这些分割任务上维护各种算法结果的公共存储库。在这些页面上,可以在下载数据库和上载结果时找到说明,并且可以检查各种方法的基准结果。
访问:http : //www.isi.uu.nl/Research/Databases/SCR/
医学影像数据库和图书馆
访问:http : //www.omnimedicalsearch.com/image_databases.html
一般类别
e-Anatomy.org - 交互式解剖学图谱 - 电子解剖学是解剖学在线学习网站。为了覆盖人体的整个断面解剖结构,选择了来自正常CT和MR检查的超过1500个切片。图像使用Terminologia Anatomica标记。用户友好的界面允许通过结合交互式文本信息,3D模型和解剖图绘制的多切片图像系列进行摄影。
医学图片和定义 - 欢迎访问互联网上最大的医学图片和定义数据库。有许多网站提供医疗信息,但很少提供医疗照片。就我们所知,我们是唯一一家提供医学图片数据库的关于每个术语的基本信息的图片。编者按:好的网站可免费访问,无需注册1200多种健康和医疗相关图像,并带有定义。
核医学艺术 - 医学插图,医学艺术。包括3D动画。“Nucleus Medical Art,Inc.是美国和海外的出版,法律,医疗,娱乐,制药,医疗设备,学术界和其他市场的医疗插图,医疗动画和交互式多媒体的领先创造者和分销商。注意:伟大的网站。
互联网上的医学图像数据库(UTHSCSA Library) - 指向具有主题特定医疗相关图像的网站的链接目录。
手术视频 - 国家医学图书馆MedlinePlus收集100和100s不同外科手术的链接。您必须在电脑上安装RealPlayer媒体播放器才能观看这些免费的视频。
带插图的ADAM医学百科全书。也许今天互联网上最好的插图医学着作之一,ADAM医学百科全书收录了4000多篇有关疾病,测试,症状,受伤和手术的文章。它还包含一个广泛的医学照片和插图库,用于备份这4,000篇文章。这些插图和文章免费向公众开放。
哈丁医学博士 - 医学和疾病图片,是一个由爱荷华大学提供的相当一段时间的免费和已建立的资源。主页处于目录风格,用户将不得不深入查找他们正在查找的图像,其中许多图像不在现场。尽管如此,哈丁医学博士是一个很好的门户,可以查看数千种详细的医疗照片和插图。
健康教育资产图书馆(HEAL) - 网络健康基金会媒体库总部位于瑞士的(HON)是一个国际机构,旨在鼓励在线健康信息的道德提供。“HONmedia(图像库)是一个超过6,800个医学图像和视频的独特库,涉及1,700个主题和主题。这个无与伦比的数据库由HON手动创建,新图像链接不断从全球范围添加HON鼓励用户通过提交图片链接制作自己的图片链接。“ 图书馆包括解剖图像,疾病和条件以及程序的视觉影响。
公共卫生图像库(PHIL)由疾病控制和预防中心(CDC)的工作组创建,PHIL为CDC的图片提供了一个有组织的通用电子网关。我们欢迎公共卫生专业人员,媒体,实验室科学家,教育工作者,学生和全球公众使用这些材料作为参考,教学,演示和公共卫生信息。内容被组织成人物,地点和科学等级分类,并以单幅图像,图像集和多媒体文件形式呈现。
医学史图片 - 该系统提供了美国国家医学图书馆(NLM)医学史分部(HMD)的印刷品和图片集中近6万幅图片的访问权限。该系列包括各种媒体的肖像,机构图片,漫画,流派场景和平面艺术,展示了医学的社会和历史方面。
Pozemedicale.org - 以西班牙语,意大利语,葡萄牙语和意大利语收集医学图像。
旧医学图片:从19世纪末和20世纪初,数百个迷人而有趣的旧,但高品质的照片和图像。
学科专业图像库和集合
亨利·格雷的人体解剖 - 格雷的人体解剖学Bartleby.com版以经典的1918年出版物中的1,247幅鲜艳的雕刻 - 许多颜色为特征。
Crookston系列 - 由John H. Crookston博士拍摄的医学幻灯片集合,已经数字化,可供公众和医生使用。
DAVE项目 - 涵盖广谱内窥镜成像的胃肠内窥镜视频剪辑的可搜索库。
Dermnet - 可收集超过8000种高品质皮肤科图像。
交互式皮肤科Atlas - 常见和罕见皮肤问题的图像参考资源。
多维人类胚胎是由国家儿童健康与人类发育研究所(NICHD)资助的一项合作,旨在通过互联网制作并提供基于磁共振成像的人类胚胎的三维图像参考。
GastroLab内窥镜档案于1996年发起,目标是保持内窥镜图库免费供所有感兴趣的医护人员使用。
MedPix是放射学和医学图片数据库资源工具。主页界面很混乱,整个网站设计不友好,并且在20世纪90年代中期给它留下了印象。但是,如果你有时间(耐心),它可能被证明是一些重要的资源。
OBGYN.net图像库 - 本网站致力于提供对女性健康感兴趣的图像。除了为您提供访问OBGYN.net图像外,我们还指出了互联网上其他女性健康相关的图像。由于材料的图形性质,有些人可能不喜欢看这些图像。它们仅用于教育目的。
威盛集团公共数据库
记录图像数据库对于定量图像分析工具的开发至关重要,特别是对于计算机辅助诊断(CAD)的任务。与I-ELCAP小组合作,我们建立了两个公共图像数据库,其中包含DICOM格式的肺部CT图像以及放射科医师的异常记录。请访问下面的链接了解更多详情:
访问:http://www.via.cornell.edu/databases/
CVonline:图像数据库 访问:http : //homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
USC-SIPI图像数据库 USC-SIPI图像数据库是数字化图像的集合。它主要用于支持图像处理,图像分析和机器视觉方面的研究。USC-SIPI图像数据库的第一版于1977年发布,并且自那时以来增加了许多新图像。
数据库根据图片的基本特征分为多个卷。每个卷中的图像具有各种尺寸,例如256x256像素,512x512像素或1024x1024像素。所有图像的黑白图像均为8位/像素,彩色图像为24位/像素。目前提供以下卷:
Textures Brodatz textures, texture mosaics, etc.Aerials High altitude aerial imagesMiscellaneous Lena, the mandrill, and other favoritesSequences Moving head, fly-overs, moving vehicles
访问:http : //sipi.usc.edu/database/
2.挑战/比赛数据
放射学中的视觉概念提取挑战 手动注释来自几种不同成像模式(例如CT和MR)的几种解剖结构(例如肾,肺,膀胱等)的放射学数据。他们还提供了一个云计算实例,任何人都可以使用它来根据基准开发和评估模型。
访问:http://www.visceral.eu/
生物医学图像分析中的重大挑战
通过标准化评估标准,为了便于在新解决方案和现有解决方案之间进行更好的比较,收集生物医学成像挑战。您也可以创建自己的挑战。截至撰写本文时,有92个挑战提供可下载的数据集。
访问:http : //www.grand-challenge.org/
梦想的挑战
梦想的挑战提出了关于系统生物学和转化医学的基本问题。我们的挑战由来自各种组织的研究人员社区设计和运行,邀请参与者提出解决方案 - 促进协作并在此过程中建立社区。Sage Bionetworks提供专业技术和制度支持,以及通过Synapse平台应对挑战的基础设施。我们共同拥有一个愿景,允许个人和团体公开合作,使“人群中的智慧”对科学和人类健康产生最大的影响。
数字乳腺摄影梦想挑战。
ICGC-TCGA DREAM体细胞突变称为RNA挑战(SMC-RNA)
梦想的挑战
这些是在增加时面临的积极挑战,还有更多过去的挑战和即将到来的挑战!
访问:http : //dreamchallenges.org/
四、其它一些医学影像数据库
1、肺结节数据库LIDC-IDRI:
数据库网址:https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI
2、乳腺图像数据库DDSM MIAS
数据库介绍(DDSM SQL Data Base):http://deckard.mc.duke.edu/ddsm_sql/book1.html
图片格式为LJPEG需要使用对应的压缩方法对其进行解压,目前找到了xMedcon,但是不太会用,打不开相应的文件,也可能是不是使用这个软件压缩的。不过这个软件可以用来转换大部分的医学图像。matlab社区上有how to open lossless jpeg file,但是其中有一些答案提供的网址不能打开,可能是没有科学上网??
数据库网址:http://figment.csee.usf.edu/Mammography/Database.html
MIAS MiniMammographic Database(来自researchgate的一个问答):322例,尺寸:1024*1024pixel,图像数据是PGM格式,找到一个介绍和读取的博客代码使用的c,matlab问答相关
小型乳房X光数据库:http://peipa.essex.ac.uk/pix/mias/all-mias.tar.gz
这也是一个乳腺的图像数据库,但是现在还没有搞清楚下载、格式之类的:https://www.repository.cam.ac.uk/handle/1810/250394?show=full
3、医学图像问答(目前还没搞清楚干嘛的,好像是一个网站的问答。暂存)
网址:http://www.dclunie.com/medical-image-faq/html/index.html
4、左心室MRI图像
Cardiac MRI Dataset:http://www.cse.yorku.ca/~mridataset/
右心室MRI数据RVSC
右心室分割挑战赛(2012):http://pagesperso.litislab.fr/cpetitjean/mr-images-and-contour-data/
5、Kaggle比赛网址:https://www.kaggle.com/
CT Medical Image Analysis Turorial这个比赛好像是分析CT纹理与患者年龄的关系。
肺癌分类比赛:https://www.kaggle.com/c/data-science-bowl-2017/data
分割肺癌(Kaggle):https://www.kaggle.com/kmader/finding-lungs-in-ct-data
DICOM文件打开使用Sante DICOM Free,paraview也可以打开,Mango网站:https://idoimaging.com/programs/124;anteDicom官方下载网址:http://www.santesoft.com/win/sante-dicom-viewer-free/download.html
6、Cancer Imaging Archive这个网站可以获得一些癌症的数据库,下载下来是jnpl文件需要使用jre环境进行下载:
http://www.cancerimagingarchive.net/
7、OsiriX数据库:各种医学数据,好像得注册收费的样子,还没搞清楚
http://www.osirix-viewer.com/resources/dicom-image-library/
8.Github上哈佛 beamandrew机器学习和医学影像研究者-贡献的数据集
https://github.com/beamandrew/medical-data
9.ISBI(生物医学成像国际研讨会)
https://grand-challenge.org/All_Challenges/
10.NITRC的IBSR数据集
医学影像
Github :哈佛 beamandrew机器学习和医学影像研究者-贡献的数据集
Academic torrents
Github :医学成像数据集
ISBI(生物医学成像国际研讨会)
Eye
眼底图整理
眼底图像数据集整理(糖尿病视网膜病变/青光眼…)
OCT
光学相干断层扫描(OCT)和年龄相关性黄斑变性(AMD)
光学相干断层扫描(OCT)和糖尿病性黄斑水肿(DME)
年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿
dataset:https://data.mendeley.com/datasets/rscbjbr9sj/2
paper:https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5#secsectitle0015
kaggle 2017 ,视网膜光学相干断层扫描(OCT)是一种成像技术,用于捕获活体患者视网膜的高分辨率横截面。
pytorch :https://www.kaggle.com/carloalbertobarbano/vgg16-transfer-learning-pytorch
MESSIDOR - 2
http://www.adcis.net/en/third-party/messidor/
Messidor数据库包含数百个眼底图像,自2008年以来一直公开发布。它是由Messidor项目创建的,目的是评估自动病变分割和糖尿病视网膜病变分级方法。
图片格式:tif
TIF格式是一种压缩最小的图片处理格式,基本不损失图象信息,但其缺陷就是文件体积太大。
用于血管提取的数字视网膜图像(DRIVE)
DRIVE数据库用于对视网膜图像中的血管分割进行比较研究。它由40张照片组成,其中7张显示轻度早期糖尿病视网膜病变的迹象。
论文:https://ieeexplore.ieee.org/document/1282003
访问:http://www.isi.uu.nl/Research/Databases/DRIVE/download.php
https://drive.grand-challenge.org/DRIVE/
Kaggle糖尿病视网膜病变
高分辨率视网膜图像,由临床医生按0-4严重等级注释,用于检测糖尿病视网膜病变。该数据集是完成的Kaggle竞赛 4 years ago 的一部分,该竞赛通常是公开数据集的重要来源。
https://www.kaggle.com/c/diabetic-retinopathy-detection
视网膜水肿 眼底病变数据集2018
视网膜水肿是一种常见的眼部病理改变,会导致不同程度的视力下降,从而影响正常的生活。尽早的发现水肿症状,能够对疾病的诊断和治疗起到重要的作用。如今临床上使用OCT(光学相干断层成像)辅助医生对视网膜水肿进行判断。我们提供了眼部OCT样本的图像数据集,由专业眼科医生分别对三种类型的水肿进行标注,数据量达到100个OCT体数据,每个体数据128张图片。
吴恩达膝盖
MRNet-v1.0
数据集在邮箱里
手术
CAMMA(医学活动的计算分析和建模)
https://endovis.grand-challenge.org/endoscopic_vision_challenge/
一般生命科学,医疗保健和医疗数据集
HealthData.gov:来自美国联邦政府的数据集,旨在改善美国人口的健康状况。
大城市健康清单数据平台:来自26个城市的健康数据,包括34个健康指标,涵盖6个人口指标。
慢性病数据:美国各地慢性病指标数据。
人类死亡率数据库:超过35个国家的死亡率和人口数据。
MHealth(移动健康)数据集:在进行体育活动时,为10名不同形象的志愿者提供身体动作和生命体征记录。
医疗保险提供者使用和支付数据:医生和其他医疗保健专业人员向Medicare受益人提供的服务和程序数据。
生命科学数据库档案:日本生命科学家在长期稳定的国家公共产品中产生的数据集。存档使许多人可以更轻松地按统一格式按元数据搜索数据集,并使用明确的使用条款访问和下载数据集。
生命科学,医疗保健和医学的图像数据集
OASIS:开放获取系列成像研究(OASIS)是一个旨在使科学界免费获得大脑神经成像数据集的项目。他们编译并自由分发神经影像数据集,希望有助于未来在基础和临床神经科学方面的发现。
OpenfMRI:磁共振成像(MRI)数据集可供研究界公开使用。
ADNI:阿尔茨海默病神经影像学倡议(ADNI)研究人员从志愿者研究参与者那里收集了几种类型的数据。数据可免费提供给授权的调查员,但需要申请并事先批准。
基因组数据集
GEO数据集:该数据库存储策划的基因表达数据集,以及基因表达综合(GEO)存储库中的原始系列和平台记录。
1000基因组计划:1000基因组项目是一项国际合作,已经建立了最详细的人类遗传变异目录。该项目的最后阶段对来自全球26个不同人群的2,500多人进行了测序。
瓶中基因组:数据集包括几个参考基因组,以便将整个人类基因组测序翻译成临床实践。
医院数据集
Medicare医院质量:医疗保险和医疗补助服务中心提供的Medicare.gov 医院比较网站上使用的官方数据集。这些数据使您可以比较全国4,000多家Medicare认证医院的护理质量。
医疗成本和利用项目(HCUP):数据集包含美国医院中不耐烦住院,急诊就诊和门诊手术的遭遇级信息。
MIMIC重症监护数据库:MIMIC是由麻省理工学院计算生理学实验室开发的一个公开可用的数据集,包括与大约40,000名重症监护患者相关的未识别健康数据。数据集包括人口统计学,生命体征,实验室测试,药物等。
BROAD Institute癌症项目数据集:按脑癌,白血病,黑色素瘤等项目分类的数据。
文章来源:法迈医讯
本网站刊载的所有内容,包括文字、图片、音频、视频、软件等,如非标注为“原创”,则相关版权归原作者所有,如原作者不愿意在本网站刊登相关内容,请及时通知本站,我们将第一时间予以删除。