分享

医学科研数据存储服务+附录:医学科研数据公共数据集分享

 swordinhand 2024-04-30 发布于美国

图片

医学科研团队常有大量的原始医学数据和计算后产生的结果数据需要存储,而自己单位的存储服务器空间不够用;或者通过购买百度网盘为代表的网盘在上传或者下载一定数量的数据后被限速,很难上传、下载医学大数据。这些医学数据存储的问题也非常影响医学科研。

使用赛博尔医学算法和数据处理平台,您可以按国家规定清理过医学科研数据后,高速上传或者下载您自己的医学科研数据。另外,不仅数据存储服务器是加密的,上传和下载的也都是自动加密,而且是接入高速网络。而且平台支持海量大数据存储,非常方便您的医学科研活动。注:需要您那一端的互联网宽带也支持高速上传和下载

通过 www.medicalAI.top 点击 '赛博尔医学算法和数据处理平台’ 字样,或者直接在浏览器里输入  data.medicalAI.top,用账号和密码登陆。然后选择左边的 '我的数据’ 就可以上传或者下载数据。

图片

如果您要使用赛博尔医学算法和数据处理平台来存储医学科研大数据,请联系我们。

情联系: 13381109780(杨老师) 

Email:     bd@medicalai.top

培训课程推荐(请点击浏览

附录:部分医学公共数据集分享

脑科学数据库

ADNI(Alzheimer’a Disease Neuroimaging Initiative):ADNI是一个着名的数据集,专注于阿尔茨海默病研究。它包括MRI数据以及其他类型的神经影像数据,对于研究与阿尔茨海默病相关的脑结构和变化非常有价值。

网址: https://adni.loni./data-samples/access-data/

OASIS(Open Access Series of Imaging Studies):OASIS数据集包括患有和不患有阿尔茨海默病的个体的MRI数据。它用于研究与衰老和神经退行性疾病相关的脑结构和变化。

网址:www.oasis-brains.org

IXI Dataset(Information eXtraction from Images):IXI数据集提供多种MRI模式和临床信息,用于神经科学和神经影像研究。

网址:https:///ixi-dataset/

HCP (Human Connectome Project):HCP数据集包括高质量的MRI数据,如结构、功能和扩散MRI扫描,用于绘制人类连接组,即脑连接网络的图谱。

网址:https://www./study/hcp-young-adult/data-releases/

ABIDE(Autism Brain Imaging Data Exchage):ABIDE提供来自自闭症谱系障碍患者和典型发育个体的MRI数据。它用于自闭症及相关疾病的研究。

网址:http://fcon_1000.projects./indi/abide/

NITRC(Neuroimaging Informatics Tools and Resources Clearinghouse)提供有关神经信息学软件和数据的资源。自2007年首次亮相以来,NITRC通过汇集过去经常丢失或被忽视的研究软件和数据,为神经科学领域的进一步发现提供了帮助。NITRC还提供了数据的免费访问,同时允许用户按需付费以获得基于云的无限计算能力,从而实现了全球科学合作的最低启动和运营成本。NITRC的内容包括MR(磁共振成像)、PET/SPECT(正电子发射计算机断层扫描/单光子发射计算机断层扫描)、CT(计算机断层扫描)、EEG/MEG(脑电图/磁电图)、光学成像、临床神经成像、计算神经科学以及成像基因组学软件工具、数据和计算资源。

https://www./

DeepLesion是由美国国立卫生研究院临床中心(NIHCC)的团队开发的,是迄今为止规模最大的多类别、病灶级别标注的临床医疗CT图像开放数据集。该数据库包括多种病变类型,目前包含了32,735张CT图像和相应的病变信息,涵盖了4427名患者的数据,包括肾脏病变、骨病变、肺结节和淋巴结肿大等。DeepLesion多类别病变数据集可用于开发自动化放射诊断的CADx系统。

https://nihcc.app./v/DeepLesion

国外医学数据库

NCHS (CDC National Center for Health Statistics):NCHS提供广泛的与医疗保健相关的数据集,包括生命统计、疾病患病率和健康行为数据。您可以在CDC的网站上找到这些数据集。

网址:https://www./nchs/data_access/ftp_data.htm

TCGA (The Cancer Genome Atlas)提供与各种癌症类型相关的基因组和临床数据,使其成为癌症研究的宝贵资源。这些数据可以通过国家癌症研究所的基因组数据共享中心(GDC)获得。

网址: https://www./ccg/access-data

NHANES (National Health and Nutrition Examination Survey)NHANES:NHANES是一个旨在评估美国成年人和儿童的健康和营养状况的研究计划。数据可以通过CDC获取。

网址:https://wwwn./nchs/nhanes/Default.aspx

MIMIC(Medical Information Mart for Intensive Care):MIMIC是一个包含已去标识化的重症监护病房患者健康数据的数据库。它是重症监护病房(ICU)研究的宝贵资源。

网址:https://mimic./docs/about/

WHO(The World Health Organization)通过其全球卫生观察和其他倡议提供各种数据集和与健康相关的信息。这些数据集涵盖广泛的健康主题,对于研究和分析非常有价值, 包括全球卫生观察数据、全球卫生估计、世界疟疾报告数据、全球结核病报告数据、健康与全民健康(HFA)数据库、免疫接种和可预防疾病数据、全球癌症观察(GCO)、HIV/AIDS数据、 全球疾病负担(GBD)、卫生系统和服务数据

https://www./data/collections

全球疾病负担数据库(GBD)

全球疾病负担数据库提供有关特定疾病或风险因素的全球流行程度数据,同时还包括这些疾病和风险因素相对危害的全球数据。此外,它提供了用于度量数百种疾病、伤害和风险因素对健康造成的损失的工具。GBD的衡量指标包括死亡率、生命年损失、生命年残疾、寿命内受损的生命年、患病率、发病率、预期寿命、死亡风险、以及健康预期寿命、孕产妇死亡率和总体风险的度量。从数据库中提取的数据指标包括数量、比率、百分比、年份以及死亡风险。

https://ghdx./gbd-2019

SEER数据库(Surveillance, Epidemiology, and End Results)于1973年由美国国立癌症研究所(National Cancer Institute, NCI)建立,是美国癌症统计的权威来源。该数据库由美国国家癌症研究所(NCI)癌症控制和人口科学部(Division of Cancer Control and Population Sciences, DCCPS)的监视研究项目(Surveillance Research Program, SRP)提供支持。SEER数据库提供癌症统计信息,将肿瘤分为乳腺、结肠与直肠、其他消化系统、女性生殖系统、淋巴与白血病、男性生殖系统、呼吸系统、泌尿系统以及其他未确定类型的9类肿瘤。

https://seer./

美国国家癌症数据库(National Cancer Database, NCDB)是一家经国家认证的数据库,由美国外科医师学会和美国癌症学会联合创建。该数据库是基于医院登记数据的临床肿瘤学数据库,数据源自1500多个获得癌症委员会认证的机构。NCDB数据库用于分析和追踪恶性肿瘤患者的治疗过程和结果。该数据库代表了全美超过70%的新诊断癌症病例,以及超过3400万个历史记录。

https://www./quality-programs/cancer-programs/national-cancer-database/

Orphanet是一个综合的、全面的罕见病和孤儿药物(治疗所需药物)的数据库和信息门户网站,为一般患者、医生和研发机构提供了丰富的罕见病信息。截至目前,Orphanet已经记录了近6000种罕见病的相关信息,被认为是全球最权威和最丰富的罕见病知识库。通过在该网站上进行信息查询和数据分析,可以获得大量有关罕见病的有用资源。

https://www./consor/cgi-bin/index.php

BioLINCC(Biologic Specimen and Data Repository for NHLBI Studies)是由美国国家心肺血液研究所(National Heart, Lung, and Blood Institute,NHLBI)于2008年建立的数据库。其旨在协助科研人员方便地获取研究数据,提高NHLBI资助项目的转化率。BioLINCC数据库包括两类数据:自1975年以来由血液疾病部门管理的生物标本数据以及自2000年以来由心血管科学研究中心管理的临床研究数据。

https://biolincc.nhlbi./home/

METABRIC(乳腺数据库)是由国际乳腺癌协会的分子分类数据库(Molecular Taxonomy of Breast Cancer International Consortium, METABRIC)所支持的加拿大-英国合作项目。其旨在根据有助于确定最佳治疗方案的分子特征,进一步将乳腺癌分类。迄今为止,根据肿瘤的基因指纹,已经将乳腺癌重新分类为10个全新的类别。这些基因提供了对乳腺癌生物学的重要见解,帮助医生预测肿瘤是否对特定治疗产生反应,以及是否有扩散到身体其他部位的风险,以及治疗后是否有可能复发。

https:///dacs/EGAC00001000484

GEO数据库,全名Gene Expression Omnibus数据库,是由美国国立生物技术信息中心NCBI创建和维护的基因表达数据库。该数据库成立于2000年,收录了来自世界各国研究机构提交的高通量基因表达数据。换句话说,只要是已经发表的论文中包含的基因表达检测数据,都可以在这个数据库中找到。

https://www.ncbi.nlm./geo/

DGV(Database of Genomic Variants)提供一个可公开访问的、全面的结构变异(SV)目录,这些结构变异存在于全球人群的健康对照样本的基因组中。该基因组变异数据库的目标是提供对人类基因组结构变异的全面概述。在此数据库中,结构变异被定义为涉及DNA片段长度大于50bp的基因组改变。数据库的内容仅包括在健康对照样本中鉴定的结构变异。DGV为旨在将基因组变异与表型数据相关联的研究提供了有用的对照数据目录。该数据库定期更新,以包括来自同行评审研究的新数据。

https://ngdc./databasecommons/database/id/283

DECIPHER是一个国际化的合作项目,由200多个临床中心和1600多名遗传学家和实验室组成的联盟。该项目通过整合各种生物信息资源,提供了一套全面的工具,用于识别与患者表型相关的基因组结构变异,以发掘潜在的致病基因。所有研究成果都存储在一个在线数据库中,方便科学家查看和利用。相关研究成果发表在《Nucleic Acids Research》上。

https://www./

OMIM(Online Mendelian Inheritance in Man)数据库,中文称为在线人类孟德尔遗传数据库,专注于疾病表型与其致病基因之间的关联。OMIM数据库包括以下内容:1. 基因条目;2. 等位基因变异;3. 基因图谱;4. 表型系列;5. 表型条目;6. 临床提要;7. 外部链接。

https:///

CTD(The Comparative Toxicogenomics Database)提供了有关化学暴露(包括环境和药物),基因和蛋白质,表型和疾病之间复杂相互作用的信息。这些数据已经与功能和途径数据集成,有助于制定关于受环境影响的疾病潜在机制的假设。CTD数据库包括超过230万种化学药物、46689个基因、4340个表型和7212种疾病的基因、化学表型、药物相关疾病、基因相关疾病以及药物相互作用。自上次更新以来,内容增加了46%,并与其他数据集集成,产生了超过3800万种药物基因组关联。

https:///

Kaplan-Meier Plotter是一个常用于进行生存分析的网站,它的数据来源包括GEO、EGA、TCGA数据库,可以评估来自21种不同肿瘤的30000多个样本中所有基因表达与患者生存率之间的相关性。这有助于发现和验证与生存率相关的生物标志物。

https:///analysis/index.php?p=background

国内公开数据库:

一、中国健康与营养调查(CHNS)数据库

中国健康与营养调查(China Health and Nutrition Survey,CHNS)是由美国北卡罗来纳大学人口中心与中国预防科学医学院合作进行的一项大规模社会健康调查。

该调查的目的是研究健康、营养以及国家和地方政府实施的计划生育政策和项目,以及了解中国社会的社会经济转型如何影响人口的健康和营养状况。

该调查采用多阶段随机聚类方法,从中国15个省份和直辖市的大约7200个家庭和3万多名个体中抽取样本。此外,还通过对食品市场、卫生设施、计划生育官员以及其他社会服务机构和社区领导人的调查,收集了详细的社区数据。

该调查跨足多个学科领域,包括健康学、营养学、社会学、人口学、经济学和公共政策等。调查内容包括社区调查、家庭户调查、个人调查、健康调查、营养和体质测验、食品市场调查以及健康和计划生育调查。

https://www.cpc./projects/china

二、国家人口健康科学数据中心

国家人口健康科学数据中心(National Population Health Data Center,NPHDC)是经国家科技部和财政部认定的20个国家科学数据中心之一,致力于整合来自基础医学、临床医学、药学、公共卫生、中医药学、人口与生殖健康等多个领域的科学数据资源。

https://www./

三、中国健康与养老追踪调查数据库(CHAELS)

中国健康与养老追踪调查(China Health and Retirement Longitudinal Survey, CHARLS)是一项由北京大学国家发展研究院主持,北京大学中国社会科学调查中心与北京大学团委共同执行的大规模跨学科调查项目。该项目得到了国家自然科学基金委的资助,并旨在收集高质量的微观数据,代表中国45岁及以上的中老年人及其家庭。这些数据用于分析中国的人口老龄化问题,促进跨学科研究,为制定和完善相关政策提供更科学的基础。

https://charls.pku.edu.cn/

全球疾病负担数据库(GBD)

全球疾病负担数据库提供有关特定疾病或风险因素的全球流行程度数据,同时还包括这些疾病和风险因素相对危害的全球数据。此外,它提供了用于度量数百种疾病、伤害和风险因素对健康造成的损失的工具。GBD的衡量指标包括死亡率、生命年损失、生命年残疾、寿命内受损的生命年、患病率、发病率、预期寿命、死亡风险、以及健康预期寿命、孕产妇死亡率和总体风险的度量。从数据库中提取的数据指标包括数量、比率、百分比、年份以及死亡风险。

付费医学数据集:

Definitive Healthcare: Definitive Healthcare的平台可以分析美国每个医疗提供者的诊疗和处方数量。这个跨所有支付方的索赔信息涉及到2.47亿患者,提供了患者寻求特定疾病治疗的全面视图。Definitive的索赔数据和分析能帮助您:

1. 通过ICD-10编码、CPT/HCPCS编码或DRG编码对数据进行分段,然后查看哪些机构进行了最多的诊疗和诊断。

2. 分析医生、医院和其他机构在特定时间段内的转诊模式。

3. 查看特定ICD-10编码的总费用占比、主要诊断和每项索赔的平均费用。

4. 识别在特定市场引入新药物的机会,定位需要医疗设备或用品的机构,以及启动临床试验。

网址: https://www./

IQVIA(前身为IMS Health):IQVIA是一家重要的医疗数据和分析提供商。他们提供与制药、医疗提供者和医疗机构相关的各种数据集。这些数据集可能包括有关制药公司、医院、诊所和其他医疗企业的信息。

网址:https://www./solutions/real-world-evidence/real-world-data-and-insights

邓白氏公司(Dun & Bradstreet,D&B):D&B提供广泛的商业数据,包括有关医疗保健行业公司的信息。您可以获取有关医疗提供者、制药制造商和其他与医疗保健相关的企业的数据。

网址:https://www./

Truven Health Analytics(属于IBM Watson Health的一部分):Truven Health Analytics提供涵盖医疗机构、提供者和公司数据的医疗数据集。这些数据可用于市场分析和研究。

网址:https://www./healthcare-analytics/truven-health-analytics

情联系: 13381109780(杨老师) 

Email:     bd@medicalai.top

培训课程推荐(请点击浏览

部分免费视频课推荐(请点击浏览

软件推荐(请点击浏览

科研服务

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多