PhysioNet Index

Database Credentialed Access

MS-CXR-T: Learning to Exploit Temporal Structure for Biomedical Vision-Language Processing

Shruthi Bannur, Stephanie Hyland, Qianchu Liu, et al.

The MS-CXR-T is a multimodal benchmark that enhances the MIMIC-CXR v2 dataset by including expert-verified annotations. Its goal is to evaluate biomedical visual-language processing models in terms of temporal semantics extracted from image and text.

disease progression cxr vision-language processing chest x-ray radiology multimodal

Published: March 17, 2023. Version: 1.0.0

Database Credentialed Access

Tasks 1 and 3 from Progress Note Understanding Suite of Tasks: SOAP Note Tagging and Problem List Summarization

Yanjun Gao, John Caskey, Timothy Miller, et al.

We introduce a hierarchical annotation suite of tasks addressing clinical text understanding, reasoning and abstraction over evidence, and diagnosis summarization. One task is section tagging major section and the other task is diagnosis generation.

Published: Sept. 30, 2022. Version: 1.0.0

Database Open Access

Cerebral perfusion and cognitive decline in type 2 diabetes

Vera Novak, Rodrigo Quispe, Charles Saunders

Dataset collected during a study on type 2 diabetes on brain blood flow, vasoreactivity and functional outcomes (gait and balance) using TCD, MRI perfusion and foot pressure distribution and gait measures.

vasoregulation brain diabetes

Published: Aug. 5, 2022. Version: 1.0.1

Visualize waveforms

Database Restricted Access

VinDr-SpineXR: A large annotated medical image dataset for spinal lesions detection and classification from radiographs

Hieu Huy Pham, Hieu Nguyen Trung, Ha Quy Nguyen

VinDr-SpineXR: A large annotated medical image dataset for spinal lesions detection and classification from radiographs

Published: Aug. 24, 2021. Version: 1.0.0

Database Credentialed Access

Insulin4RL: Real-Time Insulin Infusions For Offline Reinforcement Learning

Thomas Frost, Steve Harris

Openly available research dataset intended for offline reinforcement learning (ORL) using natively irregular healthcare data. The dataset is intended to encourage further research into ORL methods using naturally sporadic decision intervals.

insulin intensive care semi-markov decision process diabetes blood glucose offline reinforcement learning machine learning

Published: June 15, 2026. Version: 1.0.0

Database Restricted Access

EchoNext: A Dataset for Detecting Echocardiogram-Confirmed Structural Heart Disease from ECGs

Pierre Elias, Joshua Finer

EchoNext is a curated dataset of electrocardiograms (ECGs) paired with echocardiogram-confirmed structural heart disease labels, designed to support the development and validation of machine learning models.

clinical decision support artificial intelligence digital health structural heart disease electrocardiogram health equity ecg heart failure transthoracic echocardiogram ai model deployment valvular heart disease cardiovascular screening ai in healthcare left ventricular dysfunction deep learning population health aortic stenosis machine learning

Published: April 30, 2026. Version: 1.1.1

Database Restricted Access

KI EndoLIST: Endometriosis Longitudinal Individualized Symptoms Tracking Dataset

Tamar Zelovich, Vered Klaitman, Shaked Feiglin, et al.

This database contains daily symptoms of 34 endometriosis patients over 1-10 months of monitoring. It includes basic patient information, frequency and intensity of symptoms, and standard MedDRA symptom mapping for clinical interpretation.

Published: April 30, 2026. Version: 1.0.0

Database Credentialed Access

MIMIC-CXR-Ext-ILS: Lesion Segmentation Masks and Instruction-Answer Pairs for Chest X-rays

Geon Choi, Hangyul Yoon, Hyunju Shin, et al.

Instruction-guided lesion segmentation data for chest X-rays, including 1.1M instruction-answer pairs and 91K segmentation masks covering seven major lesion types.

chest x-ray segmentation text-guided segmentation lesion segmentation

Published: March 25, 2026. Version: 1.0.0

Database Credentialed Access

Structured Viewing Classification Annotations From the MIMIC-IV-ECHO Dataset (ECHOVIEW)

Sampath Rapuri, Sofia Sapeta Dias, Maria Salomé Carvalho, et al.

ECHOVIEW provides structured viewing class annotations for 29,196 transthoracic echocardiograms derived from MIMIC-IV-ECHO using a pretrained CNN. Manual clinician review shows substantial agreement (κ=0.69) with these annotations.

Published: March 17, 2026. Version: 0.1

Database Open Access

Longitudinal Cylinder Rearing Behavioral Data in a Mouse Stroke Model Across Multiple Drug Treatments

Yunhao Jiang, Shreyas Venkitaraman, Hee Ra Jung, et al.

This dataset provides cylinder rearing video and behavioral scoring data from 59 mice undergoing stroke and drug treatments.

Published: March 4, 2026. Version: 1.0.0

Search

Resources

MS-CXR-T: Learning to Exploit Temporal Structure for Biomedical Vision-Language Processing

Tasks 1 and 3 from Progress Note Understanding Suite of Tasks: SOAP Note Tagging and Problem List Summarization

Cerebral perfusion and cognitive decline in type 2 diabetes

VinDr-SpineXR: A large annotated medical image dataset for spinal lesions detection and classification from radiographs

Insulin4RL: Real-Time Insulin Infusions For Offline Reinforcement Learning

EchoNext: A Dataset for Detecting Echocardiogram-Confirmed Structural Heart Disease from ECGs

KI EndoLIST: Endometriosis Longitudinal Individualized Symptoms Tracking Dataset

MIMIC-CXR-Ext-ILS: Lesion Segmentation Masks and Instruction-Answer Pairs for Chest X-rays

Structured Viewing Classification Annotations From the MIMIC-IV-ECHO Dataset (ECHOVIEW)

Longitudinal Cylinder Rearing Behavioral Data in a Mouse Stroke Model Across Multiple Drug Treatments