数据采购需求-重大疾病数据行业创新中心-上海芯超数据科技有限公司

数据采购需求西北地区-医保医疗数据

一、数据基础要求 1．范围：市级以上。 2．人数：≥ 300万人。 3．来源优先级：1）医保数据；2）卫健数据。 4．排除来源：单一的电子发票数据。二、核心数据清单 1. 医保局数据 1）就诊人信息（社保卡号、姓名）、医院信息、入院出院时间、出入院诊断编码、总费用、自付金额、医保报销金额等。 2）药品/项目名称与编码、数量、单价、金额、自付比例等。 3）历史住院的诊断、时间、医院、以及医保支付明细等。 2. 卫健委数据（重要补充）就诊人信息（社保卡号、姓名）、就诊时间、医院信息、医院科室、住院号、诊断编号、诊断描述、主诉、症状详情、医生信息、就诊流水号等。

需求场景：商保、核保、理赔

面议

查看详情

数据采购需求胸腹部影像数据

胸部腹部

一、疾病类型 1.各种胸部疾病，包括不限于：肺炎、肺结核、慢性阻塞性肺病、气胸、支气管扩张、支气管哮喘、间质性肺病、肺水肿、肺气肿、肺不张、脓胸、肺脓肿、肺结节、肺癌、乳腺癌、乳腺其它病变、食管癌、纵隔肿瘤、纵隔其它病变、胸壁外伤、胸壁肿瘤、胸壁其它病变、甲状腺肿瘤、甲状腺其它病变、心肌疾病、心脏瓣膜疾病、心包疾病、冠心病、大血管疾病、肺循环疾病、心血管系统血栓与其他疾病、胸膜、中叶综合征、肺血管疾病、气道疾病等。数据要求：CT+报告、增强CT+报告、MR+报告、增强MR+报告、超声+报告、血液检查、痰培养、尿检、GOLD、肺功能测试、呼吸测试、TNM分期、病理报告、诊断记录，清晰标注不同疾病亚型需配套的数据模态。对血管类疾病等疾病，需要CT+报告+增强CT+报告。并列出各个疾病各个数据的病例数。 2.各种腹部疾病，包括不限于：胃癌、肝癌、肾癌、肠癌、胰腺癌、胃各种疾病、肝各种疾病、胰腺各种疾病、脾脏病变、泌尿系统各种疾病、肠道各种疾病、肾上腺肿瘤、肾上腺各种疾病、生殖系统各种疾病，腹腔、腹膜后及血管各种疾病，以及其它疾病。数据要求：CT+报告、增强CT+报告、MR+报告、增强MR+报告、胃肠镜结果、血检、尿检、TNM分期、病理报告、诊断记录，清晰标注不同疾病亚型需配套的数据模态。对血管类疾病等疾病，需要CT+报告+增强CT+报告。并列出各个疾病各个数据的病例数二、疾病分类逻辑：按 “系统/种类→类型→亚型”三级划分（如呼吸系统-肺炎-病毒性肺炎），核心覆盖各个系统、血管、胸廓、腹膜等胸腹部相关疾病，细分良性 / 恶性疾病亚型（如肺癌、胆囊结石、胰腺炎等），并且明确每个疾病的对应数据（如 CT + 报告 + 血液 + 痰）。数据完整性提示：通过缺失值标注，明确部分亚型的 “良 / 恶性”“标签” 等字段需补充完善，为数据采集提供优先级指引。三、数据交付规范 1.核心原则：以“胸腹部平扫CT影像及其对应的放射科诊断报告”作为核心数据源，其他模态数据（如MRI、超声、实验室检验、病理结果等）仅作为辅助信息，清晰界定主次数据关系。 2.影像规范：所采集的CT影像须符合低剂量螺旋CT（LDCT）或常规CT的临床采集标准，明确记录成像方式、层厚、重建算法等关键技术参数。报告规范：每例CT检查必须配套一份完整的放射科诊断报告，内容须包含“年龄、性别、检查所见、诊断意见”四项要素，其中年龄应精确至“岁”，不得使用“约”“左右”等模糊表述。 3.病例完整性：每例病例需具备可支撑后续分析与追溯的基础信息，确保数据结构完整、关键字段无缺失。 4.合规性要求：所有数据均已获得受试者或法定授权方的完整知情同意，授权范围覆盖当前研究及数据使用目的。

需求场景：AI模型

面议

查看详情

数据采购需求脂肪肝数据

脂肪肝

1.数据总体要求 1）疾病：非酒精性脂肪性肝病、代谢相关脂肪性肝病、酒精性脂肪肝，需明确诊断依据 2）数据类型：结构化电子病历（EMR）为主，辅以半结构化报告（如影像、病理） 3）时间跨度：截至2025年，至少有10年随访的完整诊疗记录 4）样本量：≥ 5,000例独立患者（含 ≥1,000例有≥2次随访者） 5）数据来源：三级医院或脂肪肝专病中心，具备规范诊疗流程 2.数据内容 1）一般信息：性别、年龄、身高、体重、BMI、腰围、血压、吸烟、饮酒、饮食、体力活动情况、疾病史、用药史，临床症状与体征等。 2）脂肪肝诊断信息：诊断时间、诊断类型、影像学诊断依据、肝活检结果（如适用）、临床分期等。并发症 3）实验室检验：肝功能、肾功能、血脂、空腹血糖、口服葡萄糖耐量试验、糖化血红蛋白、血清胶原、脯氨酰羟化酶、单胺氧化酶、自身抗体等项目，含项目名称、结果、参考范围。 4）影像检查：包括超声、CT、MRI等。 5）干预信息：饮食控制、运动、治疗药物等。 6）随访信息：随访内容包括体重、BMI、肝功能、脂肪变/纤维化评估（至少每2年一次影像或弹性成像），是否调整用药方案，新发生的并发症描述、依从性评估等，随访终点事件包括肝硬化、肝细胞癌、肝移植、全因死亡。 3.其他要求结构化脱敏数据，每个病例至少有3次随访记录，必须提供基础影像数据。

需求场景：疾病研究

面议

查看详情

数据采购需求心内科诊疗数据

1. 数据核心要求 • 临床数据链条完整性：数据应覆盖“主诉→症状→体征→检查→诊断→治疗→预后/随访”的完整临床诊疗闭环，确保能够支持疾病进程与疗效的追踪研究。 • 数据来源与权威性：数据须来源于三级甲等医院或区域心血管诊疗中心的真实、严肃的电子病历系统，确保其临床权威性和研究可靠性。 • 隐私安全与脱敏标准：数据必须完成不可逆脱敏，彻底去除所有个人直接标识符（如姓名、身份证号、电话号码、住址）和间接标识符，交付的应为无法复原的匿名化数据集。 2. 数据内容与结构要求 • 科室与疾病范围：数据应集中于心内科、高血压科、心脏康复科、胸痛中心、心力衰竭专病门诊等心血管相关临床单元。要求涵盖疾病谱系广（如冠心病、心力衰竭、高血压、心律失常等），且单一病种的数据积累需达到统计学研究要求的样本量。 • 时间维度与样本模式：可提供以下两种模式组合： o 纵向队列数据：同一患者的长周期、多时序诊疗记录。 o 横向截面数据：不同患者在特定时间周期内的完整就诊记录。 3. 数据交付与评估流程 • 数据采集、脱敏、传输、使用全过程须符合国家医疗数据安全与隐私保护法规。 • 在签署正式协议后、全量数据交付前，供应商需提供可代表整体数据质量的随机抽样数据集，供我方进行数据质量评级。 • 在数据交付周期内，进行定期或不定期的抽样评级，确保持续的数据质量。 • 所有数据必须在满足上述脱敏标准的前提下，以加密安全方式进行交付，并附带数据字典、变量说明及脱敏流程说明。

需求场景：疾病研究

面议

查看详情

数据采购需求急诊抢救全链条数据

急诊

一、疾病：不限，近5年二、例数： 1.内科疾病≥ 10000例 2.外科疾病≥ 10000例 3.连续病例三、院前信息呼叫接通时间戳、调度派车时间戳、救护车出发时间戳、救护车到达现场时间戳、主诉类别、现场首次接触患者时间戳、离开现场时间戳、到达医院时间戳、首次生命体征记录、持续生命体征数据流链接、初步印象/诊断、关键评分、关键干预措施等四、患者基本信息性别、出生日期、吸烟史、饮酒史、疾病史等五、诊疗信息 1.基本信息：首诊医生接诊时间戳、入院科室、急诊初步诊断、急诊最终诊断等 2.影像检查：影像检查类型、影像检查时间、影像报告摘要等 3.实验室检验：血常规、肝功能、肾功能、电解质等项目，含项目名称、结果、参考范围、采样时间、检测时间。 4.心电图（适用时） 5.治疗信息：治疗方式、治疗方案等。 6.出院状态六、随访信息随访方式、随访时间点、随访内容（生存状态、功能状态、生活质量、再住院情况、主要不良事件等）。

需求场景：AI模型

面议

查看详情

数据采购需求医患对话语音数据

医患对话语音

数据规模：10万小时采样率：44.1 / 48 kHz 合规性：已获得医患双方完整授权

需求场景：AI模型

面议

查看详情

数据采购需求胃镜影像数据

胃镜影像

一、疾病/异常胃炎、胃息肉、胃溃疡、胃癌、高级别上皮内瘤变、低级别上皮内瘤变、胃黏膜下隆起、胃部未见异常、食管炎、食管癌、食管黏膜下隆起、十二指肠溃疡、十二指肠黏膜下隆起，具体见附件。二、例数：见附件三、影像数据 1. 数据标准： (1) 原始胃镜动态视频（完整记录从食管至十二指肠的检查过程），或从中截取的高质量静态图像序列（DICOM或同等清晰度格式）。 (2) 若为静态图像，每个病例的有效图片数量应不少于40张，需全面覆盖上消化道主要解剖部位（食管、贲门、胃体、胃窦、幽门、十二指肠球部及降部）以及发现的任何病灶的不同角度与模式（白光、特殊光NBI）。 2. 数据排除标准：为确保数据质量与可用性，以下情况的数据应予以排除： (1) 完整性不足：缺少内镜诊断报告，或静态图像数量少于40张且无法提供完整视频的病例。 (2) 解剖结构异常：有胃部全切或部分切除手术史的病例，因其解剖结构发生根本性改变，不利于模型学习标准解剖下的病变特征。 (3) 质量不合格：影像质量差，存在严重模糊、伪影、视野不清或病灶遮挡，影响诊断判断的病例。 3. 标注与标签要求标注与标签明确疾病类型，应提供病灶区域的边界框或像素级分割掩码，特别是在静态图像上。四、报告 1. 胃镜检测报告： (1) 病灶信息：精确解剖位置、大小、形态（如息肉、溃疡、隆起、凹陷）、表面结构、边界、质地等。 (2) 内镜诊断：对病变的初步判断（如慢性胃炎、胃溃疡、高级别上皮内瘤变怀疑、早癌等）。 2. 病理报告（如有）：病理报告需明确病理类型（如慢性炎、萎缩、肠化、低/高级别上皮内瘤变、腺癌等）、分化程度、浸润深度（如有）等关键信息。五、数据多样性要求 1. 数据来源应具有广泛性，尽量来源于多中心、多品牌内镜设备（如奥林巴斯、富士等）。 2. 病例需涵盖不同地区、性别、年龄段的患者，并包含上消化道各类常见病、癌前病变及恶性肿瘤，确保数据具备临床代表性。 3. 应包含不同病程阶段的病例（从正常黏膜、炎症、癌前病变到早癌、进展期癌）。六、脱敏要求必须对数据进行彻底脱敏处理，去除所有可直接或间接识别个人身份的信息，仅保留与医学研究相关的参数与标签。

需求场景：AI模型

面议

查看详情

数据采购需求乳腺钼靶影像数据

乳腺钼靶

一、异常类型乳腺未见异常、肿块、结构扭曲、不对称致密、局灶性不对称、淋巴结异常、乳腺填充、乳腺皮肤增厚、乳头回缩。二、例数：见附件三、影像数据： 1. 序列需求： (1) 检查类型：必须为符合临床标准的双侧乳腺DBT检查。 (2) 投照体位：每例检查应包含双侧乳腺的两个标准投照位头足位（CC）和内外斜位（MLO）的薄层重建序列和对应的二维乳腺钼靶摄影。 (3) 图像格式：原始DICOM格式，保留完整的DICOM元数据，包括但不限于扫描参数（kV、mAs）、层厚、重建算法（重建核）、设备型号等。 2. 图像质量需求： (1) 分辨率：单帧断层图像分辨率不低于512 x 512像素。 (2) 图像质量：影像应清晰，满足诊断需求。需排除存在严重运动伪影、金属伪影或其他技术缺陷以致影响影像诊断与病灶判读的病例。 (3) 病灶显示：图像应能清晰呈现目标病灶的关键影像特征（如边缘、形态、密度等）。 3. 数据多样性需求： (1) 设备来源（多中心/多品牌）：数据应来源于多个医疗中心，并覆盖至少3个不同设备制造商（如Hologic, GE Healthcare, Siemens Healthineers等）的至少5种不同设备型号，以确保算法泛化能力。 (2) 人群代表性：患者人群应涵盖不同地区、性别与年龄分布，具备流行病学代表性，能反映真实的临床人群特征。 4. 标注需求： (1) 分类标签：明确标注病种名称（如钙化、局灶性不对称等）及对应的BI-RADS分级。 (2) 分割掩码：对可测量病灶，需提供像素级的分割掩码，精确勾勒病灶轮廓。 (3) 标准规则：对于钙化病变，需标注在二维影像上，局灶性不对称、结构扭曲、不对称致密、淋巴结异常需要在三维重建序列上逐层标注。四、报告： 1. 影像报告：每例DBT影像数据必须配套一份完整的放射科诊断报告，应包含病灶位置（侧别、象限/钟点位置）、大小（三维测量）、形态（肿块、不对称、结构扭曲等）、密度、分布范围等标准化描述。 2 .BI-RADS分级：必须提供最终的BI-RADS评估分级（0-6级）。 3. 病理报告：包含送检组织的来源部位、细胞类型、病变性质、肿瘤大小、分化程度等关键信息。五、脱敏要求必须对数据进行彻底脱敏处理，去除所有可直接或间接识别个人身份的信息，仅保留与医学研究相关的参数与标签。

需求场景：AI模型

面议

查看详情

导航

联系我们

联系我们

回到顶部