需求发布
联系我们
1.数量:至少5000组
2.数据内容
1)一般信息:性别、年龄、身高、体重、BMI、血压、吸烟、饮酒、饮食、运动、疾病史、用药史等。
2)实验室检验:空腹血糖、口服葡萄糖耐量试验、糖化血红蛋白、空腹胰岛素水平、空腹C肽、肝功能、肾功能、血脂、血糖等项目,含项目名称、结果、参考范围。
3)干预信息:饮食控制、运动、治疗药物
4)随访信息:随访编号、随访时间、本次随访HbA1c值、本次空腹血糖、是否调整用药方案、新发生的慢性并发症描述、依从性评估等
需求场景:AI模型
面议
1.例数:至少2万例
2.疾病:肺结节,肺癌
3.数据内容:
基本信息:性别、年龄、吸烟史等
临床信息:临床诊断、病理诊断、实验室检查等
影像数据:层厚、扫描部位、扫描方式、扫描序列、影像格式、影像数量、影像分辨率、影像压缩方式等。
4.其他信息:
是否有病社报告、是否有标注信息等
需求场景:AI模型
面议
1.数量:至少1000组
2.数据内容
1)一般信息:性别、年龄等。
2)体格检查:身高、体重、BMI(体重指数)、血压、脉搏、视力、听力、口腔、皮肤等。
3)内科检查
4)外科检查
5)实验室检验:肝功能、肾功能、蛋白4项目、胆红素3项、血脂、血糖、血常规、尿常规、粪便常规、粪便隐血、肿瘤标志物、甲状腺功能等,含项目名称、结果、参考范围、异常标识。
6)影像:X光、B超、CT、MRI等。
7)内镜检查:胃镜、肠镜等。
8)心电图
9)妇科检查
10)男科检查
11)其他项目:肺功能检测,骨密度,动态心电图(Holter),动态血压等。
12)体检报告:体检结论,医生建议。
3. 连续性要求
1)同受检者关联:同一受检者的多份报告需通过唯一ID关联(如加密身份证号或机构内部标识符)。
2)时间跨度:每组报告需覆盖至少2年,建议5年内。
4. 数据质量
1)完整性:单份报告体检项目完整率≥95%,无关键字段缺失。
2)准确性:数值型结果需与原始报告一致,误差率≤1%。
3)合规性:数据需脱敏处理(去除患者真实姓名、身份证号、联系方式等隐私信息)。
5. 详细要求见附件。
需求场景:AI模型
面议
1.数量:10万例
2.数据内容
1)一般信息:年龄、性别、疾病史等。
2)症状
3)诊断
4)检验:肝功能、肾功能、蛋白4项目、胆红素3项、血脂、血糖、血常规、尿常规、粪便常规、粪便隐血、肿瘤标志物、甲状腺功能等,含项目名称、结果、参考范围、异常标识。
5)影像检查报告:B超、CT、MRI等。
6)医嘱
7)其他:用药记录、手术记录。
3.数据完整性
结构规范:电子病历:需包含完整诊疗流程(主诉→现病史→检查→诊断→治疗方案);检验项目无缺失(含项目名称、结果、参考范围、异常标识);逻辑保留:章节标题(如"实验室检查")、字段标签(如"血压:120/80 mmHg")必须完整,禁止删除关键模块(如缺失"影像学结论"视为无效)。
4.数据准确性
直接导出自医院信息系统(HIS/LIS/RIS),禁止经OCR识别或格式转换。数值结果(如血常规)与检测设备输出一致,保留原始单位与精度(如HbA1c:6.5 %)。文本内容无乱码、关键术语错误(如"心肌梗死"无误)。
5.合规性要求
隐私脱敏:删除涉及个人隐私数据。匿名ID,日期偏移处理,仅保留年龄、性别、检查时间
6.格式要求:
文本类型的纯文本,编码格式utf-8(需兼容中英双语及特殊医学符号,如μ、℃等)。以患者为单位存储(单患者所有记录整合为独立文件)。若为CSV文件,需明确列分隔符(建议逗号,)及转义符规则。
需求场景:AI模型
面议
1.数量:10万例
2.数据内容
1)一般信息:年龄、性别等。
2)体格检查:身高、体重、体重指数、血压、脉搏等
3)检验:肝功能、肾功能、蛋白4项目、胆红素3项、血脂、血糖、血常规、尿常规、粪便常规、粪便隐血、肿瘤标志物、甲状腺功能、电解质、微量元素等,含项目名称、结果、参考范围、异常标识。
4)影像:B超(肝,胆,胰,脾,泌尿系统,甲状腺,前列腺,盆腔,乳腺,颈动脉等)、低剂量胸部CT、头部MRI等。
5)内科、外科、妇科、男科等检查
6)眼睛:眼压、眼底检查等。
7)体检每项检查的结论。
3.数据完整性
所有检验项目无缺失(含项目名称、结果、参考范围、异常标识);逻辑保留:章节标题(如"实验室检查")、字段标签(如"血压:120/80 mmHg")必须完整,禁止删除关键模块(如缺失"影像学结论"视为无效)。
4.数据准确性
禁止经OCR识别或格式转换。数值结果(如血常规)与检测设备输出一致,单位完整。文本内容无乱码、关键术语错误。
5.合规性要求
隐私脱敏:删除涉及个人隐私数据。匿名ID,日期偏移处理,仅保留年龄、性别、检查时间。
需求场景:AI模型
面议
1. 数量:至少1000条
2. 时间:近3年
3. 基本信息:性别、年龄、吸烟史、疾病史、确诊时间、TNM分期、术前治疗等。
4. 治疗信息:治疗方案、放疗相关信息(放疗起止时间、放疗技术、分割次数、放疗部位、剂量、肺平均剂量、V5、V20、V30等)等。
5. 肺间质性肺炎信息
是否发生放射性肺炎、发生时间(放疗后天数)、诊断方式、CT影像表现类型、受累肺叶、肺功能指标、临床分级(CTCAE v5.0)、肺炎治疗方案、肺炎预后信息、实验室与生物标志物(如有)等。
需求场景:真实世界研究
面议
1.肿瘤类型:结直肠癌、食道癌、胃癌、肝癌
2.例数:每种肿瘤10000例
3.影像类型:CT或MRI
4.基本信息:
4.1.扫描序列、影像格式、影像数量、影像分辨率、影像压缩方式等。
4.2.文字版病理报告和影像检查报告。
需求场景:AI模型
面议
例数:至少1万例
基本信息:
疾病诊断、影像类型、层厚、扫描部位、扫描方式、扫描序列、影像格式、影像数量、影像分辨率、影像压缩方式等
其他信息:
是否有病社报告、是否有标注信息等
需求场景:AI模型
面议