医学研究迎来“零人工”时代了?!
清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI。
首次实现从文献挖掘→实验设计→数据分析→代码生成→可投稿论文的全链条自动化闭环。

为什么要推出该系统?主要是医疗信息学研究正陷入效率困局——多中心数据融合、知识爆炸、跨学科协作需求,使传统科研模式日益捉襟见肘。
而OpenLens AI引入医学专属质量控制方法,生成出版级别的高质量科研论文,将科研周期从“月级”压缩至“小时级”,宣告医学研究迎来“零人工”时代。

下面详细来看——
五大核心模块:AI科研的梦之队
OpenLens AI采用模块化架构,由五个专门化的智能体协同工作,构建起完整的科研自动化流水线:
主管模块作为全局协调者,将用户查询分解为结构化子任务,确保整个研究流程的透明度和可解释性。
文献综述者构建自主知识探索管道,利用基于ReAct的推理框架,检索并综合相关文献,为研究提供坚实的理论基础。
数据分析者协调多阶段数据处理流程,将原始医学数据(从时间序列到基因组信息)转换为结构化、可解释的洞察,生成包含可视化、统计摘要和自然语言解释的综合报告。
编码器将高级实验计划转换为可执行代码,并通过视觉语言模型评估输出质量,确保计算程序的正确性和科学意义。
LaTeX写作器整合所有前序模块的输出,生成出版级的科学论文,通过视觉语言反馈确保图表质量和格式一致性。

医疗科研的质量守护者
OpenLens AI不仅实现全流程自动化,也在质量控制方面设立新标杆,集成四大保障机制:
- 学术严谨性检查:自动验证实验方法合理性,检测数据泄露、不当性能指标等常见陷阱,确保研究结果可靠。
- 证据可追溯性检查:将每个研究声明链接到基础证据,生成结构化可追溯性报告,确保研究透明度和可复现性。
- 文献检查:验证所有引用的参考文献,确认元数据准确性,删除不可验证条目,保证学术背景可靠性。
- 视觉语言反馈:在关键阶段评估图表质量,提供感知反馈,增强结果可读性和科学有效性。
实证验证:从简单到复杂的全面测试
研究团队在MIMIC-IV和eICU两个权威医学数据集上测试了OpenLens AI,设计了18个难度递增的任务。
评估结果显示,系统能够以高可靠性完成大多数任务,特别是对于低至中等难度的问题。
- 对于简单任务(如患者年龄分布、死亡率统计),系统在所有评估维度上均获得高分。
- 对于中等难度任务(如预测模型构建),性能仍然强劲但偶有数据预处理或模型拟合错误。
- 对于困难任务(如因果发现),系统面临更多挑战,反映了这些任务的内在复杂性。