四千四百七十七章 理念的分歧 (第3/3页)
数据处理中的应用边界”的争论,在AI技术组与生物实验组之间骤然爆发。冲突的导火索,是一份由AI技术组主导完成的基因数据筛选报告。
彼时,研发中心刚启动“罕见遗传病相关基因定位”的前期筹备工作,核心任务是从海量的人类基因组数据中,筛选出与目标遗传病相关的候选基因位点。
吴浩为了推进效率,安排AI技术组负责数据初筛,生物实验组后续进行验证实验。可当AI技术组的骨干成员赵凯,将一份标注着“筛选准确率95%”的报告交到生物实验组组长周悦手中时,会议室的气氛瞬间降到了冰点。
周悦是杨芳的得意门生,深耕基因测序领域多年,性格严谨到近乎苛刻。她快速翻阅着报告,眉头越皱越紧,最后直接将报告拍在桌上,语气带着明显的质疑:“赵工,这份报告你们是怎么得出的?
我随便抽查了三个标注为‘高相关性’的基因位点,其中两个在现有文献中都没有任何与该遗传病相关的记载,甚至有一个是已知的良性变异位点。这样的筛选结果,怎么可能达到95%的准确率?”
赵凯愣了一下,随即上前一步,指着报告上的算法模型说明:“周博士,我们采用的是基于深度学习的基因关联分析算法,整合了全球12个权威基因数据库的近千万条数据。算法通过分析基因序列的保守性、表达调控模式等多个维度,自动计算出相关性评分。你说的那两个位点,虽然现有文献记载较少,但算法检测到它们在患者群体中的突变频率显著高于正常群体,所以判定为高相关性候选位点。”
“仅凭突变频率就判定高相关性?”周悦的声音陡然提高,“赵工,你不懂基因研究的复杂性!很多基因的突变频率与疾病并无直接关联,可能只是群体遗传多态性的表现。而且,你们的算法有没有考虑基因间的互作效应?有没有排除环境因素对基因表达的影响?这些都是基因定位中至关重要的变量,仅凭数据模型是无法精准量化的。”