江南大学毛健团队,依托“泸州老窖-江南大学国宝生态研究协同创新中心、古越龙山-江南大学黄酒酿造创新实验室”两大平台,联合新加坡国立大学等于2025年11月在国际食品Top期刊《Trends in Food Science & Technology》(Q1,中科院1区Top,IF2024=15.4)发表题为“AI-Driven Exploration of Microbial Resources in Fermented Foods”的综述性论文。
人工智能正重塑发酵食品微生物研究范式:传统培养法难窥复杂菌群真貌,多组学虽数据海量却解读乏力;AI 凭借机器学习/深度学习,从宏基因组、代谢组等多维信息中精准注释菌种、预测基因与通路、建模微生态互作,并实时追踪有机酸、酯类、维生素、活性肽等风味与营养因子的形成轨迹,为发酵食品发酵过程优化、下一代功能菌株开发和个性化产品创制提供决策引擎,为发酵食品产业构建以AI为核心的现代产业体系提供系统性的知识图谱、算法工具与数据基础,贯通“微生物资源挖掘—代谢机制解析—智能过程控制”全链条研究框架。本论文获得了国家自然科学基金重点项目(222422807、22138004)、绍兴市科技计划项目(2023B43001)、国宝生态研究协同创新中心、国家固态酿造工程技术研究中心资助。

文章背景
-
在全球食品产业迈向数字化与智能化的背景下,人工智能(AI)正成为发酵食品领域的关键创新力量。AI技术正在突破传统微生物研究的限制,有望全面提升发酵食品的质量、安全性与功能价值。发酵食品依靠特定微生物在控制条件下对原料进行酶促转化,从而形成独特的风味、口感和营养特性。研究显示,微生物不仅能产生有机酸、氨基酸和酯类等关键风味物质,还能提升维生素含量,并生成具备抗癌、免疫调节和抗菌作用的生物活性肽,有助于食用安全和人体健康。深度解析这些微生物作用机制,已成为推动发酵食品产业升级的重要方向。然而,传统微生物研究依赖分离培养和单一检测手段,耗时长、效率低,且难以捕捉发酵体系中复杂而动态的微生物群落。近年来虽然多组学技术——包括宏基因组学、转录组学、蛋白质组学与代谢组学——已显著推进微生物探索,但庞大的数据规模和高维度结构依旧使数据分析面临巨大挑战。
-
人工智能的兴起正在弥补这一瓶颈。借助机器学习和深度学习算法,研究者能够从多源大规模数据中提取微生物模式特征,实现高分辨率的菌种注释、基因功能预测及其参与的代谢通路重建,为揭示发酵机制提供强大助力。AI不仅能够建模微生物之间的相互作用,还可用于预测发酵过程中关键风味与营养成分的形成轨迹,为发酵过程优化提供决策依据。AI驱动的微生物资源挖掘将在未来发挥更加核心的产业价值,有望加速下一代发酵菌种开发,提升生产效率与稳定性,并推动个性化和功能化食品的研发。尽管数据标准化、模型可解释性和产业应用落地仍面临挑战,但AI已被视为推动发酵食品产业迈向智能制造和精准营养的重要引擎。
成果介绍
研究系统总结了人工智能(AI)在发酵微生物研究中的变革性作用,首次从学术视角明确提出“AI驱动的微生物资源挖掘”研究框架。传统培养与多组学技术虽然揭示了发酵体系的微生物组成和代谢分子,但在大规模数据解析与功能机制探索方面存在瓶颈。本成果指出,通过将机器学习和深度学习引入微生物注释、功能基因识别、代谢通路预测和菌群互作建模,可实现对发酵体系的高分辨分析与精确认知,为食品微生物研究提供了全新的技术路线。
研究总结了AI在微生物资源挖掘中的四类核心应用:菌种快速精准注释;功能基因识别与酶活性预测;代谢途径构建与目标成分合成预测;菌群互作网络构建与发酵过程调控。这些应用突破了传统技术难以解析“谁在做什么”“它们如何协同/竞争”“怎样改变能提升产品品质”等关键科学问题,为揭示风味形成、营养提升与食品安全机制提供了新工具。
研究前瞻性提出了AI驱动的工业发酵应用蓝图,涵盖智能菌种筛选、高通量发酵优化、数字孪生工厂与精准质量控制。通过将多组学数据、传感器监测与AI模型结合,可实现发酵过程的实时动态调控,提高风味一致性、生产效率与产品安全性。同时指出未来重点在于数据标准化、模型可解释性提升与工厂装备融合,为发酵食品产业迈向智能化生产提供战略方向。
图文赏析

图1 人工智能驱动的发酵食品微生物资源开发示意图。发酵食品中含有乳酸菌、酵母菌和霉菌等多种微生物,它们在发酵过程中发挥关键作用。此外,高通量测序和质谱技术被用于基因组学、转录组学、蛋白质组学和代谢组学研究。这些组学数据促进了人工智能技术在资源挖掘中的应用,包括物种注释、功能基因挖掘、代谢通路预测以及微生物互作关系预测。随着多组学和人工智能的快速发展,先进计算方法在指导发酵食品微生物资源挖掘和构建人工智能虚拟细胞方面展现了巨大潜力。

图2 组学技术及主要资源挖掘方法示意图(A)包括基因组学、转录组学、蛋白质组学和代谢组学。GC-MS:气相色谱-质谱联用;LC-MS:液相色谱-质谱联用。文献关键词共现网络用于探索发酵食品(B–E)。(B) 传统方法探索发酵食品资源的文献关键词共现网络;(C) 人工智能技术挖掘发酵食品微生物资源的文献关键词共现网络。图中每个框代表一个独特关键词,圆圈大小表示关键词在文献中出现的频次,颜色从蓝到黄色的梯度对应时间演化(右下角)。(D) 2010–2025 年与多组学和发酵相关文献数量统计;(E) 2010–2025 年与机器学习和发酵相关文献数量统计。

图3 机器学习工作流程示意图。流程从文献和公共数据库的数据收集开始;收集的数据随后通过字段筛选、数据清洗和缺失值处理等步骤进行预处理。根据学习任务类型(监督学习、无监督学习或半监督学习),通过合适的标签编码和重采样方法处理标签信息。之后,利用多种机器学习算法构建模型。模型性能通过适当的评估指标进行评价,以衡量其有效性和泛化能力。训练完成的模型通过解释性分析评估特征重要性和贡献。最终,机器学习模型应用于分类、回归、聚类和降维等任务。

图4 常用机器学习算法及其在食品领域应用范围概览。通过检索食品相关文献中包含特定机器学习算法关键词的标题和摘要生成词云。词语的大小对应其在文献中出现的频次。

图5 基于机器学习与基因组规模代谢模型(GEMs)的发酵食品微生物资源挖掘。
(A) 机器学习可应用于基因序列数据,用于微生物物种分类和功能基因识别。
(B) 机器学习框架可用于单步与多步逆合成预测,实现微生物代谢通路的设计。
(C) 机器学习可利用全基因组数据和微生物共培养图像数据预测微生物之间的互作关系;此外,还可从文献摘要中提取关键词来确定微生物间的互作关系。
(D) 基因组规模代谢模型的构建通常从利用公共数据库中带注释的基因序列生成初始代谢网络开始;该模型随后通过整合多组学数据进行修正与优化。优化后的基因组规模代谢模型可用于预测微生物的生长速率、优化风味化合物的合成途径,并预测微生物群落的功能。
原文链接:https://doi.org/10.1016/j.tifs.2025.105450