由于乳酸菌的菌株特异性,传统的最佳发酵剂组合的实验筛选方法既费时又费力,为了应对这一挑战,该研究构建了一个计算机预测综合框架,用于预测362株德氏乳杆菌保加利亚亚种与嗜热链球菌(共计32761个不同组合)之间的相互作用。
该框架由两个独立的模型组成,第一个模型是基于KEGG数据的协同聚类预测模型,它通过应用三种不同的聚类算法来处理未标记的数据,并结合已知标签数据的分布来进行预测。
第二个模型是LbStIPred_SimLapRLS,这是一个基于k-mer分析数据和基因存在与缺失矩阵的拉普拉斯正则化最小二乘预测模型,该模型采用半监督学习策略,综合考虑了基因组成和代谢途径信息,通过拉普拉斯正则化最小二乘法来预测潜在的相互作用。这两个模型独立运行,分别生成预测结果,然后取交集作为最终的预测结果。
为了验证模型的预测性能,进行了发酵乳实验验证。从预测结果中随机选取正负组合进行发酵测试,实验结果显示模型的准确率为85%,表明所提出方法具备可靠的预测性能。同时,考虑了发酵剂的代谢相互作用,揭示了发酵过程中乳品发酵剂互利共生和协同作用的潜在机制,包括半胱氨酸、核黄素、磷壁酸和胞外多糖的生物合成等。
该框架由两个独立的模型组成,第一个模型是基于KEGG数据的协同聚类预测模型,它通过应用三种不同的聚类算法来处理未标记的数据,并结合已知标签数据的分布来进行预测。
第二个模型是LbStIPred_SimLapRLS,这是一个基于k-mer分析数据和基因存在与缺失矩阵的拉普拉斯正则化最小二乘预测模型,该模型采用半监督学习策略,综合考虑了基因组成和代谢途径信息,通过拉普拉斯正则化最小二乘法来预测潜在的相互作用。这两个模型独立运行,分别生成预测结果,然后取交集作为最终的预测结果。
为了验证模型的预测性能,进行了发酵乳实验验证。从预测结果中随机选取正负组合进行发酵测试,实验结果显示模型的准确率为85%,表明所提出方法具备可靠的预测性能。同时,考虑了发酵剂的代谢相互作用,揭示了发酵过程中乳品发酵剂互利共生和协同作用的潜在机制,包括半胱氨酸、核黄素、磷壁酸和胞外多糖的生物合成等。