译者朱先忠译审
本文由Provectus公司资深团队编写,旨在阐述如何融合机器学习基础设施、员工和流程,以实现适用于企业的MLOps(面向人工智能系统的运维管理)。对于旨在开发强大AI/ML项目的经理和主管,本文希望提供一定启示。
结合Provectus公司在AI技术不同发展阶段与多家客户成功合作的经验,本文深入探讨了AI/ML项目中人员的角色与分工。
随着项目的推进,单一的数据科学家已不足以高效地完成AI/ML项目。现代团队需要包含多角色、高绩效的成员,包括数据科学家、ML工程师以及项目经理等,且各自专注于各自的ML基础设施和MLOps部分。
数据科学家是整体理解数据及相关业务的专家,他们不仅进行数据挖掘和建模,还关注数据质量和偏差、实验及模型输出等。而ML工程师则拥有特定AI和ML应用的专业知识。
为确保项目的顺利进行及满足业务利益相关者的期望,团队中应有人具备MLOps专业知识。项目经理应接受ML和AI项目培训,以适应与传统项目不同的工作流程。
本文将详细探讨这些角色及其在ML基础设施、MLOps支持流程和ML交付方面的应用。强调了人工智能团队平衡组成的重要性,以实现MLOps并加速AI技术的采用。
除实际团队组成外,有效管理同样关键,需确保AI团队与ML基础设施和MLOps基础保持同步。
从管理角度看,结构应包括业务部门成员、传统软件工程师、DevOps专业人士、基础设施专家、数据科学家、数据工程师等角色。这些角色的协作对于避免部门孤岛等挑战至关重要。
若公司对ML工作流和AI项目管理的理解有限,可能导致项目界限不清、KPI管理不当,无法满足业务利益相关者的期望。企业需寻求具备适当技能和知识的团队来执行AI/ML项目。
在构建高效AI团队和MLOps基础设施时,需平衡人与工具的关系。需明确,简单的MLOps专家雇佣或平台购买并不能解决问题。真正的关键是强大基础设施与平衡人工智能团队的结合。
本文通过三层生态系统形象地展示了人工智能团队与MLOps基础设施之间的协同作用。从基础设施主干到共享和可重用资源层,再到独立于其他两层但由其启用的AI项目层,每一层都需相应角色的参与和管理。
如云端与安全专家确保基础设施的稳定性和安全性;DevOps专业人员负责自动化任务;ML工程师和MLOps专家则分别负责ML领域的专业知识和整个基础设施的融合。公民数据科学家可优先实施特定AI/ML项目,全栈工程师负责实现AI产品的常规软件部分,而受过ML培训的项目经理则负责产品的实施。
实现MLOps在企业中的落地需要时间和资源。关键在于理解MLOps与人员和流程的关系,如同它与实际技术的关系一样。将特定角色与机器学习基础设施的相应组件相匹配,将有助于简化问题。请记住:人员加基础设施等于MLOps的成功。
在Provectus公司,我们拥有丰富的经验,能够助力企业构建先进的AI/ML解决方案、培养高效AI团队,并为MLOps提供强大的基础设施支持。