今天小编分享的教育经验:没有专业 AI 团队,企业如何实现大模型驱动业务变革?,欢迎阅读。
作者 | InfoQ 数字化经纬
来源 | InfoQ 数字化经纬,管理智慧
咨询合作 | 13699120588
文章仅代表作者本人观点,图片来源于 pixabay
当下火热的大模型技术是人工智能领網域的重大变革,其巨大的应用潜力正在对各行各业带来深远的影响和冲击。如今,很多企业已经将生成式人工智能的深度应用作为未来战略的关键组成部分,意图通过 AI 技术重塑研发、流程、业务,助力企业发掘全新的市场与机遇。
然而,由于大模型技术诞生时间很短,其实践应用更处于早期探索阶段,因而要寻找对大模型有充分了解的技术和业务人才,搭建一支足以带领企业实现 AI 战略的团队对企业而言普遍是一大挑战。尤其对于缺乏前沿技术人才储备的传统企业而言,如何快速组建符合自身需求的 AI 团队,怎样平衡内部培养和外部招聘,不熟悉 AI 技术的人力资源部门怎样构建能力评估体系等问题都亟待解决。
AI 团队与 AI 能力建设
企业应如何設定 AI 相关岗位,他们的职责是什么?
李明宇:企业落地 AI 技术时普通是从 IT 部门开始导入,这一过程中如果依旧保持部门原来的岗位設定是没什么问题的,但某些岗位的职责会有所不同。例如产品经理、采购经理过去更关注整套设备、系统的采购,现在则更多要关注新技术如何推进业务的智能化,等等。
在此基础上更进一步,企业可能会从各个业务部门中选拔员工组成一个跨部门的虚拟部门,其中会有岗位负责拉通各个实体部门,收集各部门对 AI 的需求并与技术团队沟通对齐,类似 AI 架构师的角色。
李家贵:在企业的战略或管理层,一般由董事长或创始人、高管、CTO 来发起研究、培训和内外部交流,这样的角色可以称为 CAO。大型机构如银行甚至会成立一个 AI 专班,一般设在董事长、总经理办公室,进行一把手推动。
第二个层面是执行层。大型科技公司主要分为三类执行岗位,第一类是 AI 产品经理,他首先要负责做场景 POC,而不是像以前一样先做研发 POC。因为 AI 项目是有可能交付失败的,AI 有自己的能力边界,而且能力缺陷非常大,所以在做场景 POC 之前直接做研发落地可能会有巨大损失。产品验证可行后研发人员就会进场,这里涉及两种岗位:
一种是和大模型相关的微调、预训练等岗位,只有少量企业有能力設定;其他企业只需调用大模型的 API 即可,相关岗位需要深入理解大模型的局限性,然后负责基于大模型的应用开发。
另一种岗位是新的门类,就是大模型的数据类岗位。我们要提升数据的有效性、回答的准确性或减少模型幻觉有两种方法,第一种是微调,这里最困难的部分就是辨别高价值的问答;第二种是通过 RAG,这里又涉及数据的清理。这两种方式都需要数据岗位来负责。
陈秋丽:顺丰应用 AI 的时间很久,大模型技术兴起后我们主要考虑如何结合大模型来改善现有的 AI 能力。我们的团队配置并没有显著变化,例如负责引入 AI 技术的主要是业务和技术两类人员。
AI 落地过程中还有一个重要角色是业务解决方案,负责搭建业务与算法的桥梁,并设计 AI 的解决方案,沟通产品经理、测试、开发等角色。
另一个重要角色是数据分析,需要通过分析大量数据来判断解决方案是否可行,分析 POC 效果与问题原因,帮助方案迭代等。算法测试也是很重要的角色,大模型需要专门的测试人员,在上线前测试效果,不能等到上线后再收集客户反馈,这是同传统研发流程的一大区别。有时我们会专门設定这一岗位,有时会让数据分析员工来兼职。
在 AI 团队发展建设过程中遇到过哪些挑战?
李明宇:我们计算所的同学在 AI 研究方面都有比较深的积累,各自都有自己专精的领網域。但与企业合作开始落地大模型时就发现,大模型实践经常涉及很多研究领網域,例如用大模型做知识问答,和以前的知识图谱有哪些区别和联系?这类问题研发人员就不是很熟悉了。又如用大模型来生成軟體代码后如何测试?是用基于大模型的测试工具还是传统的工具?如果对测试不够了解,这时也会遇到障碍。我们的应对方法是从团队层面梳理出一个体系,找出推进大模型企业落地时在各个层面和环节需要具备哪些知识,大家找出自己的盲點,根据自己的情况再学习补充。
李家贵:首先,在 AI 时代,如果产品经理对 AI 大模型的基础原理不了解,基本上无法胜任 AI 产品的工作。反过来,研发工程师要懂场景,懂产品设计,懂体验,否则他的投入可能会付诸东流,所以他要学习场景 POC 的基础理论。产品和研发还要充分互动,才能找到 AI 大模型能够起效的高价值场景,否则就可能一事无成。其次,在大模型领網域大家普遍缺乏经验,尤其是实战经验。大模型的能力边界又不明显,只有亲身尝试才会发现具体有哪些问题,解决问题后企业的 AI 能力也会自然提升。总体看有两大挑战:第一是业务要懂 IT,产品要懂场景;第二是缺乏实战经验。
陈秋丽:团队管理者首先要对团队能力有清晰的预期和认知,其次招人时要明白完全符合要求的人选很难找到,所以在坚持招人标准时也要在面试过程中微调。并且团队找到一部分员工后,其他人选要遵循互补的思路来挑选,让团队成员更好地配合。我们还要鼓励员工在工作过程中横向扩展来积累经验。最后一点,虽然新技术迭代速度很快,但在企业场景里更新技术是要非常谨慎的,整个过程需要漫长的测试验证。所以管理者要平衡新技术的引用、成员的热情和积极性与落地的稳定性,这也是一个难点。不是所有新东西一出来就要立刻应用,但团队也要保持对新技术的持续探索。我们的团队就会有分工,一部分人会负责追踪和研究前沿成果。
高岩:企业落地 AI 能力过程中,遇到的第一个普遍痛点是大模型如何在业务场景落地,产生实际价值。这一过程中大家都想要了解同行的最佳实践,找出自身需要提升的能力,了解自己需要获得哪些帮助。第二个痛点是企业在大模型层面的技术能力不足,包括知识治理、数据治理、数据有效性等方面都会有难点。同时,企业员工的个人能力不足、业务流程调整、员工的抵触情绪与学习新知识过程中需要承担的压力都是问题。
这些问题体现在人才层面,就是业技复合型人才比较稀缺,例如金融行业的 AI 技术人员需要了解金融业务流程、风险特征等;制造行业的技术人员需要了解生产线运作、质检和产线优化等。传统企业在对外招聘这类优秀人才时还会遇到薪酬、地網域层面的很多限制,而在内部培养过程中又要付出大量资源来培训,在成本方面也有很大压力。
AI 人才培养策略和实践
企业如何培养既懂 AI 又懂应用场景的复合型人才?
李明宇:AI 大模型是比较新的技术门类,同具体业务的融合也没有普适的手段。例如我曾经做过医疗领網域的大模型落地,就遇到了模型验证时很难找到合适人员来验证模型水平的困境。找患者验证基本不可行,找行业专家验证,我们就需要很高水平的专家来把关,但这样的专家资源是非常稀缺的。这个例子就说明 AI 落地过程中,技术研发对业务的理解需要很深的程度,反过来业务对技术的了解也要有很高的水平,这都意味着很大的挑战。
所以从业务层面来看,业务人员需要对大模型技术的内核有深入的了解,知道怎样评估模型落地的效果。技术人员则需要深入到一线生产环节,比如说医疗领網域大模型的研发人员就要融入医生的工作环境,理解医生看病的过程,并在这一过程中自己对比模型生成的结果与医生的诊断,再去请教医生细节问题。通过这类方法,可以比较好地弥补业务和技术之间的鸿沟。而且大模型出现幻觉的几率是一定存在的,那么技术人员还要了解怎样的错误是业务侧不在乎的,哪些错误是业务侧不能容忍的,而不是只从概率的视角来看待这些幻觉问题。
李家贵:我提出了一个五级理论,将复合型人才分为五个层级。第一层叫 AI 知识,就是要了解大模型的技术原理。第二层叫 AI 见识,就是能够使用简单的生成式 AI 工具,有一定使用经验。第三层叫 AI 胆识,就是敢于使用 AI 工具来做成一些业务。第四层叫 AI 成识,就是用简单的 AI 工具来解决问题,拿到成果,例如用 AI 写代码、生成纪要等。第五层叫 AI 常识,就是将 AI 能力融入现有的工作和系统中。
陈秋丽:我们会在具体的项目与业务落地过程中培养 AI 复合型人才。我们的落地场景分为两类,一类是知识问答等场景,另一类是服务物流和供应链的场景。后者需要很多业务经验,所以在这类项目中我们会配备业务专家、AI 专家,设定一个共同的团队目标,然后在落地过程中大家互相了解学习、沟通帮助,就会逐渐培养出所需的人才。
我们公司内部除了传统的培训体系,还会有技术竞赛的安排,其中根据实际业务抽象一些题目给大家实战演练,让大家自己组建项目组参赛。参赛过程中我们会有专家帮助他们构建解决方案,通过竞赛的过程提升大家的能力。
高岩:我分享几个案例。第一个是我们为一个产业互联网公司做的 AI 大模型培训项目,重点是为十几名业务骨干培养对大模型的基础和发展趋势的认知,并进一步深化学习技术,掌握模型部署方法,再到 LangChain 项目的实践和智能体应用实战。通过这些体系化的内容学习和项目实战,以及后期的培养成效检验,客户开始在业务中构建 AI 模型,缩短产品迭代周期,提升产品质量,收获了很多价值。
第二个案例是我们同某集团合作的 AI 大模型实战项目,以赛训结合的方式落地。这家大型国企有 23 个业务单元,我们前期会整体进行体系化的培训,专注于 AI 办公提效的应用和大模型的开发技术。培养结束后我们分为两个赛道,一个赛道是办公层面的 AI 技术应用,不需要参赛者有编程背景,另一个赛道是大模型开发和应用产出,主要针对编程人员。这个项目是培训与竞赛深度结合的,比赛课题与客户的这些业务单元、业务场景高度关联。例如赛题涉及了基于 AI 大模型的招聘流程自动化系统、AI 员工助手、AI 安检、智能提单机器人等。
该项目落地后产出了很多有价值的课题成果,例如智慧购物车、知识库助手、多模态订单管理系统等。这些成果后续都在客户条线中得到了孵化,我们在孵化过程中也在持续提供针对性的培训辅助。这个项目的亮点就在于项目成果能够在赛后迅速转化为实际生产力,高效地促进新技术和集团各个分子公司的业务场景深度融合。同时 项目过程中又关联了业技复合型人才的培养,锤炼出一批精通业务逻辑,同时又掌握先进 AI 技术的复合型人才。客户在项目推进过程中的内部宣传也很到位,在企业 AI 文化建设方面有显著成果。
第三个案例是东风岚图 AI 大模型实战训练营。这个训练营主要面对客户内部数字化研发人员,包括数字化战略规划部、数字营销、SCM 与制造的精英学员。训练营是分阶段开展的,基础阶段旨在构建学员对 AI 的认知思维,拔高阶段和强化阶段分别提升 AI 的应用技术,并形成 AI 的场景化能力和产出。我们为传统的制造业企业所做的培训都是这样由浅入深,体系化地逐层更新知识能力。我们还会结合他们的本职工作和具体的业务场景,让学员有实际的产出,并将他们好的想法、创意纳入 AI 产品孵化的创意库。
再介绍一下我们 AI 人才培养的方法论。首先我们总结了一个 AI 人才粮仓模型。这个模型是极客时间与信通院泰尔终端实验室、北京银行、华润等二十多家企业和部門共同研究推出的。它将 AI 人才分为四层。顶层是 AI 思维管理人才,也是 AI 实践的领导者,他们需要具备战略眼光和 AI 理念,能够引领企业在 AI 上的发展方向,推动实际的变革。下一层是 AI 应用人才,也是 AI 应用的践行者他们需要精通 AI 技术与场景化应用,实现业务价值更新。他们也是 AI 业技复合型人才,负责将技术与业务结合在一起发挥价值。第三层是 AI 技术的赋能者,会精通模型构建、提示工程等技术,具备丰富的大模型开发落地经验。第四层是 AI 的技术领航者,主要关注构建和维护 AI 技术平台,同时掌握算法调优等能力。这类岗位包括了数据科学家、算法和数据工程师、前后端、测试、运维等角色。我们基于这个粮仓模型梳理了一些技能体系和对应的学习路径,以及针对不同类型人才的标准化训练营,覆盖线上线下的学习课程、赛训结合项目与实践课题等。
以大模型应用开发的训练营为例,第一阶段教授 AI 核心基础知识,第二阶段是 NLP 核心技术,第三阶段是大模型开发、微调的实战经验和技能,以及智能问答和 Agent 系统的开发、智能体开发与系统优化等。训练营設定了专家打磨过的前沿课程体系,也包含了利用 AI 技术为日常工作提效的内容,和面向 AI 领导者的发展趋势与战略等内容教学。我们也有分行业的 AI 场景应用课题,以及实践案例分享等等。
如何在 AI 项目落地过程中筛选、识别人才?有哪些手段可以激励员工成长为 AI 复合型人才?
李明宇:我们首先会观察员工在日常工作中是否会使用 AI。具体什么人愿意使用 AI,并不一定和他的技能水平、知识背景紧密关联,更多取决于他的性格特征。有些人更喜欢依赖确定性的工具或自己的思考,有些人就更喜欢同 AI 交流。另外由于这个领網域都属于创新业务,具体的工作内容、工作方法都是在业务开展中逐渐完善的,所以我们也会比较看重员工的自驱力、工作主动性这些,不能说领导安排什么就做什么。当然也要看基本素质和专业基础。
至于激励手段,我们的方法比较简单,就是 AI 相关岗位的薪资奖励会設定得高一些。最后要评估绩效时,具体的方法我们也在探索中。
陈秋丽:我们没有設定特别的激励手段,主要还是根据团队产出的成果来定绩效。另外关于 AI 的岗位在招聘薪资层面会有一些差异。
互动交流
现阶段企业是否会为 AI 人才成立专门部门?还是根据技术情况安排专岗专人?
陈秋丽:是否建立专门的团队取决于公司的战略投入情况。企业愿意投入多少成本、多少精力构建这样的团队,同他们对这个团队带来的价值的预期紧密相关,这是一个投入产出的问题。至于专岗专人一般是很难做到的,因为 AI 落地一般需要复合型技能,仅靠一个人很难实现目标,并且很多场景在团队成员招聘时很难提前考虑到,所以构建一个能够自我成长学习的团队比较重要。
企业当前没有 AI 团队时该如何组建?如何保证 AI 岗位的人效?
李明宇:大部分企业都多少会有涉及 AI 能力的部门,但要谈到基于生成式 AI 或大模型带来的全新能力进行业务赋能或创新,大部分企业都是在探索过程中。所以关于这样的团队组建、考评定级、绩效考核,这些事务也都是在探索阶段。一般来说企业还是根据具体的项目来组建团队,先确定场景,又有一定的积累,再根据具体的目标来遴选团队成员。而具体的团队形式和效能考评这些,目前还很难下一个定论。
李家贵:关于团队能否产生价值,可以分三个层面来考虑。
第一个层面是如何界定价值?这里要考虑你当前的业务有没有发展前景?当前业务有没有客群?有没有收入?有没有利润?如果这个业务没有利润没有收入,那么指望通过 AI 立刻改变局面是不现实的。所以一定是在主业比较强的前提下来谈人效。
第二个层面,组建团队时一定要寻找复合型人才,要既懂产品又懂研发,最好是全栈式技能,场景 POC、产品验证、数据测试都能搞定。
第三个层面,我们评价人效时主要看能不能通过引入 AI 能力,帮助其他团队减少人员或开支,产生更大收益,转化商业价值。
用 AI 辅助编程大概可以提升 30% 的效率,这是否是 AI 提效的成果?
李明宇:30% 的效率提升在领导眼中一定是提效成果,但这个数字和很多人的预期是不一样的。很多人觉得提升 100% 的效率都不算夸张,那么为什么实践中提升 30% 甚至十几个百分点都很常见?原因有二,其一是不同员工对 AI 的态度不一样,有的员工就不喜欢使用 AI,更喜欢手写代码,AI 对他们的帮助就很小,还有的员工手写代码能力弱,用 AI 辅助后效率提升就很明显。那么不同人的提升不一样,平均下来就可能是 30%。第二个原因,很多业务的部门设计上会涉及很多环节,例如軟體开发流程中代码编写只是其中一个环节,而 AI 加速的只是这么一两个部分,即使这一两个部分效率提升很大,对整体业务的影响也不会那么明显。
李家贵:行业内有两个指标衡量研发提效的效率,一个是 AI 的提交率,一个是代码的采纳率。采纳率在全行业来看可能只有 50% 到 60%,大企业也只能达到这个水平。提交率普遍是 20% 到 30%,比较卓越的企业能达到 30%,所以 30% 的效率提升已经是很好的数字。
陈秋丽:除了效率提升外,我们还要关注 AI 为员工节省下来的时间是否被充分利用起来,如果时间节约后员工只是闲了下来,对企业来说价值也不明显。