今天小编分享的互联网经验:大幅提升算力效率,「贝联珠贯」帮助客户降低云资源使用成本,欢迎阅读。
随着不少行业上云进入深水区,如何高效管理云资源已经成为新的议题。在海外,我们看到不少企业利用资源管理、监控工具帮企业降低云成本。反观国内,我们同样关注到一些企业希望打磨产品化能力,为企业级客户提供云降本增效方案。
36 氪日前接触到的、由前阿里 P10 技术专家毕玄创立的贝联珠贯就是其中一家。据悉,贝联珠贯公司已完成由红杉中国种子基金、元璟资本和舟轩股权投资的天使轮融资,正在启动新一轮融资。
毕玄告诉 36 氪,自己 2007 年加入阿里当时就从零开始构建了 HSF 中间件框架,至今该框架在淘宝和阿里仍然发挥着重要作用。2011 年,他主导阿里自主研发的 T4 容器,比 Docker 早了数年。之后,毕玄开始负责运维部门,设计并带领团队落地阿里电商的 " 异地多活 " 架构。经过三年的尝试和实践,他和团队推动阿里高可用技术的演进,从同城的双活、异地只读及冷备,最终实现了异地多活。随后,他还负责了阿里的集团级项目 " 统一调度 " 和 " 集团上云 " 项目。据介绍,14 年的阿里职业生涯里,毕玄曾获 19 年国家技术发明奖二等奖,CCF 杰出工程师等荣誉奖项。
谈及本次创业,毕玄表示,自己历经阿里巴巴集团的分布式架构改造、异地多活改造、统一资源调度和业务迁移到阿里云平台的四大阶段,并从中发现了适合当下的创业机会。
他介绍,自己创办的贝联珠贯公司希望进入整个算力大市场,也就是包括在线业务型算力(业务系统运行需要的虚拟机、容器,数据库等)、大数据型算力(离线分析型和在线分析型)、AI 型算力在内的算力市场,为企业客户提供降本增效的方案。毕玄介绍,作为初创公司,贝联珠贯在团队方面已经有约 50 位员工,以技术、产品为主。另为了推动商业化的进程,公司今年引入了前阿里云业务线销售总监——墨三(P9)担任公司市场和销售负责人。毕玄介绍,墨三在 ToB 业务产品销售方面经验丰富,曾在阿里云带领所负责业务线达成产品销售收入从 0 到超 10 亿元的业绩。
要帮助企业客户达成降本增效的目标,既需要理解业务,也需要具备深度工程化的能力。在过去多年的工作实践中,毕玄表示其和团队已具备将算力调度产品化的能力和经验,于是决定以降本为创业的切入口,帮助客户管理云资源。截至目前,贝联珠贯当前能够为客户提供三款軟體产品,分别是 LCC-Cost Explorer、LCC-Optimizer 和 LCC-Elastic Pool。毕玄也分别对这三款軟體产品进行了详细的介绍:
● LCC-Cost Explorer
这款軟體主要为客户提供账单关联、展示、对帐、优化等功能。
毕玄告诉 36 氪,大公司在云上通常以多账号的方式使用云,账号间不一定有直接关联关系,所以需要一个外部系统将不同账号的账单进行汇总归一。在提供统一的账单视图后,企业还需将这些花费的账单和对应被使用的产品、花费预算的团队进行关联分析,这同样是 LCC-CostExplorer 可解决的问题。
此外,对账通常是每个客户在给出云账单后的重点工作。而由于大客户通常和云厂商线下签订纸质合同,在和云运营系统进行线上对接时,可能会信息不一致,这将导致最终账单和实际签订的合同的优惠政策不一样,而一个中立的第三方的对账系统可以帮助避免这类事件。此外,毕玄还告诉 36 氪,这款产品还会针对整个账单进行优化空间分析,为企业提供提高 ROI 的建议。
● LCC-Optimizer
这款产品可以让用户更灵活动态地設定大数据、AI 资源使用参数。
毕玄介绍,大数据任务、AI 任务等通常由多人编写,在把任务提交给相应的引擎(例如 Hadoop、Spark、Clickhouse、Doris、Ray 等)运行时,都会给任务设定一些参数,但通常来说,这些参数和实际运行时想要达到的最好效果相比会出现一定偏差。而由于大数据任务、AI 任务的数量通常巨大,所以最终任务执行累积后的偏差会非常大,导致成算力资源的浪费、运行效率的降低。LCC-Optimizer 则会收集相关数据,对任务进行建模,并结合公司团队过往的实践经验,在任务提交给引擎前,进行一系列的参数调整,降低算力资源浪费,并提升任务运行效率。
● LCC-ElasticPool
这款产品能为用户提供更多的灵活算力。
毕玄告诉 36 氪,在大数据任务、AI 任务运行时,需要规划好运行这些任务的算力池资源来源。而云上比传统机房的优势在于可通过动态资源临时组装出所需要的算力池。他进一步解释,云对于不同类型的算力有不同的计价规则,例如 Spot Instance 相比包年包月的算力资源会便宜很多,若能有效的采用便宜的云算力资源,就可以大幅降低成本。
毕玄还介绍,除了充分采用云廉价资源外,还有一种免费的资源,就是每家公司固定持有的算力资源池。根据他的观察,通常这一资源池的利用率不会太高,通过混部技术可以充分使用这些资源池的空闲资源。
在产品效果上,LCC-ElasticPool 会根据相应任务对算力资源池的需求,按照混部、Spot Instance、Auto Scaler 的方式来动态的组装算力资源池,从而做做到费用低廉、效果可靠的双赢。
在部署方式上,他表示,以上三款軟體均可在传统 IDC、公共云和混合云的三种环境下使用。" 通常我们的軟體都可以在 2-3 天内完成部署,15 天左右开始看到效果,1 个月全部完成优化。" 毕玄总结。
此外,随着国内生成式 AI 的兴起,算力资源的优化也成为一个新话题。他表示,当前贝联珠贯也在布局专门针对 AI 的资源管理产品,预计年内上线。可以看出,要打造这类产品不仅需要技术能力,还要深度了解云市场中各个算力资源的情况,并且充分了解各种大数据、AI 任务的运行方式。对此,毕玄表示贝联珠贯会经常对产品进行各种测试,以发现、确定算力资源的变化。
而在以上三款軟體之外,公司还为客户提供了算力完全托管的贝联云服务,满足不同客户的差异化需求。
基于产品和服务,毕玄表示贝联珠贯今年开始商业化,客户覆盖零售、支付、金融、汽车等行业。毕玄总结,目前拥有 10 台以上大数据机器、使用开源大数据技术体系的公司,是公司的理想客户。在軟體产品的具体效果上,他表示目前公司为客户降低的算力成本均超过了 30%。而在一些资源量较大的客户处,贝联珠贯预计可帮降低上千万元云成本。在云服务方面,毕玄介绍贝联珠贯的云服务主要服务于中小客户群体,包括多家独角兽和准独角兽企业。在效果上,贝联珠贯的服务通常可在 1 个月内完成优化,降低的算力成本同样超过 30%,并帮企业省下相关的人力成本。
商业化落地是贝联珠贯今年的重点。毕玄告诉 36 氪,截至目前,公司收入已达数千万量级,其中大部分是产品收入,标杆客户包括滴滴、连连、头部新能源汽车、头部金融机构、零售品牌商等数十家公司。