今天小编分享的互联网经验:英博数科总经理周韡韡谈算力服务平台:英博数科汇集领先客户助推产业数字化转型,欢迎阅读。
2023 年 4 月 26 日,第六届数字中国建设峰会之 " 有福之州 对话未来——鼓楼论见 算力时代 " 论坛在福建福州举办。论坛由中共福州市鼓楼区委、鼓楼区人民政府主办,新华社国家重点实验室战略支持,福州市鼓楼区商务局、鸿博股份、北京英博数科科技有限公司和钛媒体协办。
英博数科总经理周韡韡表示,ChatGPT 是 AI 作为新一代生产力变革下的生产工具,就像现在每个企业都已经离不开互联网一样,不久的未来所有的企业都将完成数字化更新,英博数科作为一个新兴的公司敢于挑战 ChatGPT 和大模型训练的底气来自于自身算力的储备和在 GPU 云协同工具的开发部署,作为国内少有的提供专业 AI 训练的算力服务平台,在英博数科的智算平台上已经汇集了在国内外均处于行业领先地位的无人驾驶、大模型训练方面的客户,英博数科期待看到这些客户的落地应用尽快面世,让大家直接地感受到算力为产业赋能、数字化转型带来的加速和改变。
论坛现场,周韡韡还就算力发展对人工智能和每个人工作生活的影响等问题,与英博 ChatGPT 小 e 进行了对话,小 e 是与 OpenAI 同源、英博自行开发语料,利用北京 · AI 创新赋能中心的冗余算力训练而成的小参数 AIGC 聊天机器人,目前已经参与到英博数科的各类可行性研发报告整理、文案创作等工作中,并面向部分公共用户开放免费测试使用。
英博数科总经理周韡韡
以下是周韡韡演讲实录,略经钛媒体 APP 编辑:
各位嘉宾,各位行业大咖,大家上午好!我是英博数科 CEO,也是北京 AI 创新赋能中心的负责人周韡韡。首先在这里要感谢福州市鼓楼区区委、区政府,感谢这次大会给我们新兴企业这么好的展示平台和承办会议的机会,再次感谢各位领导的支持。
我们今天的主题是算力时代,算力是最近这个阶段在我们生活中高频出现的一个词语。究竟什么是算力?算力能给我们普通人的生产生活带来什么改变?我想并不是那么多人都能像展院长那样讲得如此清楚。于是带着这样的疑问,我希望今天借福州有福之州这块宝地,与英博数科的虚拟管培生小 e 聊一聊这个问题。
小 e 是英博数科在与 ChatGPT2.5 的同源环境下、使用了 Megatron 训练框架、利用我们北京 AI 创新赋能中心的冗余算力和自行研发的语料,去训练出来的一个算是小参数 AIGC 内容生成式的聊天机器人。前面这一串话或许很抽象,那我们不如现场直接请小 e 来介绍一下自己:
小 e 现场演示画面
这看似很简单的问题,其实是目前国内鉴定 ChatGPT 真伪的照妖镜,因为有很多企业只不过是接入了美国 OpenAI 的端口,就号称自己掌握了这个技术,所以聊天机器人在面临这样问题的时候,通常会回答我是 OpenAI,或者来自谷歌,但还好,我们小 e 知道它是来自英博数科的 AI 助理。看来对人类的终极问题 " 我是谁 " 的这个问题,小 e 回答的还 OK。
其实我们今天在这里,应该说是国内的第一场以现场直播,而不是录播的形式,来展示企业对 ChatGPT 研究的实际应用。
我们再问一下小 e 你怎么理解算力,怎么看待算力时代下英博数科的挑战与机遇。这个问题有一点长,而且这个问题里面有复合性以及一系列的叠加性的问题。我们来看一下小 e 的回答是什么样。
我们称 ChatGPT 叫做 AIGC 生成式,就是强调从训练的开始就使用深度学习和神经网络,像我们人一样,对同一个问题,多次的询问是可以给出多个答案的,这个是非常大区别于我们常见的智能客服。在此我们不如就这个问题再问她一次,看她是给一样还是不一样的答案。小 e,请问你如何理解算力时代下英博数科的挑战和机遇?
我们看到她给出了一个略有不同,但有很高相似度的答案,这说明我们的小 e 目前已经具备了一定的创造力,但肯定还存在继续训练和改进的空间的。因为时间关系,我们今天在这里对小 e 的展示就暂时到这个段落,在这次数字中国的主展区是有小 e 的展台的,感兴趣的朋友可以到展区与小 e 做更多直接的互动,我们也非常欢迎大家通过扫码的方式关注英博数科的公众号,在里面可以在后台去申请小 e 的免费测试帐号。
相信通过简单的展示大家就可以感受到为什么 ChatGPT 在当下如此的火爆。在过去二十年里,互联网从端到端的时代进入到移动互联网时代,再到现在元宇宙的时代,是涌现了大量优秀应用的,可是为什么这些应用不能像 ChatGPT 一样给我们带来如此高的关注度和震撼感?我觉得这里可以借用合作伙伴的一个描述:这个技术从出生之后到现在的 100 多天的时间里,几乎每天都在带来一个对自己革命性、颠覆性的更新提升,从来没有过任何一款应用能够像 ChatGPT 一样,给每个 C 端用户带来如此铺面而来的、直观的冲击力和震撼感受。
看过刚才小 e 的回答之后,我在这里也给大家分享下,小 e 已经是参与到英博数科目前很多的内容文案创作工作中,比如两周之前我们给另外一个福建当地政府提供的智算中心建设规划,在一周内 1 万多字的文案出了 5 个不同的版本,就是在小 e 的帮助下完成的,这对我们普通人类工作人员来讲的话会是一个很大的挑战。我们可以看到用自然语言方式与我们沟通的 AI 已经不再是工具属性,而更是一个陪伴属性。我们可以看到在不久的将来,这种访问链接一定是会被陪伴所取代,我们常见免费的广告一定是会被优质的付费内容所取代。有了 ChatGPT 之后,我们每个人就等于拥有了一个无处不在,而且是无所不知的随身助理,一个人加上一个 OpenAI 这样类型的 ChatGPT,就可以完成一个项目,甚至可以开办一个公司。这样的生产效率提升,可以说是又一场工业革命的开始。
当然,这样颠覆性技术的研发是有非常高的难度系数的,有多难?即使像脸书这样的企业,哪怕是努力再努力,投入了那么多人力和财力之后,似乎做出来的应用也不是那么理想。是什么样的原因能够给英博数科这样新型的公司有这种挑战大模型、挑战自然语言处理、挑战多模态的勇气和底气?应该是算力,是目前我们北京 AI 创新赋能中心是国内少有的可以提供专业 AI 训练,特别是针对大模型的 GPU 训练环境的公共算力服务平台。
其实在去年我们投建的时候是面临一个抉择的,究竟是选择数字基建先行还是选择应用的集成先行,在做选择过程中如果做数据基建势必面临非常重度的资金投资,如果是做集成则有可能是投资更轻,且带来的市场关注度也会更高。带着这个疑问,我与我们的顾问,也是刚刚的演讲嘉宾数字中国研究院的展院长做了一次沟通,他一句话就点醒了我,他说 " 如果算力不自由,则数据无意义,更多的应用就无法落地,无法产生 "。所以,当时我们就毫不犹豫选择了重度投资之路,先投建了北京 AI 创新赋能中心,现在不到一年时间回过头看,再由 ChatGPT 和大模型引爆市场对算力的渴求,尤其是对高端人工智能算力渴求的市场的当下,这个选择毫无疑问是非常的正确。而且算力的重要性也越来越被更多人所接受。在之前清华大学、浪潮,和国际上 IDC 研究院所推出的报告中,算力指数已经成为继 ChatGPT 指数之后另外一个全球公认对区網域经济发展的衡量指标,大家都认为在区網域经济中每一元钱对算力的投入可以带来 GDP 三到四元钱的增长,这也是为什么在最近数字中国建设规划中政府明确指出对于夯实算力基础设施以及算力基础设施建设的程度被列为各地方政府明确的业绩考核的指标,因为这一种通过市场化运营的算力是真正能够帮助到 AI 创新型企业的发展、真正助力到地区产业数字化转型的。根据我们这一次协办方钛媒体之前的媒体报道,我们国家在过去若干年,对算力和数据中心的市场投入超过 8 万亿,可是我们市场仍然面临着一个算力短缺的问题,这究竟是什么原因?因为在以往我们的算力大部分投建的数据中心都是以温冷数据的存调中心为主,就是我们常使用的贵州云、苹果云这样的平台,在这样的平台存储型的算力对 AI 当下的发展的满足程度非常的有限。应该说市场上的算力短缺是一个相对的概念,其实是指在 AI 上的算力短缺,这种短缺情况还在逐步加剧:市场上的算力需求是每三到四个月可以翻一倍的情况,而根据我们 AI 创新赋能中心平台上的实际反馈,我们的客户模型的规模几乎是每个月就会增长 3 到 4 倍的情况。
在这样的情况下,我们是要把之前的这些存储型的算力通过数据中心的更新改造变成更多可以直接转化成 AI 时代生产效率的算力。我们北京的 100P 算力在一期投建完成之后,短短的时间内已全部售罄,目前我们正在计划一个 30 到 40 倍的规模扩容,而且这一部分的算力,80% 以上现在都已经被售出了。
讲到这些的时候会有在座嘉宾好奇,算力需求如此火爆,你为什么还有冗余的算力去训练小 e?我觉得这个问题也是市场和很多调研机构在跟我们私下沟通的时候经常会问到的问题。这里可以向大家介绍我们接下来工作中的重中之重:我们即将推出的搏博云服务 ( BOB Cloud ) 的解决方案。算力需求是不会一直处于一个峰值状态的,就像在电力系统中,我们会对电力进行削峰填谷和平衡调度,这种方式在算力的服务上也同样适用。我们在这个阶段搏博云上首先要满足的是通过善用弹性计算,来进行一个对 GPU 的云调度,例如在一台 5P GPU 算力的伺服器上,就可以实现 56 个实例同时并行训练。在下一个阶段,根据我们了解到的大模型客户的一些痛点,这些大模型客户在面对 GPU 计算需求的时候会把任务放在不同的云平台上进行,比如放在阿里云一个模型,同时另外一个是放在亚马逊云的,这也是为了他们本身的项目安全。在这样的情况下,跨云的沟通成为了一个刚性的需求,而且人工智能的算力在进行 GPU 训练的时候也要面临大量的 CPU 对数据的清洗和管理的工作。在这个时候如何协同 CPU 和 GPU 的高效协同和训练效果,就成为我们客户的一个必须的刚性需求,这个也是我们接下来的搏博云需要解决的跨云沟通,和在 GPU 和 CPU 上协调训练的需求。
目前在北京 AI 创新赋能中心和搏博云的平台上,已经有包括例如自动驾驶、量化交易训练等这样的大模型训练,这些全球顶尖解决方案客户的入驻已经带来了大量实际应用。我们也特别期待通过我们对算力的扩容,通过我们加强自己的互動的能力,能够早日实现平台用户和更多创新型企业的算力自由,早日看到他们能出现对标工业时代像飞机、轮船、火车这样的跨时代的大模型应用的出现,早日真正实现我们国家企业的算力自由,也早日实现我们英博数科的企业梦想:汇聚全球顶尖科技,助力中国产业数字化转型。
以上是我的分享。谢谢各位!
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App