今天小編分享的科技經驗:專訪柏睿數據董事長劉睿民:Data+AI智能算力底座将助力解決“千模時代”算力需求,歡迎閱讀。
7 月 7 日,柏睿數據董事長兼首席科學家劉睿民在世界人工智能大會中的區塊鏈 +WEB3 新發展論壇發表題為 " 分布式數據庫智能算力底座賦能金融 WEB3.0" 的演講,分享智能算力底座如何促進金融賦能實體經濟。
柏睿數據為國内目前僅看到的推出全内存分布式計算引擎的智能數據算力公司,目前已處于上市輔導階段。劉睿民是國内資深的數據庫研發領軍專家,自 2014 年開始成立團隊致力于研發國内首個大規模并行 MPP 内存數據倉庫引擎。後成功其中,以 MLOPS 為方法論的數據智能開發平台,包括 LLMOps 平台(大模型開發運維平台)、Rapids VectorDB(向量數據庫)等產品,覆蓋從數據采集、存儲、計算分析到模型訓練、部署、應用的全生命周期解決方案。近期,柏睿數據全球創新賦能中心在上海浦東新區授牌,也與多家海内外創新主體聯合組建國際 AI 創新聯合體。
劉睿民在接受藍鲸财經專訪時舉例,算力基座就相當于引擎,數據就像油,AI、web3 等訓練、推理、使用數據庫的框架都需要靠底層算力。柏睿數據自主研發打造的 Data+AI 智能算力底座,融合大數據、人工智能、數據計算加速加密等技術,能夠滿足產業智能下大規模的數據實時計算需求,并向雲端演進,讓算力不再成為 Web3.0 發展的瓶頸。
藍鲸财經:作為已經深耕分布式數據庫十年的企業,是否會覺得大眾對 AI、Web3 的關注将帶領行業迎來全盛年代?
劉睿民:現在所說的千模萬模,基本上都是在應用領網域,因為我們是做基礎領網域,所以說最後無論呈現模式是什麼,都要用同樣的東西,就是算力。
現在市場需求量的急速擴張,很多人的困擾是模型已經搭建好了,但無法進行訓練。我們其實是從國產的角度來做數據庫,我們主要研發大内存的全内存分布式計算引擎。當前算力的不足是一個關鍵問題,其中一項卡脖子的因素是英偉達的 A100H100 卡,由于禁運很多部門無法獲得這個昂貴的卡。而我們的全内存分布式計算引擎通過軟硬體協同打通,可以達到 196GB 的内存容量,相比之下,幾年前我們能夠實現單板達到 1TB 内存的規模。從行業角度來看,我們是國内目前僅看到的專注于全内存分布式計算引擎的公司,國外也只有五六家。國内的用戶往往在買 GPU 時會有各種限制,這也面臨一些問題。像英偉達等公司,首先推出的是一款爆款產品。這種產品可能價格較高,但随後會推出其他評級較低但價格更為實惠的產品版本。這些版本在性能方面可能達到原產品的六七成,但價格僅為原產品的十分之一。
因此,我們提供相對廉價的算力解決方案,直接利用内存進行訓練,創新解決算力問題。
藍鲸财經:柏睿數據推出的大模型開發運維平台 LLMOps 平台和其他產品如何助力 Web3.0 場景的落地?
劉睿民:LLMOps 平台賦能了應用端的開發階段,使用者無需從頭開始開發,而是可以借助平台提供的基礎底層,通過簡單的拖拉拽操作來建立大模型。這意味着用戶只需要很少的代碼就能完成模型的建立。目前,LLMOps 平台在海外的客戶中使用較多,因為海外客戶相對成熟一些。而國内客戶由于接觸國外平台的機會較少,所以對 LLMOps 的了解還不夠。在人工智能領網域,我們主要吸引了海外客戶的關注,比如新加坡的客戶。國内的用戶也對我們的產品感興趣,但由于國外資源相對不易獲取,所以在某種程度上有些滞後。
這方面目前主要客戶是國外的人工智能公司,國外人工貴,他們需要将人工智能應用落地到工業領網域中,比如機器人優化、港口調度等場景中的優化問題。過去,他們通常通過編寫代碼來實現這些優化場景,但現在情況不同了。他們可以在 LLMOps 平台上進行拖拉拽式建模和試算,然後部署到計算機集群上進行計算。他們可以選擇連接到不同的平台,如谷歌、AWS 或微軟的集群。對于這些客戶來說,LLMOps 的優勢在于低門檻的使用和加速功能的提供。
藍鲸财經:是否意味着未來高自動化、低代碼化的公司會越來越多,這将成為必然發展趨勢?
劉睿民:這是必然的。随着人工智能的發展,越來越多的任務和工作将被自動化取代,包括編寫簡單的代碼。這并不意味着復雜的編程工作将完全消失,但對于一般的程式員來說,未來可能會面臨挑戰。因此,自動化和低代碼的趨勢将成為主流,這是一種正常的發展過程。在未來的三到五年内,簡單的編程工作可能會變得相對無關緊要。
藍鲸财經:如何理解在 WEB3.0 特定應用場景中,"FPGA 計算引擎 + 配套軟體 " 如何提供比 SmartNIC、GPU 和 AI 大模型加速芯片等通用芯片更強大的專業計算能力?
劉睿民:舉例來說,GPU 的功能原本是用于打遊戲的,它的功能并非專為人工智能而設計,有段時間甚至被用來挖礦。這只是因為大家沒有一個芯片來運行更復雜的計算。無論後面的應用場景是什麼,通用的東西其實是雙精度運算,就是浮點運算。
我們現在把浮點運算的算法都放到了 FPDA 卡上,配上大内存,然後内存板和内存板之間的通訊,通過我們全内存的分布式計算引擎連接在一起,這樣的話用戶就能夠調動比如說 1TB 甚至幾個 TB 的内存。
在某種程度上,以後有一種專門運用于 AI 計算的芯片将成為必然。以前科學計算,尤其是超級計算中,開始使用了 GPU,并建立了一個完整的生态系統。後來,GPU 被應用于人工智能的訓練中,導致我們陷入了這樣一個循環。
所以,這是一個逐漸發展的過程,不是說有很多選擇可以做。事實上,在進行雙精度計算時,以前并沒有其他選擇,也沒有其他人在這個領網域有大量研究。現在雖然有了這樣的選擇,但限制還是很多。
藍鲸财經:柏睿數據對于數據隐私和安全方面有哪些保障措施和技術手段?
劉睿民:我們使用的是國密,技術路線類似于隐私計算,公司只有一個鎖芯,鑰匙是掌握在用戶手裡的。" 鎖芯 " 的安全性、穩定性越高," 鎖 " 就越安全,數據就越安全。RapidsDB 總體代碼自研率高達 99.32%,通過中國信通院、金融信創生态實驗室、國家密碼管理局商用密碼產品等多項國家級測試認證,并在運營商、金融、電力、政務、醫療等多個行業成功落地應用,安全性遙遙領先。