複製鏈接
請複製以下鏈接發送給好友

PieDataComputing System

鎖定
PieDataComputing System [1]  (英文縮寫:πDataCS)是由拓數派 [2] 杭州拓數派科技發展有限公司,又稱“OpenPie”)於2023年10月24日 [3]  推出的大模型數據計算系統 [1]  ,以雲原生技術重構數據存儲和計算,一份存儲,多引擎數據計算 [2]  ,讓大模型技術全面賦能行業AI場景應用,為企業創造更大的商業價值 [3]  ,成為AI的基礎科技底座的同時,開啓AI技術的新範式 [2] 
中文名
大模型數據計算系統 [1] 
外文名
PieDataComputing System [1] 

PieDataComputing System產品詳情

PieDataComputing System一、計算引擎

PieCloudDB
πDataCS首款數據計算引擎PieCloudDB雲原生虛擬數倉,為企業提供全新基於雲數倉數字化解決方案,助力企業建立以數據資產為核心的競爭壁壘,以雲資源最優化配置實現無限數據計算可能。 [3] 
PieCloudDB產品概況
PieCloudDB,是以對行業數據庫的抽象思考和設計原則複用為技術路線,實現了分析型數據數倉上雲虛擬化 [11]  ,將物理數倉整合,根據數據授權動態創建虛擬數倉,按需靈活計算,打破數據孤島 [10]  ,支撐更大模型所需的數據和計算 [9]  。在雲上 [10]  ,數據計算資源按需擴縮容,提升數倉的敏捷性和彈性,助力企業降低數倉管理複雜度,實現數量級增加可計算數據空間的同時,數量級降低數倉成本,打開無限數據計算空間,推進AI/BI到下一個精度 [8] 
  • 降低數倉硬件和管理成本:物理數倉整合到雲原生數據計算平台,根據數據授權動態創建虛擬數倉,打破數據孤島,解決數據多副本問題,幫助企業降低數倉管理複雜度,以更低的成本實現存算資源在雲上更靈活的配置;
  • 提升數據計算資源利用效益:數據計算資源按需擴縮容,實現計算資源配置最優化,提升數倉的敏捷性和彈性,打開無限數據計算空間,支撐更大模型所需的數據和計算。更好地賦能業務發展並走向綠色;
  • 堅如磐石丨高安全、高在線、高可靠:TDE技術保證了所有數據在落盤前完成加密,服務器無感知技術(Serverless)利用雲上無限計算資源和彈性保證了虛擬數倉永遠在線可用,S3存儲和跨雲災備能力保證了永不丟數。 [7] 
PieCloudVector
πDataCS第二款向量雲原生量計算引擎PieCloudVector,大模型時代的分析型數據庫升維,助力多模態大模型AI應用 [4]  ,進一步實現海量向量數據存儲,向量數據高效查詢 [6]  ,支持和配合大模型的Embeddings,幫助基礎模型在場景AI的快速適配和二次開發 [3]  ,大模型應用必備 [6] 
PieCloudML
πDataCS第三款計算引擎PieCloudML,整合企業所有多模態數據資源,提供多模態大模型下數據計算支撐,更貼近數據科學家的需求和使用。 [5] 
  1. 計算和存儲彈性,全面兼容主流機器學習生態;
  2. 原生交互簡墨存儲,充分體現湖倉一體架構優勢;
  3. 提供探索性數據分析工具,使用筆記本進行交互式建模;
  4. 優化數據準備和ML建模過程,利用PySpark/Python、SparkR/R和Scala工具進行大規模數據預處理和模型訓練開發。 [5] 

PieDataComputing System二、自研存儲

JANM 「簡墨」
πDataCS的雲存儲底座 [12]  JANM 「簡墨」,打造多雲場景下高性能計算引擎的數據存儲底座,真正實現數據互通,一份數據,多引擎計算,為大模型數據計算系統雲存儲保駕護航。 [3] 
簡墨基於現代化的硬件和設施、雲原生的設計,致力於簡化大數據處理過程中的數據加載、讀取和計算的整個流程,並提供對數據的自適應治理、ACID 的事務支持等功能,保證絕對的數據安全,做到極致的性能優化,以完成各種場景下的數據計算和分析任務。 [13] 
核心功能:一份數據,多引擎計算 [12] 
  • 湖倉一體;
  • 更多文件格式支持;
  • 更高效的外部數據提取和加載;
  • 數據互通;
  • 流式數據處理;
  • 高性能的ACID事務支持;
  • 自適應數據管理;
  • CDC場景的支持;
  • 更多雲原生的Index支持。 [12] 
參考資料
展開全部 收起