快!大数据平台来这体验;五代至强配星环向量数

 行业动态     |      2024-05-24 17:13

  1.单机可部署、开箱即用的大数据基础平台TDH社区开发版,三步带您来体验

  4.星环科技基于湖仓一体架构的新一代医院数据中心解决方案荣获工信部2023年中国赛宝信创优秀解决方案一等奖

  14.星环科技基于第五代英特尔®至强®可扩展处理器的分布式向量数据库解决方案重磅发布

  18.IoTDB企业版v1.3.0发布,新增内生机器学习框架AINode、权限模块全面升级等内容

  22.IDC首发中国生成式AI市场V1.0生态图谱,星环科技入围多个服务

  1.单机可部署、开箱即用的大数据基础平台TDH社区开发版,三步带您来体验

  星环科技TDH社区开发版,作为一款单机可部署、开箱即用的大数据基础平台产品,大幅降低了用户的资源成本和使用门槛。与此同时,TDH社区开发版兼顾此前TDH社区版(分布式)组件成熟、简单易用、易运维等特点,可以轻松、高效地完成科研教学、开发测试等数据分析需求。

  TDH社区版一站式的满足了用户低成本构建数据仓库,OLAP分析等需求,社区开发版更是进一步地降低了用户的开发门槛,无论是开发人员还是科研人员,均可借助社区开发版快速享受到大数据技术所带来的技术红利。

  大数据分析平台逐渐由产品态转向集成态,行业边界模糊。在技术架构上,主要包含数据采集与存储、计算、分析与决策三个层级。在OLAP之上融合了深度学习等技术,在提升数据分析深度和广度的同时,也极大增加了数据服务在业务侧的低门槛和友好性,满足用户运用数据分析驱动业务发展的需求。

  市场情况:尽管行业边界泛化,市场参与者众多,但按照部署模式、架构分类及能力补给,可分为以下五类:1)以云上数据湖方案为主的公有云厂商;2)以本地化大数据分析平台为主的传统软件服务商;3)提供轻量化数仓架构的数据库/数仓厂商;4)为数据应用层提供服务能力的软件供应商;5)提升数据应用能力的人工智能厂商。行业市场整体呈现竞合状态。

  架构选型:搭建平台前用户首先需要明确自身的数据体量和业务场景需求。在明确大数据分析平台需要具备的基本功能后,再决定平台搭建过程中使用的大数据处理框架和工具。在分层架构中,数据分析层的组件选型和整体搭建十分关键,尤其是存储引擎的选型直接决定了离线、在线、实时三大场景的支撑和算力效率的高低。

  趋势洞察:传统架构下的湖仓分体引发数据孤岛,造成实施、运维和成本问题。湖仓一体架构在数据和查询层面形成一体化架构,突破实时性和并发度、集群规模受限、非结构化数据无法整合、建模路径冗长、数据一致性弱等瓶颈。同时,平台融合AI 自主学习和自适应能力,增强用数人员的分析和决策能力。

  近日,TPC Benchmark Express-BigBench(简称TPCx-BB)更新了最新的世界排名,星环科技大数据基础平台TDH在性能和性价比两个维度上均获得了TPCx-BB SF3000全球排名第一。TDH此次成功打榜并登顶大数据测试基准TPCx-BB,代表着国产大数据平台在全球大数据领域的又一次突破,也意味着星环科技TDH对Hadoop体系大数据平台(CDH为代表)具有高兼容性,能够实现国产化平滑替代,帮助用户打造高性能、低成本、自主可控的数字底座。

  星环科技大数据基础平台TDH在2018年成为全球首个通过数据库领域难度最高的基准测试TPC-DS及官方审计的产品,标志着星环科技在分布式数据库领域的技术能力处于世界顶尖水平。

  TPCx-BB是衡量基于Hadoop的大数据系统的性能基准测试,以SF3000为例,在过去的纪录中打榜的基本都是CDH和HDP等Hadoop发行版产品,星环科技TDH此次跑通TPCx-BB并成为全球第一,表明其对CDH、HDP等具有高度兼容性。TDH基础存储和计算组件兼容CDH/HDP,迁移成本低,同时提供便捷的迁移工具,实现数据一键迁移。目前,TDH已有大量成功替换CDH/HDP案例。

  4.星环科技基于湖仓一体架构的新一代医院数据中心解决方案荣获工信部2023年中国赛宝信创优秀解决方案一等奖

  近日,由工业和信息化部电子第五研究所等单位联合主办的“2023中国赛宝信息技术应用创新优秀解决方案征集活动决赛”颁奖仪式在海口举行。星环科技基于湖仓一体架构的新一代医院数据中心解决方案荣获“应用创新示范方向一等奖”。

  2023中国赛宝信息技术应用创新优秀解决方案征集活动旨在全国范围内遴选出一批技术水平先进、综合服务保障性强的典型解决方案,为行业用户提供产品选型和解决方案参考,推动信息技术应用创新产业发展。

  星环科技此次获奖的基于湖仓一体架构的新一代医院数据中心解决方案,旨在汇聚医院各条线业务系统的全量数据,通过统一多模融合数据库架构打造全院级大数据底座,助力医院建设临床/运营/科研数据中心,带来覆盖全场景的一体化数据存储、开发、分析、服务体验。

  为贯彻落实党中央、国务院决策部署,发挥数据要素乘数效应,赋能经济社会发展,我们研究起草了《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》,现向社会公开征求意见。

  计划提出,到2026年底,数据要素应用场景广度和深度大幅拓展,在经济发展领域数据要素乘数效应得到显现,打造300个以上示范性强、显示度高、带动性广的典型应用场景,产品和服务质量效益实现明显提升,涌现出一批成效明显的数据要素应用示范地区,培育一批创新能力强、市场影响力大的数据商和第三方专业服务机构,数据产业年均增速超过20%,数据交易规模增长1倍,场内交易规模大幅提升,推动数据要素价值创造的新业态成为经济增长新动力,数据赋能经济提质增效作用更加凸显,成为高质量发展的重要驱动力量。

  近日,北京数元灵科技有限公司(简称“数元灵”)旗下 LakeInsight 云原生湖仓实时数据开发平台正式上架 KubeSphere Marketplace!

  LakeInsight 是企业级一站式实时数据分析和 AI 开发平台,基于数元灵自研开源湖仓一体框架 LakeSoul 和云原生容器化架构,提供多源数据实时集成、实时数仓建模、BI 指标报表平台和 AI 开发平台,实现 Data + AI 一体化。

  数元灵率先发布了 LakeInsight 湖仓实时数据开发版,支持配置数据源,数据入湖/出湖功能;提供交互式 SQL 数据分析,任务发布功能提供计算作业资源监控;支持多租户权限隔离等功能。

  用户可以通过 KubeSphere Marketplace 订阅部署 LakeInsight 湖仓实时数据开发版,快速为 KubeSphere 平台添加数据湖仓功能。部署完成之后,平台管理员可在 KubeSphere 导航栏直接进入数元灵数据智能平台,来进行数据源添加,数据入湖,数据分析,任务管理等操作,也可以添加企业内用户的登录权限,并通过对接 KubeSphere 不同权限级别的用户,来实现数据智能平台的权限隔离。

  Dremio 是一个简单且开放的数据湖仓一体,它正在为 Microsoft Azure 推出 Dremio Cloud 的公共预览版,该云是分析工作负载快速且可扩展的查询性能的推动者。SaaS 解决方案基于 Apache Arrow 的列式基础构建,将自助式分析与数据仓库功能和数据湖敏捷性相结合,以推动数据价值并降低总体成本。

  下一代合规、安全和风险管理自动化提供商 Qmulos 发布了该公司的两个旗舰技术平台 Q-Compliance V4.4.0 和 Q-Audit V3.7.0,增加了工作流和工单功能。

  据该公司称,这两款产品的最新版本都为组织特定的安全和合规调查、升级和批准提供了可定制的流程。

  凭借这些新的创新功能,Qmulos正在兑现其承诺,即提供实时、数据驱动的合规自动化和审计解决方案,以满足公共和私营部门组织的独特需求。

  Compliance V4.4.0 引入了可定制的系统授权工作流程,即风险管理框架 (RMF) 的第 5 步,旨在为组织提供简化的授权请求和批准,以实现其持续运营授权 (CATO) 流程。

  Qmulos增加了配置直观工作流程、自动化审批流程和维护全面审计跟踪的功能,从而简化了授权流程并提高了运营效率。据该公司称,可定制的系统授权流程使组织能够在强大的安全性和运营敏捷性之间取得微调的平衡,确保对不断变化的网络威胁进行弹性防御。

  Audit V3.7.0 通过无缝的工单工作流程提升了警报功能,使组织能够获得实时见解和可操作的步骤,以加强对内部威胁和其他恶意活动的防御。

  Flink CDC 是基于数据库日志 CDC(Change Data Capture)技术的实时数据集成框架,支持了全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等高级特性。配合 Flink 优秀的管道能力和丰富的上下游生态,Flink CDC 可以高效实现海量数据的实时集成。Flink CDC 社区发展迅速,在开源的三年时间里,社区已经吸引了 111 位贡献者,培养了 8 位 Maintainer,社区钉钉用户群超过 9800 人。

  浪潮集团权属企业浪潮卓数大数据产业发展有限公司(以下简称浪潮卓数大数据)在济南浪潮科技园举行融资签约仪式,正式宣告完成A轮融资。

  浪潮卓数大数据作为国内领先的综合型大数据服务运营商,致力于打造领先的大数据底座,着力挖掘数据要素价值、探索数据应用与运营的新模式,积极推动数据要素市场建设,在宏观经济数据服务、基层数据治理、企业征信服务等业务领域取得了较好成绩。2021年以来,浪潮卓数大数据连续三年营收复合增长率139%,稳居中国大数据市场排名前五。

  凭借领先的技术实力、完善的产品体系和巨大的发展潜力,浪潮卓数大数据获得吉富创投、交通基金、铁路基金、华宸资本、青岛上合、浪潮资本等6家投资机构共计亿元的投资。

  安奈儿发布一则收购公告称,公司拟以现金4.4亿元收购深圳创新科技术有限公司(以下简称“创新科”)22%的股权。收购完成后,创新科将成为公司的参股公司。

  同时,公司还公告,旗下全资子公司深圳市安奈儿科技有限公司将以代理商身份,分别与下家河南广电传媒控股集团数字产业投资有限公司(简称“河南传媒数字”)和上家创新科签署采购建设算力平台所需设备与软件的合同,采购合同金额分别为9746.53万元和8771.88万元。

  创新科技术是一家大数据存储系统提供商,以大数据存储系统为基础,集数据中心、云服务和大数据服务为一体,可为用户提供云计算和大数据解决方案。

  能够安全地共享和协作第一方数据是现代企业数据分析的基本要求。但许多组织需要更进一步,与合作伙伴协作处理数据,同时严格控制谁可以看到这些信息,以确保遵守法规、隐私、安全和其他要求。

  这一现实推动了数据洁净室的兴起,它使多个公司或单个公司的部门能够合并或共享数据以进行联合分析,同时保持用户定义的限制,以保持数据主权、私密性和安全性。在广告领域,数据洁净室使营销人员能够提高活动绩效,同时提供身份和测量,媒体公司采用基于隐私的方法来增加收入。

  这种合作伙伴使用其数据进行协作的动态开始蔓延到其他行业。例如,在零售/CPG、金融服务和医疗保健领域,数据洁净室可以让组织通过更个性化的产品为客户提供更好的结果,或者通过能够更快地将新药推向市场来提供更好的患者护理。借助数据洁净室,组织还可以通过开辟安全数据协作的新途径来进一步实现数据货币化。

  Snowflake是构建数据洁净室的基础,近日宣布投资 Samooha,这是一个多行业洁净室解决方案,它提供的工具使企业能够使用预定义的、高度可定制的模板设计和部署数据洁净室。Samooha 建立在 Snowflake 数据云之上,这意味着客户可以直接在数据源处部署洁净室,而无需移动数据。Samooha的产品,作为多行业洁净室产品,是一种独特的方法,与主要行业类别的新兴机会相一致。Samooha 正在使企业内部和企业之间都可以安全地共享数据,确保消费者数据隐私,同时能够利用这些见解实现业务价值。

  Clearlake 和 Insight 提供的 44 亿美元比 Alteryx 在出售意图曝光之前最后一次未受影响的市值溢价49%。该报价为每股48.25美元,也比该公司股票周五收盘价高出29%。

  Alteryx 提供了一个分析平台,组织可以使用它来扫描其业务数据以获得有用的见解。该公司于 2006 年推出了该平台,并在大约十年后上市,当时约有 2,300 名客户使用其软件。如今,Alteryx 拥有 8,000 多家客户,包括 IBM 、Salesforce 和其他主要科技公司。

  将原始业务记录转换为可用信息的过程包括多达数十个不同的任务。Alteryx 平台的价值主张是,它在一个单一的集成产品中为其中许多任务提供了工具,避免了数据科学团队使用大量不同的分析产品的需求,从而可以简化工作。

  与许多其他企业软件公司一样,Alteryx在过去几个季度中一直在增强其人工智能功能。今年5月,它推出了一种生成式人工智能工具,可以自动执行任务,例如将数据分析项目的结果转化为报告。它还提供了一些功能,旨在简化构建自定义神经网络的过程。

  14.星环科技基于第五代英特尔®至强®可扩展处理器的分布式向量数据库解决方案重磅发布

  2023 英特尔新品发布会暨 AI 技术创新派对上,星环科技基于第五代英特尔®至强®可扩展处理器的Transwarp Hippo分布式向量数据库解决方案重磅发布。该方案利用第五代英特尔®至强®可扩展处理器带来的强大算力,实现了约 2 倍的代际性能提升,可有效满足大模型时代海量、高维向量的存储和计算需求,能够帮助企业更好地应对大模型时代海量、多维向量数据的高并发和实时计算等挑战。

  星环科技分布式向量数据库 Transwarp Hippo 作为一款企业级云原生分布式向量数据库,基于分布式特性,可以对文档、图片、音视频等多源、海量数据转化后的多维向量进行统一存储和管理,能够通过水平扩展架构,充分发挥并行检索能力,实现毫秒级高性能数据检索,结合相似度检索等技术,帮助用户快速挖掘数据价值。

  TuGraph开源高性能原生图存储系统CStore。CStore已在蚂蚁集团内部具备多年大规模生产化经验。目前,CStore系统已全部开源到TuGraph Analytics仓库(geaflow-cstore模块),未来我们将不断迭代升级,提升系统性能。也非常欢迎图计算和图存储的开发者一起参与进来,共同推进CStore的开源和演进。

  CStore是一款专门为图分析场景而设计的原生图存储引擎,它采用了Rust语言编写,使用基于图的存储结构,针对图分析场景进行特定优化。CStore可以存储包含千亿级点和万亿级边的图数据,在蚂蚁集团内部的多场景使用中,已经积累了多年的经验,存储容量达到了PB级别。

  Franz是人工智能 (AI) 的早期创新者,也是实体事件知识图谱解决方案图数据库技术的领先供应商,正在推出 AllegroGraph 8.0,这是一个神经符号 AI 平台,将大型语言模型 (LLM) 组件直接整合到 SPARQL 中,以及向量生成和向量存储,以实现全面的 AI 知识图谱解决方案。

  据该公司称,AllegroGraph 8.0 重新定义了知识图谱的创建方式,并扩展了 AI 在市场上最安全的三重存储数据库中可以实现的目标的界限。

  作为首个神经符号 AI 平台,AllegroGraph 8.0 将机器学习(统计AI)与知识和推理(符号 AI)功能相结合。这种强大的组合使 AllegroGraph 能够用更少的数据解决需要推理和高效学习的复杂问题,从而扩展了在各种任务中的适用性。AllegroGraph 8.0 中机器学习和推理的融合也产生了人类可以理解和解释的决策,这是 AI 发展的重要一步。

  这款新产品利用与Oracle 零停机迁移的兼容性以及与本地部署 Oracle 数据库和 Oracle Exadata 部署的一致性,促进了 Oracle 数据库快速迁移到云。此外,客户还可以使用 OCI 和 Azure 技术构建新的云原生应用。

  Oracle 将于 2024 年扩展到美国以外的地区,包括德国中部、澳大利亚东部、法国中部、加拿大中部、巴西南部、日本东部、英国南部、美国中部和美国中南部。

  18.IoTDB企业版v1.3.0发布,新增内生机器学习框架AINode、权限模块全面升级等内容

  IoTDB 企业版 v1.3.0 版本正式发布!V1.3.0 是 IoTDB 企业版在产品迭代中的一次较大的版本升级,本版本发布了全新内生机器学习框架 AINode,全面升级权限模块支持序列粒度授予权限,并对视图、流处理等功能进行诸多细节优化,进一步提升了产品的使用易用度,并增强了版本稳定性和各方面性能。

  AINode是 IoTDB在ConfigNode、DataNode 后提供的第三种内生节点,该节点通过与 IoTDB 集群的 DataNode、ConfigNode 的交互,扩展了对时间序列进行机器学习分析的能力,支持从外部引入已有机器学习模型进行注册,并使用注册的模型在指定时序数据上通过简单 SQL 语句完成时序分析任务的过程,将模型的创建、管理及推理融合在数据库引擎中。目前已提供常见时序分析场景(例如时序预测、异常检测等)的机器学习算法或自研模型。

  MariaDB plc(纽约证券交易所代码:MRDB)宣布,已将其 SkySQL 业务分拆,成立SkySQL 公司,一家由前 MariaDB 团队创立的新独立实体,负责构建和支持 SkySQL 产品。

  新公司SkySQL将承担 SkySQL DBaaS 的开发、销售和支持。MariaDB plc客户成功副总裁Kurt Haberkamp表示:“我们相信,此次分拆将促进依赖SkySQL的客户顺利过渡,我们很高兴SkySQL产品将在一家新公司的领导下继续发展,同时使我们能够将精力集中在我们的核心MariaDB Enterprise Server产品上。

  日前,隐私计算联盟发布了《隐私计算应用研究报告(2023年)》及《可信数据流通网络 (TDN) 白皮书(2023年)》,星环科技作为联盟初创成员单位,深度参与了两项成果的编著工作,对隐私计算在数据流通平台的应用分析、隐私计算应用面临的问题与挑战、隐私计算应用如何演变以适配数据要素新形势、数据可信流通的基本原则、技术分类、应用模式等方面提出了自身的技术观点。

  使用 AMB Access Polygon,开发人员可以无服务器访问标准远程过程调用 (RPC),以执行常见操作,例如提交事务、部署合约、读取事务数据和跟踪事务。

  22.IDC首发中国生成式AI市场V1.0生态图谱,星环科技入围多个服务

  IDC近日发布了《IDC Market Glance: 中国生成式AI市场概览》(Doc #: CHC51406723)报告,报告分析了当前市场的整体情况以及市场格局,通过中国生成式AI市场生态图谱V1.0和代表厂商分析,旨在为生成式AI的未来发展提供参考。

  场景应用层:面向生产效率提升、业务、行业搭建的应用,例如文本生成、图像生成、音频生成、视频生成、数字人等。

  从工业和信息化部赛迪研究院获悉,今年,我国生成式人工智能市场规模有望突破10万亿元。生成式人工智能正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。

  数据显示,今年,我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。在制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均取得较快增长。

  专家预测,2035年生成式人工智能有望为全球贡献近90万亿元的经济价值,其中我国将突破30万亿元,占比超过四成。

  Meta 推出了 Purple Llama,这是一个致力于为开发人员创建开源工具的项目,用于在生成式 AI 模型公开使用之前对其进行评估和提高可信度和安全性。

  Meta 强调需要共同努力确保人工智能安全,并指出人工智能挑战不能孤立地解决。该公司表示,Purple Llama 的目标是为开发更安全的 genAI 建立一个共享基础,因为人们对大型语言模型和其他 AI 技术的担忧越来越大。

  通过Purple Lama发布的第一套工具包括CyberSecEval,它评估人工智能生成软件中的网络安全风险。它具有一个语言模型,可以识别不适当或有害的文本,包括对暴力或非法活动的讨论。开发人员可以使用 CyberSecEval 来测试他们的 AI 模型是否容易创建不安全的代码或帮助网络攻击。Meta 的研究发现,大型语言模型通常建议易受攻击的代码,这凸显了持续测试和改进对 AI 安全性的重要性。

  Llama Guard 是该套件中的另一个工具,这是一个经过训练的大型语言模型,用于识别潜在的有害或冒犯性语言。开发人员可以使用 Llama Guard 来测试他们的模型是否生成或接受不安全的内容,从而帮助过滤掉可能导致不适当输出的提示。