产品概述

联想大数据计算平台LeapHD实现海量数据存储和高性能计算。它基于Hadoop/Spark生态系统,并对复杂开源技术进行高度集成和性能优化。它具有功能丰富、使用简便、运行高效、稳定可靠等特点。

产品架构
产品特性
  • 向导式自动化的平台安装部署

  • 可视化、图形化、指标化监控

  • 丰富的用户组和角色权限管理

  • 丰富的数据查询功能, 全面支持Spark /Python功能, 完整支持SQL标准、支持存储过程

  • 自动调度, 智能化服务

  • 提供多种数据采集接口,包括:各种主流的关系型数据库如mysql、oracle等、第三方云平台、文本文件、HDFS文件等,并且在不断扩展中

  • 提供字段映射功能,可灵活配置迁移的源和目标之间的字段映射关系

  • 数据血缘关系为挖掘数据潜在价值提供手段

  • 扩展支持Spark HA,系统稳定性高

产品功能
  • 海量数据存储管理

    通过分布式文件系统,可将海量各类原始数据、结果数据进行快速存储。并通过自带副本机制,完成对数据的多份备份。

  • 灵活多样数据处理引擎

    通过批量计算、内存计算框架、流式计算框架、多维数据分析计算、图计算等多种技术支持多种应用,计算引擎实现“术业有专攻”。

  • 资源统一调配管理

    通过统一的资源调度技术,可实现底层硬件资源得共享。将共享的各类计算资源根据需要划分为多个逻辑运行单元,按需动态分配给不同负载的应用。实现一个集群支撑多套不同的应用运行,在提升集群设备资源利用率的同时,降低日常运维工作量。

  • 海量数据快速查询

    通过低成本的硬件提供高性能的数据加载、索引和查询。具备对海量数据快速查询响应能力。

  • 优化的分布式数据库

    面向结构化数据分析设计开发的,经过优化的MPP查询引擎,能够有效处理PB级别的数据量;性能超群TB数据秒级返回。

  • 任务调度

    拥有先进可靠的自动化任务管理调度功能,提供可操作的 web 图形化管理满足多种场景下各种复杂的定时任务、Cron 任务调度和任务执行生命周期管理。有较好的伸缩性和扩展性,提供业务日志记录器。支持节点监控、任务执行监控,支持暂停/恢复任务,以及终止运行中任务,支持在线配置调度任务入参和在线查看调度结果。提供海量任务的情况下,严格精确定时触发任务服务。

  • 数据资产

    基于元数据、主数据等重要元素,构建数据资产管理平台,实现数据资产定义、可视化等管理能力,数据安全提供数据访问权限管理、隐私策略管理、数据加解密,依托大数据平台实现数据全生命周期的管理,支持以价值挖掘为导向的数据应用开发。

  • 数据迁移

    支持关系型数据库、大数据(OLAP)等数据源间的数据迁移。致力海量数据迁移需求下,解决远距离、毫秒级异步数据传输难题。同时数据迁移轻松构建安全、可扩展、高可用的数据传输架构。

  • 系统运维监控

    系统运维监控中心提供产品套件的快速安装部署、集群性能监控、组件服务管理、系统告警分析、主机管理、版本管理、日志管理等计算平台运维监控服务。通过统一的图形化界面实现对大数据平台运行服务状况的实时监控和管理,实现运维的健康化、自动化、智能化,大大降低了人力成本的投入。

  • 系统高可用性

    结合各类分布式软件架构特性,通过引入HA热备方式,进一步提升系统的高可靠和高可用性。

应用场景
  • 企业了解所拥有的数据情况

  • 企业迁移大量结构及非结构话数据到大数据平台

  • 企业数据需要从外部云及系统迁移到内部

  • 数据分发及数据备份

  • 企业业务分析人员进行自助式灵活查询

  • 数据挖掘算法在大数据平台上运行

忘记密码?