Hadoop

将Hadoop迁移到云端：存储容量翻倍，运维成本降低

一面是一家专注于数字商务数据分析的领先人工智能驱动数据分析服务商。我们提供关于商业战略、产品开发及数字商务运营的实时洞察。众多客户中，不乏个人护理、美妆、食品饮…

July 14, 2024

教程
如何使用变更数据捕获（Change Data Capture）与Apache Kafka和ScyllaDB

在本期ScyllaDB大学提供的实践实验室中，您将学习如何运用ScyllaDB CDC源连接器，将ScyllaDB集群中各表的行级变更事件推送至Kafka服务器…

July 14, 2024

教程
从Hadoop到云：大数据平台中存储与计算解耦的原因及方法

Apache Hadoop分布式文件系统(HDFS)的出现，彻底改变了企业数据的存储、处理和分析方式，极大地推动了大数据的发展，并对整个行业带来了革命性的变革。…

July 12, 2024

教程
为传统行业构建数据仓库

这是某房地产巨头数字化转型的一部分。出于保密考虑，我不会透露任何业务数据，但您将深入了解我们的数据仓库及优化策略。现在让我们开始吧。架构从逻辑上，我们的数…

July 11, 2024

教程
五分钟快速上手Trino与Alluxio

Trino是一个开源的分布式SQL查询引擎，旨在查询分布在一种或多种异构数据源上的大型数据集。Trino被设计用来处理大量数据的数据仓库、ETL和交互式分析，并…

July 11, 2024

教程
使用Memphis和Apache Spark进行有状态流处理

亚马逊简单存储服务（S3）是亚马逊网络服务（AWS）提供的一项高度可扩展、持久且安全的对象存储服务。S3使企业能够通过利用其企业级服务，在网络上存储和检索任意数…

June 30, 2024

教程