Apache

FlinkCEP로 이벤트 스트림의 패턴 감지

버튼이 눌렸을 때, 센서가 온도 변화를 감지했을 때 또는 트랜잭션이 흐를 때 이를 이벤트라고 부릅니다. 이벤트는 응용 프로그램에 중요한 동작 또는 상태 변경입니다. 이벤트 스트림 처리(ESP)는 데이터를 실시간으로 시스템을 통과하는 대로 스트리밍하는 방법이나 기술을 가리킵니다. ESP의 주요 목표는 데이터가 도착하면서 데이터에 대해 조치를 취하는 것에 중점을 두는 것입니다. 이를 통해 실시간 분석과 조치가 가능해지며, 저지연 응답이 필요한 사기 탐지, 모니터링 및 자동 의사 결정 시스템 등의 시나리오에서 중요합니다. 패턴은 ESP에서 중요한 연속 또는 행동을 식별하는 데 도움이 되기 때문에 ESP에서…

April 4, 2025

튜토리얼
Kafka 기반 워크로드 확장을 위한 최상의 방법

아파치 카프카는 대량 이벤트를 실시간으로 처리하는 능력으로 유명합니다. 그러나 수백만 개의 이벤트를 처리하기 위해서는 Kafka 프로듀서 서비스와 컨슈머 서비스를 구현할 때 특정한 모범 사례를 따를 필요가 있습니다. 시작하기 전에Kafka를 사용하기전에, 언제 Kafka를 사용해야 하는지 이해해봅시다: 대량 이벤트 스트림. 애플리케이션/서비스가 사용자 활동 이벤트, 웹사이트 클릭 이벤트, 센서 데이터 이벤트, 로깅 이벤트 또는 주식 시장 업데이트와 같이 지속적인 이벤트 스트림을 생성할 때, Kafka의 대량 처리 및 낮은 대기 시간 능력이 매우 유용합니다. 실시간 분석. Kafka는 특히 실시간 데이터 처리 파이프라인을 구축하는 데…

April 4, 2025

튜토리얼
현대 데이터 레이크를 위한 아파치 아이스버그의 주요 5가지 특징

빅 데이터는 2000년대 후반에 처음 등장한 이후 크게 발전해 왔습니다. 많은 조직이 빠르게 이 추세에 적응하여 Apache Hadoop과 같은 오픈 소스 도구를 사용하여 빅 데이터 플랫폼을 구축했습니다. 이후 이러한 기업들은 빠르게 변화하는 데이터 처리 요구 사항을 관리하는 데 어려움을 겪기 시작했습니다. 2010년대 초반에 대형 분산 시스템을 설계하는 동안 대형 기술 기업과 의료 고객을 위해 비슷한 도전에 직면했습니다. 일부 산업은 은행, 금융 및 의료 규정을 준수하기 위해 이러한 기능이 필요합니다. Netflix와 같은 고도로 데이터 중심적인 기업들도 비슷한 어려움을 겪었습니다. 그들은 “아이스버그”라는…

January 11, 2025

튜토리얼
데이터 파이프라인 보호: 토픽 및 구성 백업으로 아파치 카프카 장애 예방하기

아파치 카프카 장애는 카프카 클러스터 또는 그 일부 구성 요소가 실패하여 서비스의 중단 또는 저하가 발생할 때 발생합니다. 카프카는 고처리량 및 내고장성 데이터 스트리밍 및 메시징을 처리하도록 설계되었지만, 인프라 장애, 잘못된 구성, 운영 문제 등 여러 이유로 실패할 수 있습니다.장애 발생 이유 카프카 장애 발생 이유 브로커 장애 과도한 데이터 부하 또는 과다한 하드웨어로 브로커가 응답하지 않게 되는 경우, 하드 드라이브 충돌로 인한 하드웨어 장애, 메모리 고갈 또는 브로커 네트워크 문제 등이 있을 수 있습니다. 증발자 문제 카프카는 클러스터 메타데이터…

December 2, 2024

튜토리얼
Apache Kafka 클러스터 유형에 대한 배포 전략

기관들은 첫 번째 사용 사례를 배포하기 위해 단일 Apache Kafka 클러스터로 데이터 스트리밍 채택을 시작합니다. 그룹 전체 데이터 거버넌스 및 보안 요구 사항이 있지만 SLA, 지연 시간 및 인프라 요구 사항이 다르기 때문에 새로운 Kafka 클러스터가 도입됩니다. 여러 Kafka 클러스터가 규칙이며, 예외가 아닙니다. 사용 사례에는 하이브리드 통합, 집계, 마이그레이션 및 재해 복구가 포함됩니다. 이 블로그 게시물에서는 산업별로 다른 Kafka 배포를 위한 실제 성공 사례 및 클러스터 전략을 탐구합니다. Apache Kafka: 이벤트 기반 아키텍처 및 데이터 스트리밍의 사실상 표준 Apache Kafka는…

November 25, 2024

튜토리얼
Apache Iceberg: Lakehouses 및 데이터 스트리밍을 위한 오픈 테이블 형식

모든 데이터駕驅 조직은 운영 및 분석 작업 부하를 가지고 있습니다. 다양한 데이터 플랫폼을 포함한 최상의 솔루션 접근 방식이 등장하며, 이는 데이터 스트리밍, 데이터 레이크, 데이터 웨어하우스 및 레이크하우스 솔루션, 그리고 클라우드 서비스를 포함합니다. Apache Iceberg과 같은 열린 테이블 포맷 프레임워크는 기업 아키텍처에서 신뢰할 수 있는 데이터 관리 및 공유, 원활한 스키마 진화, 대규모 데이터 셋의 효율적인 처리, 그리고 비용 효율적인 저장을 보장하는 데 필수적입니다. 또한 ACID 트랜잭션과 시간 여행 쿼리에 대한 강력한 지원을 제공합니다. 이篇文章은 시장 트렌드; Iceberg, Hudi, Paimon,…

November 18, 2024

튜토리얼
Azure VM Apache WebServer を作成する方法

Azure를 사용하여 공개 웹 서버를 설정하려면 가상 머신을 사용하는 것이 유연성과 웹 호스팅 환경을 제어할 수 있습니다. 이 튜토리얼에서는 Azure VM을 설치하고 Apache를 설치하는 단계마다 그 단계가 왜 필수인지에 대해 설명하며 인터넷에서 액세스할 수 있는 정적 웹 콘텐츠 서버를 구성하는 방법을 안내합니다. 사전 준비 사항 시작하기 전에 다음 사항을 확인하세요: Azure 계정 – 이를 통해 Azure의 클라우드 서비스에 액세스할 수 있습니다. Azure Portal에 대한 기본적인 이해 – 인터페이스를 이해하면 리소스를 효율적으로 탐색하고 관리할 수 있습니다. 기본적인 Linux 명령 줄 기술…

October 26, 2024

튜토리얼
Logstash를 통해 Apache 로그를 OpenSearch로 전달하는 방법

소개 웹 서버 로그 관리는 웹사이트의 성능을 유지하고, 문제 해결하고, 사용자 행동에 대한 인사이트를 얻는 데 중요합니다. Apache는 가장 인기 있는 웹 서버 중 하나입니다. 그것은 가치 있는 정보를 포함하는 접속 및 에러 로그를 생성합니다. 이러한 로그를 효율적으로 관리하고 분석하기 위해서는, Logstash를 사용하여 이러한 로그를 처리하고 DigitalOcean의 Managed OpenSearch로 인덱싱 및 的可视化을 转发할 수 있습니다. 이 튜orial에서는, Apache 로그를 수집하고 Managed OpenSearch로 분석하기 위해 Logstash를 Droplet에 설치하고 configure 하는 과정을 指导할 것입니다. 사전 요구 사항 Apache 웹 서버를 설치한 Droplet/s.…

October 12, 2024

튜토리얼
如何在Terraform项目中结构化？

導言 Terraform 프로젝트를 사용 사례와 인지 得到的 복잡도에 따라 적절히 구성하는 것은 일상 operations를 위해 그들의 유지 가능性和 확장 가능性을 보장하는 데 필요하다. 코드 파일을 적절히 организова는 시스템적 인 접근方法은 배치 期间에 프로젝트가 스케일 수용 가능하며, 당신과 당신의 팀이 사용할 수 있게 하는 것이 필요하다. 이 튜토리얼에서, 일반적 인 목적과 복잡도에 따라 Terraform 프로젝트를 구성하는 방법을 배울 것이다. 그리고, Terraform의 더 일반적인 기능들을 사용하여 간단한 구조의 프로젝트를 만들 것이다: 변수, 로컬, 데이터 소스, 프로visioner. 결국, 당신의 프로젝트는 디지털 오cean에서…

July 15, 2024

튜토리얼