본문 바로가기
자격증/SAA

AWS - DB service(Redshift)

by SLkittys 2024. 1. 16.
728x90

ㆍAmazon Redshift

   : PostgreSQL에서 파생된 데이터 웨어하우스 서비스로, 복잡한 계산을 포함하는 분석 쿼리 처리에 적합함.

 

ㆍ기능 및 특징

    - 데이터 웨어하우스 서비스 : 완벽 관리되는 페타바이트 급의 데이터 웨어하우스 서비스임.

    - PostgreSQL 기반 : PostgreSQL 기반으로 DB와 분석 엔진을 결합하여 제공

    - 온라인 분석 처리(OLAP / Online Analytical Processing) : OLAP유형 DB, 분석데이터 웨어하우징에 사용

    - 열 기반 스토리지 : 열기반 데이터 스토리지 사용, 병렬 쿼리 엔진을 사용하기 때문에 빠른 쿼리 성능을 제공

    - BI(Business Intetlligence) 도구 통합 : Quicksight, Tableau 등 BI 도구와 통합 가능

    - S3 통합 : S3의 모든 데이터를 로드한 후 인덱스를 생성하여, 더 빠른 쿼리와 조인/통합이 가능

    - 리더노드와 컴퓨팅 노드

      ▪️ 리더노드 : 쿼리 계획 수립, 결과 집계

      ▪️ 컴퓨팅 노드 : 쿼리 실행, 리더 노드로 전송

    - Redshift 클러스터 : 노드 크기를 미리 프로비저닝, 클러스터는 한 개의 가용 영역에만 존재(다중 AZ 미 지원)

       * 다중 AZ를 미지원한다고해서 고가용성을 지원하지 않는 것은 아님!

         '자동 백업과 복구 → 스냅샷 복사 → 클러스터 재시작' 해당 방법으로 고가용성을 제공할 수 있음

    - 재해 복구 : 스냅샷을 이용하여 클러스터의 지정복구시간을 사용,

                         해당 방법은 S3내부에 증분 백업되며 다른 리전에도 자동복사 가능

    - 데이터 주입 방법

      ▪️ Amazon Kinesis Data Firehose를 사용

      ▪️ S3에 데이터 로드 후 Redshift에서 COPY명령 사용(인터넷을 통하는 방법과 VPC를 통하는 두가지 방법)

      ▪️ JDBC 드라이버 사용

    - Redshift Spectrum : S3에 있는 데이터를 쿼리를 실행하는 기능,

                                       Redshift Spectrum노드에 쿼리가 제출되어 S3에서 Redshift로 데이터를 로드하지 않음

 

* Redshift와 RDS의 차이

 1. RedshiftOLAP(보고 및 분석)에 사용하며,

     RDSOLTP(온라인 트랜잭션 프로세싱) 워크로드에 사용한다.

  2. Redshift대용량 데이터 세트를 대상으로 복합 분석 쿼리를 빠르게 실행하는 것이 목표임.

      RDS 단일 행 트랜젝션에 목표를 둠.

728x90

'자격증 > SAA' 카테고리의 다른 글

AWS - DB service(DynamoDB)  (0) 2024.05.11
AWS - DB service(Amazon Athena)  (0) 2024.01.16
AWS - DB service(Amazon Aurora)  (0) 2024.01.16
AWS - DB service(RDS)  (0) 2024.01.16
AWS - 스토리지(EBS와 EFS)  (0) 2024.01.16