[Bespin] 빅데이터

빅데이터

Hadoop

개요

:star: 분산 병렬 프레임워크

분산: HDFS 데이터 분산 저장

데이터 처리 방식: MapReduce

단점

Spark

개요

RDD

Resilient Distributed Datasets: 변형 불가능한 분산된 데이터 셋

부서지지 않는 스토리지

  • Lineage를 통해 분산된 RDD를 만듦

    부서질 경우 부서진 RDD를 만들었던 다른 RDD의 여러 개를 가져옴

머신러닝

AWS Cloud Managed Service

프로젝트 역할 및 R&R 개요

  1. PM

    모든 관리 업무를 책임

  2. PL

  3. PE or SE

CMS 역할 및 범위

운영 업무 상세 내역

운영 서비스를 위한 관리 툴

OpsNow

클라우드 자원 및 비용을 통합, 관리, 신속한 장애 대응 및 안정적인 서비스를 위한 모니터링 지원 자동화 클라우드 관리 플랫폼

NewRelic

아모레퍼시픽 요구사항을 위한 플랫폼

InterMax

비즈니스 서비스 환경에서 end to end 성능 관리 목적 WAS ~ TP ~ DB 통합 성능 관리현황 파악, 이상 감리, 원인 파악, 상세 분석 등

AP 장애관리

운영 환경에 대한 모니터링 및 장애에 대한 체계적인 관리를 통하여 즉시 조치하고 재발 방지 계획을 수립, 운영

AP Sales Legacy Transformation Cloud Infra

사업 배경 및 목적

최적화된 Cloud Infra 환경 구성 목적

AWS 클라우드 인프라를 바탕으로 최적의 서비스 환경 구성, 비용효율적인 고수준의 시스템을 빠르게 전개 -> AP SLT 서비스의 경쟁력 강화

사업 방향성 및 전략

프로젝트 추진 개요 및 범위

Cloud Infra 주요 적용 기술 부문

AP 아키텍쳐 개요 부문

주요 적용 및 사례

AP Legacy 환경 Migration

Cloud Migration 방안

Cloud Adoption Framwork 기반 업무 중요도 및 난이도에 따라 On-Premise 환경을 Migration을 위해 Workload 분석, 전환 전략, 전환 방안 등 단계별 수립

이관 패턴 분석

Lift & Shift

거버넌스, 자동화, CI/CD 구성 -> Lift & Shift로 App 변경 최소화, Web/WAS Test

자동화, 배포

표준 리소스 및 운영 시간

RI: 환경 구성 시 개발/검증의 비사용 시간을 설정하여 자동으로 stop/start 할 수 있도록 -> 상시 동작

Cloud 최적 활용 제안

최적화 작업을 반복 수행하여 클라우드 사용에 대한 인프라 비용 최적화

AWS 내 개발용 인스턴스(DEV/STG)들에 대한 스케줄러 적용을 통해 비업무 시간동안 발생하는 유휴(야간) 지원에 대한 사용 비용 최적화

분기별 AWS 패턴 사용 절감

AutoSpot: 비용효율적인 Spot Instance의 사용성을 높이고 적용 대상 서비스에 대한 인프라 사용 비용 최적화

Well - Architected Review 프로그램 제공