Home
leeyh0216's devlog
Cancel

Apache Druid - Getting started

스터디를 위해 Apache Druid 공식 문서를 번역/요약한 문서입니다. Getting started Introduction to Apache Druid Druid란? Apache Druid는 대규모 데이터를 대상으로 slice-and-dice 분석을 지원하기 위해 만들어진 실시간 분석용 데이터베이스이다. slice and di...

LeetCode - Longest Common Prefix

출처: LeetCode - Longest Common Prefix 난이도: 하 관련 기술: String 문제 요약: 입력 문자열들의 가장 긴 Prefix를 찾는 문제이다. 풀이일 2019년 10월 8일 풀이 방법 단순한 for문을 통해 풀 수 있는 문제이다. 가장 짧은 문자열의 길이를 ...

LeetCode - K diff pairs in array

출처: LeetCode - K diff pairs in array 난이도: 하 관련 기술: Two Pointer, Sort 문제 요약: 배열 내의 임의의 두 숫자의 조합의 차가 k인 조합의 갯수를 찾는 문제이다. 풀이일 2019년 10월 8일 풀이 방법 정렬과 투포인터를 이용하여 풀 수 있는 ...

LeetCode - Generate Parentheses

출처: LeetCode - Generate Parentheses 난이도: 하 관련 기술: Recursion 문제 요약: n개의 (, )를 이용하여 완전히 닫힌 괄호 조합을 만들어내는 문제 풀이일 2019년 10월 8일 풀이 방법 재귀 함수를 이용하여 풀이할 수 있는 문제이다. 닫힌 괄호를 만...

LeetCode - Super Reduced String

출처: HackerRank - Super Reduced String 난이도: 하 관련 기술: String, Recursion 문제 요약: 입력으로 주어진 문자열 내의 연속으로 2번 등장하는 문자를 제거하는 문제이다. 예를들어 aaabb가 나온다면 aaabb -> abb -> a가 된다. 풀이일 2019...

LeetCode - Median of Two Sorted Arrays

출처: LeetCode - Median of Two Sorted Arrays 난이도: 상 관련 기술: Array, Binary Search, Divide and Conquer 문제 요약: 미리 정렬된 2개의 배열을 합친 배열의 중간 값(median)을 찾아내면 되는 문제이다. 풀이일 2019년 10월 7일 ...

LeetCode - Longest Substring Without Repeating Characters

출처: LeetCode - Longest Substring Without Repeating Characters 난이도: 중 관련 기술: Sliding Window 문제 요약: 입력으로 주어진 문자열(s)에서 반복된 문자를 가지지 않는 최대 길이의 부분 문자열을 찾는 문제이다. 풀이일 2019년 10월 7일 ...

Spark RDD의 count()는 어떻게 동작하는가?(Shuffle이 없는, Driver 편)

Spark RDD의 count()는 어떻게 동작하는가?(Shuffle이 없는, Driver 편) Spark RDD의 기본 연산 중 하나인 count()가 어떻게 동작하는지 알아보도록 한다. Shuffle이 들어가면 분석이 너무 어렵기 때문에 Shuffle이 발생하지 않는 코드로만 추적해보았으며, 이번 글에서는 Driver에서 발생하는 과정만을 다룬...

Validation에 책임 연쇄 패턴 적용하기

Validation에 책임 연쇄 패턴 적용하기 데이터를 저장하기 전에 데이터에 대한 검증(Validation)을 수행해야 하는 경우가 있다. 예전에는 아래와 같이 데이터를 관리하는 클래스 내에 validation 이라는 메서드를 정의해서 기본 validation을 수행하고, 필요한 경우 해당 메서드를 재정의하여 사용하거나 preValidate, p...

Streaming Systems - Streaming 102(1)

Streaming 102 Streaming 101에서 등장한 개념 이외에도 Trigger, Watermark, Accumulation이라는 개념이 등장한다. Trigger Window의 Output을 언제 내보낼지 결정하는 동작을 의미한다. 단순히 한번만 Window의 결과를 출력하지 않고 Window의 결과물이 달라짐에 따라 여러 번 결과를 ...