목록ETC (11)

1단계: 문제 이해 및 설계 범위 확정푸시 알림, SMS, 이메일 등 다양한 채널을 모두 지원해야 한다.실시간성을 유지하되 피크 시에는 약간의 지연을 허용하는 연성 실시간(soft real‑time) 시스템이어야 한다.사용자가 각 채널별 알림 설정을 켜고 끌 수 있도록 옵션을 제공해야 한다.하루 평균 1,000만 건의 푸시, 100만 건의 SMS, 500만 건의 이메일 처리량을 목표로 삼아야 한다.2단계: 개략적 설계안 제시2.1 알림 유형별 전송 경로iOS 푸시: 서비스 → APNS → iOS 단말 토큰에 전달한다. (모바일.. 해볼일이 있으려나..)Android 푸시: FCM(Firebase Cloud Messaging)을 통해 Android 단말에 전달한다.SMS: 통신사(SKT, KT, LGU+)..

1. 웹 크롤러의 정의 및 주요 용도웹 크롤러(로봇 또는 스파이더)는 웹 상의 새로운 콘텐츠를 찾아 수집하는 시스템으로, 주된 활용 사례는 다음과 같다. 검색 엔진 인덱싱: Googlebot처럼 수집한 페이지를 검색 색인으로 구축 웹 아카이빙: 장기 보관용 정보 수집 웹 마이닝: 데이터 마이닝을 통한 지식 추출웹 모니터링: 저작권·상표권 침해 감시 2. 문제 이해 및 설계 범위 확정기본 알고리즘은 “시드 URL → 페이지 다운로드 → 링크 추출 → 반복”이지만,대규모 크롤러 설계 전에는 다음과 같은 질문을 통해 요구사항을 명확히 해야 한다:크롤러의 주된 용도는? (예: 검색 인덱스 생성)월간 수집 페이지 수는? (예: 10억 페이지)신규·변경 페이지도 재수집할 것인가?수집한 페이지 보관 기간은? (예: ..

File에 권한 체계를 적용하는데 사용한 closure table을 소개하고, 적용한 사례를 소개합니다. 파일 구조를 만들면서 가장 걱정되었던 부분은 어떻게 authority를 적용시키느냐 였습니다. 파일 구조는 태생적으로 계층구조를 띄게 되고, 상위 파일의 권한에 영향을 받을 수 밖에 없으니까요.RDB는 이런 계층 구조를 나타내기에 적합하지 않기도 해서 다양한 방법들을 고민했습니다.RDBMS에서 tree structure 다루기여기서 parent-child 기법을 사용해서 파일 시스템을 구성했는데… 문제는 다음과 같았습니다.폴더 아래에 파일이 있습니다. 사용자는 폴더에 대해 update 권한을, 파일에 대해 read 권한을 가지고 있습니다.이런 경우 사용자는 파일에 대해서도 update를 할 수 있어야..

Graph DB를 사용하는 방법 도 있지만, RDBMS가 일반적으로 사용되기 때문에 여러 가지 이론들이 나와있습니다.크게 3가지에 대해 다루어 봅니다.Parent-ChildNested SetsMaterialized PathPatenet-Child (Adjacency list)가장 직관적으로 생각 할 수 있는 구조로, 자식이 부모의 기본키를 가지도록 하는 전략이다.적용, 활용이 가장 쉽지만, 성능면에서 가장 비효율적인 방법이다. 데이터 삽입/편집자식엔티티가 부모 엔티티의 PK를 들고 있으면 되기에 가장 쉽다. 데이터 selection특정 데이터를 검색하기 매우 어렵다. 계층이 내려갈 때마다 쿼리를 계속 날려야 하기 때문이다.따라서 데이터 검색을 위해 SQL를 자주 날려줘야 하는 단점이 있다. 데이터 삭제부..
실무를 하면서 data로서의 string을 다룰일은 많지만, string을 요래조래 조합하거나 할 일은 많이 없다...그럼애도 불구하고, 알뜰신잡 느낌으로 String을 다룰수 있는 String builder를 정리하려한다. 1. String으로 충분하지 않나요? 왜 StringBuilder죠?String str1 = "Hi ";String str2 = "World";str1 += str2; // str1 : "Hi World"2개의 String은 단순히 + 연산을 통해 새로운 string을 만들 수 있다.String은 불변 객체이므로, + 연산을 하면 새로운 string이 생성된다. 그리고 이전에 있던 문자열은 GC 에서 처리한다.즉, 메모리 할당과 메모리 해제가 수반되는 연산이라는 뜻이다.2. Str..

https://www.cursor.com/ CursorThe AI Code Editorwww.cursor.comCursor AI를 사용하는 유튜브를 보게 되었다.정말 AI가 개발자를 대체할 수 있을지 테스트해보고 싶었다.목표기존에 있는 프로젝트를 잘 이해하고, 기획상 요구되는 사항을 반영하기 쉬운지 확인한다.기존 프로젝트의 언어를 모르는 사람도 이해할 수 있게 설명을 해주고, 매우 간단한 수정과 클릭으로만 원하는 기능이 구현되는지 확인한다.개발 환경macbook pro m1cursor AI IDE (메인)프로젝트 언어JS마크다운html기존 프로젝트 세팅동아리 영수증 취합을 편하게 하기 위한 간단한 프로젝트를 타겟으로 한다.프론트 페이지를 통해 사용자가 영수증 사진과 이름, 해달 월을 post 하면, OC..

MST 즉 최소신장트리 (최소 스패닝 트리)는 간선에 weight가 있는 그래프를 tree로 만들어 문제를 해결할때 유용하게 사용할 수 있다. 그래프를 최소 비용 간선을 가진 tree로 만드는 방법을 MST 라고 한다. MST를 만들 조건은 1. 그래프 간선에 weight가 있을 경우 2. Cycle이 없어야 할 경우 라고 할 수 있다. MST는 kruskal 알고리즘을 사용하여 tree를 구성하는데, 아래와 같이 동작한다. 1. 가장 weight가 적은 간선을 선택 2. 선택된 간선에 연결된 두 노드가 같은 tree인지 확인한다. 3-1. 두 노드가 서로 다른 tree인 경우 같은 tree로 만들고 1로 돌아간다. 3-1. 두 노드가 같은 tree인 경우 1로 돌아간다. 이것을 반복할 경우, weigh..

다익스트라 알고리즘은 O(NlongN) 안에 한 노드에서 다른 모든 노드에 대한 최단 거리를 찾을 수 있다. 벨만-포드 알고리즘의 경우 O(N^2)으로 최단 거리를 찾는다. 벨만-포드 알고리즘이 존재하는 이유는 "음수"값을 가지는 간선이 존재할때 최단 거리를 찾기 위함이다. 음수 간선이 존재할 경우 circuit이 생길 수도 있는데, circuit을 돌 수록 음수 간선에 의해 최단 거리가 계속 줄어들 수도 있다. 하지만, 상식적으로 생각해 본다면, 같은 길을 반복해서 지나가는건 최단 거리가 아니다. 벨만-포드는 이 두가지 경우를 상정할 때 최단 거리를 구할 수 있는 알고리즘이다. 벨만-포드의 특징은 - 음수간선이 존재 - Cycle을 돌면 안됨 -> cycle을 돌 경우 탐색 중지 라고 할 수 있다. 다..