일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 유데미부트캠프
- 서비스기획부트캠프
- 데이터도서
- MatchSum
- 취업부트캠프 5기
- 부트캠프후기
- 취업부트캠프
- 서비스기획
- 알고리즘
- AARRR
- NLP
- AWS builders
- NLU
- 추천시스템
- 유데미코리아
- sql정리
- 토스
- 그로스해킹
- 임베딩
- SQL
- 스타터스부트캠프
- 스타터스
- pytorch
- BERT
- 사이드프로젝트
- 유데미큐레이션
- 그래프
- 딥러닝
- 특성중요도
- SLASH22
- Today
- Total
목록전체 글 (154)
다시 이음
안녕하세요. 오늘은 딥러닝에 대한 프로젝트나 구현을 할 때 유의하면 좋을 점을 간단하게 정리해보려고 합니다. (간단한 내용임에도 누군가 알려주지 않으면 헛 시간을 쓰게 되더라구요;;) 1. 어떤 언어, 라이브러리를 사용할 것인가? 프로그래밍언어로 자신이 사용하는 언어에서 구현이 가능한 모델, git을 찾아야합니다. 어떤 모델을 구현해보고 싶어서 무작정 아무 블로그 글을 보고 따라하려고 했다면 천천히 다시 살펴보세요. 그 블로거가 사용하는 언어는 무엇인지, 사용하는 라이브러리는 무엇인지 를 꼭 알아야 합니다. 왜냐하면, 딥러닝에 자주 사용되는 라이브러리로는 TensorFlow, Pytorch 등이 있는데 라이브러리를 어떤 것을 사용하느냐에 따라서 같은 모델이더라도 구현하는 방식과 참고해야하는 공식문서, 코..

안녕하세요. 오늘은 제가 3주간 진행한 프로젝트에 대한 리뷰 시간을 가져보려고 합니다. 총평으로는 이렇게 긴 기간동안 프로젝트를 진행한 적이 없었고, 팀원과 같이 커뮤니케이션하면서 진행하는 기업협업 프로젝트였기에 실무에서 사용하는 데이터를 사용할 수 있었고 팀원간의 커뮤니케이션과 의견 합일에 대해서도 많이 생각하게되었습니다. 이러한 전체적인 과정은 긴장되면서도 많은 것을 배우고 생각하게 된 프로젝트였습니다. 이 리뷰를 작성하면서 기업과 맺은 계약 때문에 하나하나의 설명보다는 어떤 기술을 사용했고 어떤 방식으로 진행했는지만을 상세히 다뤄보려고 합니다. BASE 이 프로젝트를 하기 앞서 저희가 제공받았던 데이터는 반정형 데이터의 형태인 로그 데이터였습니다. 이 로그데이터를 분석하고 여러가지 게임 이용자에 적..
안녕하세요. 오늘은 시계열 데이터 예측에 대해서 사용할 수 있는 기법에 대해서 알아보도록 하겠습니다. 해당 글은 Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. 온라인 교재의 내용을 요약,정리한 글이며 제가 주로 사용하는 파이썬이 아닌 R로 설명되어 있어 이해함에 부족함이 있을 수 도 있다는 점을 알려드립니다. 예측가의 도구 상자 1. 평균 기법 2. 단순 기법 모든 예측값을 단순하게 마지막 값으로 두는 것입니다. 데이터가 확률보행 패턴을 따를 때에 최적입니다. 3. 계절성 단순 기법 계절성이 뚜렷한 데이터를 다룰 때 유용합니다. 각..

안녕하세요. 오늘은 시계열 시각화에 대해서 알아보도록 하겠습니다. 해당 글은 Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. 온라인 교재의 내용을 요약,정리한 글이며 제가 주로 사용하는 파이썬이 아닌 R로 설명되어 있어 이해함에 부족함이 있을 수 도 있다는 점을 알려드립니다. 시계열 시각화 데이터 분석 작업에서 가장 먼저 해야하는 것은 데이터를 그래프으로 나타내는 것입니다. 그래프는 패턴, 특이한 관측값, 시간에 따른 변화, 변수 사이의 관계 등의 데이터의 많은 특징을 눈으로 볼 수 있게 해줍니다. 시계열의 빈도 빈도의 값은 일별 혹..
안녕하세요. 오늘은 Sequential data(시간 순서에 따라 순차적으로 쌓이는 데이터)를 처리하기 위해 필요한 시계열 데이터 분석 방법에 대해서 정리를 해보려고 합니다. 해당 글은 Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. 온라인 교재의 내용을 요약,정리한 글이며 제가 주로 사용하는 파이썬이 아닌 R로 설명되어 있어 이해함에 부족함이 있을 수 도 있다는 점을 알려드립니다. 시간이 되신다면 위의 링크를 통하여 실제 교재를 보시는 것을 추천드립니다. Forecasting 1. 예측 될 수 있는 것이란? 예측을 하기 쉬운 것과 ..

안녕하세요. 오늘은 알고리즘의 마지막 시간입니다. 그동안 많은 알고리즘과 자료구조에 대해서 알아보았는데요. 알아본 내용 이외에도 몬테카를로 알고리즘이나 퍼셉트론 알고리즘과 같이 수많은 알고리즘이 존재합니다. 오늘 동적 프로그래밍과 그리디를 정리하고나서 추후에 시간이 나는 경우 하나하나 정리하는 시간을 가지려고 합니다. 그렇게 오늘은 동적 프로그래밍(Dynamic Programing)과 그리디(Greedy)(탐욕 알고리즘) 에 대해서 살펴보겠습니다. 동적 프로그래밍(Dynamic Programing) 동적 계획법은 동적 알고리즘, 동적 프로그래밍, 다이나믹 프로그래밍 등등 다양한 용어로 사용되는데, 보편적 의미는 '문제의 일부분을 풀고 그 결과를 재활용하는 방법' 입니다. 이러한 개념은 이전에 배운 '분할..

안녕하세요. 오늘은 직전에 같이 배웠던 순회에서 자료구조인 그래프의 순회에 대해서 배워보려고 합니다. 그래프의 순회는 트리 순회와 비슷하게 진행 방향에 따른 구분입니다. BFS(Breadth-first-search) - 너비 우선 탐색 BFS 란? 그래프의 순회방법 중 인접한 노드부터 탐색해나가는 탐색 방법입니다. 위의 예시를 통해서 어떻게 BFS가 진행되는지 같이 살펴보도록 하겠습니다. BFS는 위에서 정의한 것과 같이 인접한 노드부터 탐색합니다. 좀더 쉽게 말하면 예전에 트리구조 용어에서 LEVEL이라는 단어를 들어보셨을 겁니다. 그 LEVEL에 따라 탐색을 진행한다고 생각하시면 됩니다. 시작 노드를 'A'로 지정한 경우에는 B-C-D가 인접한 노드로 먼저 탐색을 시작하고 그다음 레벨인 E-F-G-H..

안녕하세요. 오늘은 자료구조 중급의 두번째 그래프(Graph)에 대해서 알아보겠습니다. 이 그래프 자료구조는 트리 자료구조와 많이 비교가 이루어지는 자료구조 입니다. 그만큼 비슷한 점도 있고 차이점도 있는 구조입니다. 그래프(Graph) 위에서 언급한 것과 같이 트리 구조와 어떤 부분이 비슷하고 어떤 부분에서 차이를 보일까요? 그래프란? 그래프는 노드(=정점,vertex) 와 엣지(=링크,간선)로 구성된 구조입니다. 이러한 구성에 대해서는 어느 정도 연관성을 가지고 있는 구조이지만, 트리 구조는 노드 간에 계층 구조를 나타나고 그래프는 노드간에 관계를 나타낸다는 차이점이 있습니다. 그래프에서 노드간에 관계란 실제의 object간의 관계를 보여주기 때문에 보통 SNS, 도로 상의 차량 검색, 운송시스템 등..

안녕하세요. 오늘 부터는 알고리즘 자료구조의 중급 과정이라고 할 수 있는 부분을 살펴보려고 합니다. 첫 주자는 해시(Hash)인데요. 해시라고 하면 해시태그를 먼저 생각하실 수 도 있는데 이 해시태그(#)와는 상관이 없습니다. 대신 블록체인에서 해시함수는 중요한 원리로 작용한다고 합니다. 어떤 부분에서 활용되는지는 본문에서 해시에 대해서 공부를 하고 다시 찾아보면 이해가 되실 겁니다. 해시(Hash) 1. 해시 테이블(Hash Table) 해시 테이블은 키(key)와 값(value)이 쌍을 이뤄 매핑할 수 있는 추상 자료 구조 입니다. 이 키와 값을 매핑시키는 과정을 해싱(Hashing) 이라고 합니다. 키가 매핑이 되기 위하여 해시함수를 거쳐 해시값(정수값)에 매핑이 되는 과정을 가지고 있습니다. 해시..

안녕하세요. 오늘은 이전에 배운 선택정렬, 삽입정렬, 버블정렬에 이어 분할정복이라는 개념을 적용하여 사용되는 퀵정렬과 병합정렬에 대해서 알아보려고 합니다. 분할 정복 ( Devide and Conquer ) 분할 정복법은 재귀적으로 자신을 호출하면서 그 연산의 단위를 조금씩 줄어가는 방식입니다. 분할 정복법은 분할 - 정복 - 결합의 과정을 거칩니다. 자세히 말하면, 큰 문제를 작은 문제로 분할(divide)하고, 작은 문제를 하나하나 해결(conquer)하고, 해결된 문제를 하나의 큰 문제로 결합(combine)하는 과정입니다. 분할정복의 장점 어려운 문제를 작은 문제로 나눔으로써 쉽게 해결합니다. 작은 문제를 분할하여 같은 작업을 더 빠르게 처리합니다. 병렬로 문제를 해결할 수 있습니다. 분할정복의 ..