일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 토스
- AWS builders
- 그래프
- NLU
- BERT
- 사이드프로젝트
- SQL
- 취업부트캠프
- AARRR
- 딥러닝
- 알고리즘
- pytorch
- 임베딩
- 스타터스
- SLASH22
- 서비스기획
- MatchSum
- 그로스해킹
- 취업부트캠프 5기
- 서비스기획부트캠프
- sql정리
- NLP
- 추천시스템
- 유데미코리아
- 데이터도서
- 스타터스부트캠프
- 특성중요도
- 부트캠프후기
- 유데미큐레이션
- 유데미부트캠프
- Today
- Total
목록분류 전체보기 (154)
다시 이음
안녕하세요. 오늘은 2월 24일에 열린 AWS INNOVATE 온라인 컨퍼런스에 대한 후기를 조금 남겨보려고 합니다. AWS INNOVATE는 아래와 같은 목적으로 준비된 컨퍼런스 입니다. AWS Innovate – AI/ML 특집 온라인 컨퍼런스에 오신 것을 환영합니다. 최신 인공지능 및 기계 학습을 실제 업무에 쉽게 적용하여 비즈니스를 혁신할 수 있도록 돕는 유용한 AWS 기술 강연 및 데모를 수준 별로 학습하고, 실제 고객이 AWS 기반의 기계 학습을 통해 성취한 혁신 사례들을 통해 새로운 아이디어를 구상해 보세요. 컨퍼런스는 기본 1시간 기조연설을 시작으로 자신이 듣고 싶은 TRACK에 따라 1,2,3을 골라 들으면 됩니다. 레벨에 따라 AI/ML에 대한 지식이 어느정도 있는지에 따라 들을 수 있..
한국 스트리밍 서비스 (왓*, 쿠*플레이, 티*)에서 시청자가 영화를 보고 남긴 리뷰를 긍정과 부정으로 나누어 볼 수 있는 대시보드를 만들려고 합니다. 리뷰 긍부정 판별 모델을 만들려고 할 때, NLP 리서처/엔지니어로서 어떤 의사 결정을 할 것인지 각 단계에 맞춰 작성해봄으로써 실무에서의 프로세스를 간접 경험 해봅니다. (단, 수집된 리뷰 데이터의 개수가 1,000개 미만이라고 가정합니다.) 1. 문제 정의 풀고자 하는 문제를 정의하세요. 또한 데이터 생성 시 고려해야할 사항이 있다면 무엇인지 설명하세요. (예, 만약 긍정 리뷰가 부정 리뷰보다 많은 경우 어떻게 해야 할까?, 길이가 정말 긴 리뷰는 어떻게 전처리 해야 할까?) - 문제 정의 한국 OTT 서비스 이용 고객이 남긴 영화리뷰를 긍정,부정 판..
NLG sub task - Extractive summarization task(내용 추출 요약) 문제 정의 수많은 데이터가 생겨나는 요즘, 인간의 능력으로 유의미한 내용만을 선택하여 확인하기엔 정보를 모두 받아들일 수 없을 뿐만아니라 시간이 부족합니다. 이를 해결하기 위해 summarization을 통해 요약문의 문장이나 단어구들은 전부 원문에 있는 문장 사용하여 유의미한 정보만을 추출 요약하여 사용할 수 있습니다. 데이터셋 소개 : CNN / Daily Mail, DebateSum CNN / Daily Mail - CNN 및 Daily Mail 웹사이트의 뉴스 기사에서 질문으로 생성되었고 스토리는 시스템이 빈 채우기 질문에 답할 것으로 예상되는 해당 구절로 생성되었습니다. 저자는 이러한 웹사이트에서 ..
1.NLG란? Natural Language Generation (자연어 생성) - 시스템 계산 결과를 자연어로 자동으로 생성하는 자연어 처리 기술분야로 주어진 정보(이미지, 텍스트..)를 기반으로 정보 축약, 보강, 재구성을 하는 task를 가집니다. 좋은 자연어 생성의 기준 적절성: 생성된 문장이 모호하지 않고 원래의 input text의 의미와 일치해야 함 유창성: 문법이 정확하며 어휘를 적절하게 사용해야 함 가독성: 적절한 지시어, 접속사 등을 사용하여 문장의 논리 관계를 고려하여 생성해야 함 다양성: 상황이나 대상에 따라 표현을 다르게 생성해야 함 NLG 기본 알고리즘 : Decoding Algorithms - Language Model은 특정 time-step까지의 words sequence가..
NLU sub task - Machine Reading Comprehension(기계 독해) 문제 정의 - 대용량 문서를 대상으로 필요한 정보를 빠르고 정확하게 찾는 기술로 사람이 대용량 문서를 확인할 때 생기는 시간비용과 정확도를 개선하기 위해서 발전되고 있습니다. 기계독해를 base로 질문에 답할 수 있는 QA 기술이 발전함으로써 챗봇, 대화형 인공지능 개발이 가능해지고 있습니다. 기계 독해 추론 원리 및 과정 - 원리 : 주어진 본문에서 답이 시작할 점수 + 끝날 점수 맞추기 - 과정 : 원문, 질문 → Vocab 적용 → 숫자열로 변환 → 모델 추론 → 위치 선택 → 답변 기계 독해 응용 : OCR (문자인식) 후 MRC (기계독해), 영화 주인공의 프로파일 예측, 대화 플랫폼 데이터셋 소개 : ..
Week1-2 NLU 개론 목표 : 해결할 문제가 어떤 task인지 구별, 벤치마크 데이터 셋 및 모델을 알기 1. NLU란? Main task : 언어의 이해 Syntactic == 문법적 구분 Semantic == 문장의 의미 구분 - 감정분석, 유사도, 맥락파악, QnA, 추론 등등 2. GLUE & SQuAD "가장 공신력 있는 NLU 대회(벤치마크)" GLUE 백서 내에 표기 되어 있는 사용 데이터셋에 따른 Task와 평가지표, 도메인을 확인 할 수 있습니다. CoLA - 문법 SST - 감성 분석(문장의 의미 분석) STS - 문장 유사도 MRPC,QQP - 맥락 이해 MNLI - 자연어 추론 SQuAD - 기계 독해 ( 글을 통해 질문에 대한 대답을 하는 QA task ) 아래 표는 위에서 ..
안녕하세요. 오늘은 딥러닝 라이브러리인 Pytorch와 TensorFlow 중 어떤 라이브러리를 배우는게 좋을지, 어떤 라이브러리가 자주 사용되고 있는지 트렌드 분석을 통해 인사이트를 얻을 수 있는 블로그 글을 찾아 리뷰하려고 합니다. 본문은 AsemblyAI 블로그(http://www.assemblyai.com/blog/pytorch-vs-tensorflow-in-2022/)의 글을 토대로 정리한 글입니다. 참조한 글에서는 모델 가용성, 배포 인프라, 생태계로 나누어 Pytorch와 TensorFlow를 비교하여 분석하고 있습니다. 1. Pytorch? TensorFlow? 둘다 오픈소스 딥러닝 소프트웨어 라이브러리 입니다. Pytorch가 파이썬에서 직관적으로 해석되는 부분 때문에 현재 많이 사용되는..
1. 본인이 본 강의를 수강하는 목적에 대해서 자유롭게 적어보세요. ✏️ AI 부트캠프 당시에 TensorFlow 라이브러리를 사용하여 공부를 했습니다. 그러나 딥러닝 관련 프로젝트를 진행할 시에 활용하고자 하는 모델(YOLO, seqGAN 등)에 대하여 사용할 수 있는 오픈소스 코드가 대부분 Pytorch 라이브러리를 사용해서 진행하는 경우가 많았습니다. Pytorch사용법을 몰랐기 때문에 TensorFlow를 사용하여 프로젝트를 진행하긴 했지만 그 과정에서 소스를 얻기 위해 많은 시간을 사용하였습니다. 앞선 경험으로 활용도 측면에서 Pytorch 가 더 좋은 측면이 있다고 생각하여 독학을 하려고 하던 찰나에 해당 강의를 알게되어 지원하게 되었습니다. 2. Paperswithcode(https://pa..
안녕하세요. 오늘은 딥러닝 프로젝트를 진행하고 나서 그 후기를 전달드리려고 합니다. 이 글은 현재 Python을 공부하시면서 TensorFlow 라이브러리를 사용하여 Yolo 모델을 구현함과 동시에 Object counting 기능과 Custom 학습도 병행하시길 원하는 분들께 도움이 되는 글입니다. 필자는 Mac air(M1)을 사용중으로 GPU 학습이 불가한 환경으로 Colab 환경에서 GPU를 활용하여 구현하도록 하겠습니다. Project : Python TensorFlow기반 Yolo 모델 구조 원리 이해 및 구현하기 ( Object Counting, Customize ) 프로젝트 프로젝트 선정 이유 1. 관심사 자율주행과 물류 2. 문제점 물류 분야에서는 코로나로 인해 물동량이 코로나 이전보다 ..
안녕하세요. 이제 원래 하던 교육이 끝났기 때문에 자기주도 학습을 해야하는 입장에서 책만큼 인사이트를 얻기 좋은 매체도 없는 것 같기 때문에 1주일에 1권이라도 읽으면서 전체적으로 어떤 느낌인지, 어떤 내용을 가지고 있는지 어떤 분들이 읽으면 좋을지 와 같은 내용을 공유해보려고 합니다. 첫번째 도서는 비전공자를 위한 이해할 수 있는 IT 지식 / 출판사 : 티더블유아이쥐(T.W.I.G) / 최원영 지음 입니다. 난이도 : ★☆☆☆☆ 주요 내용 : 전체적으로 얇은 IT 기초 지식 목적 : 비전공자들이 IT종사자와 협업을 할 때 필요한 정보를 전달해줍니다. 목차 1장 오리엔테이션 1-1. 왜 자꾸 파이썬(Python)을 배우라고 하는 거죠? (feat. C 언어, 자바(JAVA)를 배워봐) 14 1-2. 가..