'2026/05/27 글 목록

DL 5 - NLP 실습

1. 학습 목표NLP 처리 과정 전반을 코드로 직접 다루며 토큰화 워크플로우를 이해하고, 이를 활용해 유사도 기반 챗봇 프로토타입을 구성하는 것이 목표임. LLM API 내부에서 일어나는 토큰화 흐름을 직접 구현해보는 데 의의가 있다.1.1 다루는 범위토큰화 워크플로우 — 분절화 → 사전화 → 벡터화 → 패딩 → 임베딩유사도 기반 검색 — 코사인 유사도로 가장 가까운 질문 찾기챗봇 프로토타입 — Gradio로 시뮬레이션, SBERT로 토크나이저 교체 비교1.2 챗봇 동작 흐름사용자 질문 입력 — 자연어 텍스트질문 토큰화 — 벡터로 변환유사도 검사 — 사전 구축된 챗봇 시트 질문 벡터들과 비교매칭 답변 반환 — 거리가 가장 가까운 질문에 페어로 묶인 답변 응답NLP 워크플로우는 결국 "자연어를 숫자로 바꿔..

SK플래닛 ai활용 데이터엔지니어 과정 2기/ML & DL 2026.05.27

« 2026/05 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

dev-lee 님의 블로그

2026/05/27 2

티스토리툴바