심층신경망 2

LLM(대규모 언어모델) 기본 정리

LLM이란 : 대규모 텍스트 데이터를 학습하여 언어의 패턴, 문맥, 의미를 이해하고 이를 바탕으로 텍스트를 생성하거나 질문에 답변할 수 있는 모델. 번역, 요약, 문법 교정, 텍스트 생성 등 다양한 작업을 처리 가능 LLM의 구조와 작동 원리 : LLM의 작동 원리는 주로 Transformer 아키텍처에 기반Transformer : Attention is All You Need"에서 소개된 딥러닝 모델 구조 [ Transformer의 핵심 구성 요소 ] 입력 임베딩(Input Embedding): 텍스트 데이터를 숫자 벡터로 변환. 각 단어를 고유한 벡터로 표현하여 모델이 처리할 수 있도록 만듬. Self-Attention 메커니즘 : 입력된 단어들 간의 관계를 계산하여 문맥을 이해. 포지셔널 인코딩(P..

심층신경망 2025.02.16

머신러닝의 종류와 선형회귀(Linear Regression), Single Neuron으로 확장

supervised learning(지도학습) : label(정답)이 있는 상태로 학습  supervised learning 종류  - Regression : 입력에 대한 특정 제한 사항은 없으나 출력값은 실수형(연속적)이며 유한하지 않아도 된다.주가, 날씨등 예측에 이용 - Classification : 입력에 대한 특정 제한 사항은 없으나 출력값은 정수형(discrete)이다.얼굴 인식이나 불량 검출 등에 이용  unsupervised learning(비지도학습) : label(정답)이 없는 상태로 학습 unsupervised learning 종류  - Clustering 비슷한 군집으로 묶임ex) 고객 그룹화, 질병분석 - Association 군집끼리 상관관계 분석ex) 추천   [ supervi..

심층신경망 2024.11.10