반응형
LLM
-
[머신러닝] Large Language Model (LLM) 이란? 수학적인 내용을 말로인공지능/머신러닝 2025. 2. 26. 08:39
LLM 모델은 기본적으로 단어들이나 문장들이 나올 가능성을 계산하는 시스템이에요. 이 모델은 엄청난 양의 텍스트를 보고, 어떤 단어가 어떤 상황에서 다음에 나올지 확률적으로 예측하도록 훈련됩니다. 예를 들어, "나는 매일 아침"이라는 말이 주어지면, 다음 단어로 "책을"이나 "운동을" 같은 게 나올 가능성을 숫자로 따져서 가장 그럴듯한 걸 골라내는 식이죠.이 예측을 가능하게 하는 핵심 구조는 트랜스포머라는 방식인데, 이건 문장에서 단어들이 서로 얼마나 중요한지 가중치를 주는 방식으로 작동합니다. 문맥을 보면서, 멀리 떨어진 단어와 가까운 단어 중 어디에 더 신경을 써야 할지 판단하는 거예요. 이 과정에서 모델은 단어들을 숫자 벡터로 바꾸고, 그 벡터들 사이의 관계를 계산해서 어떤 단어가 다음에 올지 결정..