새소식

💬 ALL

[누구나 ChatGPT왕초보에서 킹이 될 수 있다][Part 1] ChatGPT 소개

  • -

 

누구나 ChatGPT를 활용하여 직접 쉽게 프로그래밍을 할 수 있습니다.

ChatGPT소개부터, 실습환경구축, 프로그래밍, 챗봇까지 만들어보도록 하겠습니다.

ChatGPT소개와 프롬프트 엔지니어링에서부터 ChatGPT API 서비스 적용 방법까지에 대해 포스팅할 예정입니다.

 

도입

ChatGPT는 계산기처럼 바라봐야합니다. 즉, ChatGPT를 제대로 사용할 줄 모르면 ChatGPT는 쓸모없는 기계가 되는 것과 같습니다.

현재 ChatGPT의 등장으로 인해 전문인들은 더욱 전문인이 되는 시대가 도래하였습니다.

 

전문인들은 GPT로 만든 코드들을 그대로 뱃겨서 작성하지 않습니다.

그대로 뱃겨서 작성하는 것은 원숭이처럼 생각없이 타이핑만 하는 사람, 즉 몽키타이핑이라고 불립니다.

 

몽키타이핑이 되지 않으려면?

GPT 출력 답변은 해당 요청 문제에 대해서만 적합한 답변을 출력합니다. 다시 말해, 이를 고대로 가져다가 다른 곳에 활용하려고 할때는 자연스럽지 않다 라는 단점을 가지고 있습니다.

즉, 전문인들은 해당 답변을 수정하는 과정을 거쳐 자신의 출력물로 만들고 있습니다.

 

시대는 빠르게 변화하고 있습니다. 변화에 맞게 우리는 적응하여야 합니다.

나만의 공간을 훈련과 도전하는 과정을 거쳐 확장하고 만들어가야합니다.

 

중간에 인공지능의 관해 세부적인 개념이 나오는 부분은 '이런것이 있구나'하고 넘어가주시면 됩니다!

인공지능 소개

인공지능이란?

: 컴퓨터가 사람처럼 생각하고, 판단하게 만드는 기술

 

- 에이전트 아키텍쳐 : 지능 시스템은 어떤 구조를 가져야 하는가?

- 지식표현 : 지능적인 행동에 적합한 지식 표현은 어떤 형태이어야 하는가?

- 추론 메커니즘 : 지식 표현으로 어떻게 주어진 문제에 대한 답을 찾을 것인가?

- 학습 알고리즘 : 지식 표현 구조(모델)를 자동으로 생성하는 최적의 방법은?

 

강인공지능

: 다양한 분야에서 문제를 사고하고 해결할 수 있는 컴퓨터 기반의 인공지능

약인공지능

: 어떤 특정한 한 가지 분야의 주어진 일을 인간의 지시에 따라 수행하는 인공지능

 

머신러닝 (인공지능의 한 분야)

: 인간의 학습능력과 같은 기능을 컴퓨터에 부여하기 위한 기술

 

딥러닝 (인공신경망을 기반으로 한 머신러닝 방법론 중 하나)

: 빅데이터를 기반으로 스스로 학습하며, 판단하는 기술

LLM(Large Language Model)이란?

: 인간과 유사한 응답을 생성하기 위해 방대한 양의 텍스트 데이터로 훈련된 인공지능 모델 (= 자연어처리 작업을 수행)

 

RLHF란? (Reinforcement Learning from Human Feedback)

강화학습(기계학습)과 사람의 피드백을 결합하여 LLM(Large Language Model)의 성능을 향상시키는 기술입니다.

 

Transformer란?

트랜스포머(Transformer모델)은 한마디로 번역기, 확률모델이라고 할 수 있습니다.

다층인코더와 다층디코더의 구조로 이루어진 언어변환 모델입니다.

- encoder : 입력을 특정 벡터 출력으로 변환

- decoder : 특정 벡터 입력을 매칭되는 대상으로 변환

 

ChatGPT란?

이제 다시 집중해보겠다.

 

ChatGPT는 Generative Pre-trained Transformer인 사전에 훈련된 생성변환기라는 뜻 입니다.

현재 23년 12월 기준, GPT3.5와 GPT4기반 대화형 인공지능 서비스이자 대형 언어모델(LLM) 챗봇서비스입니다.

 

ChatGPT의 컴퓨팅 규모

3.5버전 모델 파라미터 수 : 1750억개 (엄청난 양의 데이터가 필요, 이 데이터들을 빅데이터라고 부른다.)

4.0버전의 파라미터 수는 비공개되어 있습니다.

파라미터의 수가 많으면 많을수록 똑똑해집니다.

 

핵심기술

프롬프트 데이터셋 -> 초기 언어 모델(LLM) + 튜닝된 언어 모델(LLM,RLHF) -> 트랜스포머

 

즉, ChatGPT 서비스는 LLM + RLHF 라고 할 수 있습니다.

 

프롬프트 엔지니어링(질문)이 사용되어 초기 언어모델을 사람의 응답 기반으로 어텐션(Attention)할 수 있습니다.

어텐션(Attention) 개념은 ChatGPT가 앞에서 질문했던 내용을 기반으로 튜닝된 모델(대화내용 기억 및 공유)을 바탕으로 재응답을 하는 것입니다.

여기서 초기 언어모델 자체가 바뀌는게 아니라 해당 세션에 대해서만 튜닝(최적화)하는 작업이라는 것을 유의해야합니다.

 

어텐션의 예시 : 문장 번역

 

Zero-shot-learning(어텐션의 하위)

: 개와 고양이를 식별하는 모델 제작 -> 이 모델을 가지고 오리와 닭을 식별하는 문제에 적용 -> 당연히 원하는 결과값이 나오지 않는다.

이런 식으로 어떤 모델을 다른 데이터셋에 적용하는 것을 제로 샷 러닝이라고 부릅니다.

 

Hallucination (ChatGPT의 거짓말)

: 모르는 정보를 아는 것처럼 그럴듯하게 대답하는 것

인공지능이 주어진 데이터나 맥락에 근거하지 않은 잘못된 정보나 허위정보를 생성하는 것을 의미합니다.

 

Hallucination은 환각이나 환청을 뜻하는 정신의학용어에서 단어를 빌려왔습니다.

업계에서는 Ai가 처음부터 잘못된 데이터로 학습한 것을 원인으로 보고 있습니다.

 GPT와의 대화는 어텐션이고 항상 할루시네이션이 있을 수 있다고 생각하셔야합니다.

 

그래서 우리는 ChatGPT가 대답해주는 것들에 대한 검증과정을 거쳐야합니다.

 

 

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.