AI 붐이 아주 세차게 각 산업에 영향을 주고 미래가 어떻게 될지 지금은 상상하기 어려워지고 있어요.
그래서, 요즘 많이 언급되고 있는 초거대언어모델의 역사에 대해서 간단히 정리해봅니다.
인공지능, 딥러닝에서 초거대언어모델인 ChatGPT가 나오면서 요즘은 LLM이 가장 핫한 것 같아요.
용어가 나오니 먼저 LLM과 Open Source 개념 먼저 정리해봐요.
▣ 개념
① 초거대언어모델(LLM ,Large Language Model): 거대언어모델, 인간의 언어를 이해하고 생성하도록 훈련된 AI모델
② 오픈소스 (Open Source): 누구나 공짜로 쓸 수 있도록 공개된 소프트웨어 소스코드
그래서, ChatGPT부터 간단히 역사를 정리해보면 다음과 같아요.
▣ LLM 역사
2022-11-30 OpenAI의 ChatGPT 출시
2023-02-07 Microsoft의 Copilot 출시 (GPT 기반)
2023-03-00 Anthropic의 Claude 출시
2023-03-14 OpenAI의 GPT-4 출시
2023-03-21 Google의 Bard 출시 (Gemini 전신)
2023-06-27 Baidu의 Ernie Bot 출시
2023-11-04 xAI의 Grok 베타 출시
2024-02-13 ChatGPT Plus ($20/월) 출시
2024-02-20 Google의 Gemini 출시 (Gemini Ultra $20/월)
현재 기준으로30만개가 넘는 모델이 있다고 하고 그 중에서 좀 이름 있는 LLM 오픈소스만 공개 히스토리를 정리하면 다음과 같아요.
▣ LLM 소스 공개 역사
2020-06-11 OpenAI의 GPT-3 오픈소스 공개
2023-02-11 Meta의 LLaMA 출시
2023-03-14 OpenAI의 GPT-4 오픈소스 비공개
2023-07-18 Meta의 LLaMA2 출시 (Vicuna, Alpaca 파생형 LLM의 기반)
2023-09-27 Mistral AI의 Mistral 7B 출시
2023-12-11 Mistral AI의 Mistral 8x7B 출시
2024-02-21 Google의 Gemma 출시 (Gemini 기반)
▣ 개발자 입장에서는 소스코드 공개는 크게 3가지 이유로 사용한다고 합니다.
① 투명성: AI 모델이 어떻게 작동하는지 원리를 이해할 수 있다. 아키텍처, 트레이닝 데이터를 파악할 수 있다.
② 파인튜닝: 오픈소스에 특정기능을 추가할 수 있다. 특정목적, 특정데이터에 맞게끔. Meta의 LLaMA2에 기반한 오픈소스 모델들이 아주 많다.
③ 커뮤니티: 커뮤니티 다양한 개발자들과 다양한 사용법, 관점을 공유할 수 있다.
▣ 그리고, 기업 측면에서는 공짜로 소스코드를 배포하는 이유는 2가지로 볼 수 있고요.
① 대외적 이유: 지식과 기술의 민주화, AI 발전 가속화
② 진짜 이유: 본인 소스를 표준화하려는 것! 최고의 개발자들이 본인 소스를 사용하고 발전시키고 안착하게 만들려는 것.
아래 링크에서 Open AI 에 대해서 좀 더 자세히 알아 볼 수 있어요.
https://zondigy.tistory.com/492
Chat GPT 외에 다른 AI 서비스가 궁금하면 다음 링크 참고하세요.
https://zondigy.tistory.com/494
아이폰 사용자면 Chat GPT 앱 출시 소식 참고하세요.
https://zondigy.tistory.com/534
'아는 것이 힘 > IT세상' 카테고리의 다른 글
[건조기 관리]엘지 트롬 청소하기 (5) | 2024.09.26 |
---|---|
[터치펜]가성비 좋은 실크 펜슬(CP-PEN) 사용설명서 (34) | 2024.04.20 |
[BOSE] SOUNDLINK FLEX SE (가격, 사용설명서, 연결하기) (0) | 2023.12.17 |
[아이폰] 사라진 에어팟 한 쪽 유닛 찾기 (0) | 2023.12.17 |
[애플] 아이폰 15 모델별 특징 비교 가격 알아보기 (0) | 2023.10.13 |