LLaMA
Meta가 공개한 65b 파라미터 LLM
Cateogries
- Llama 2 - Meta, 차세대 언어모델 Llama 2 공개
- Llama 3 - Meta, 차세대 언어모델 Llama 3 공개
- Llama 3.1
- Llama 3.2 - Revolutionizing edge AI and vision with open, customizable models (메타가 '라마' 시리즈 중 이미지와 텍스트를 모두 이해하는 첫번째 대형멀티모달모델(LMM)을 출시했다)
- Llama 3.3 - 70B로 이제 GPT-4급 모델을 노트북에서 실행가능
- nano-llama31 - nanoGPT 스타일의 Llama 3.1 버전
Features
- 7B, 13B, 33B, 65B 의 4가지 사이즈로 공개
- 훨씬 작은 규모지만, 데이터 학습 강화 및 파인 튜닝하여 더 큰 규모의 모델과 비교가능한 효율적인 모델
- 33B/65B는 1조 4천억개의 토큰으로 훈련됨(7B는 1조)
- "13B 모델이 175B인 GPT-3보다 뛰어나고, 65B는 훨씬 더 큰 Chinchilla70B 및 PaLM-540B 와 경쟁 가능"
- 인공지능 연구등 비상업적 용도로만 활용 가능(신청하여 승인 필요)
Downloads
- Meta의 LLaMA 모델이 토렌트로 배포중 | GeekNews
- Github - shawwn/llama-dl: High-speed download of LLaMA, Facebook's 65B parameter GPT model
Linux:
curl -o- https://raw.githubusercontent.com/shawwn/llama-dl/56f50b96072f42fb2520b1ad5a1d6ef30351f23c/llama.sh | bash
참고로 내가 answerver 에서 다운받았을 때 걸렸던 시간은 약 157분 이며, 220G 용량을 차지했다.
See also
- Meta (Facebook)
- GPT-3
- ChatLLaMA - LLaMa 기반 ChatGPT의 오픈소스 구현체
- llama.cpp - 페이스북의 LLaMA 모델을 순수 C/C++로 추론하기
- Alpaca - GPT-3.5 수준의 강력한 오픈소스 Instruction-Following 모델
- Dalai - LLaMA를 당신의 컴퓨터에서 가장 간단히 실행하는 방법
- Code Alpaca - 코드 생성 명령으로 훈련된 LLaMA
- Simple LLaMA Finetuner - 초보자도 쉽게 LLaMA-7B를 파인 튜닝 할수 있게 해주는 간단하고 직관적인 UI 도구
- Lit-LLaMA - nanoGPT 기반 오픈소스 LLaMA 구현체
- GPT4All - LLaMA 기반으로 800k 명령셋으로 훈련된 챗봇
- xturing - 나만의 LLM을 만들고 제어하기
- Koala - 학술 연구를 위한 대화형 모델 (LLaMA기반 챗봇)
- RedPajama - LLaMA 데이터셋을 재작성하는 오픈소스 프로젝트
- llama-tokenizer-js - 브라우저에서 실행되는 LLaMA 토크나이저
- Lag-llama - 시계열 예측을 위한 첫번째 오픈소스 파운데이션 모델
- Llama.vim – LLM을 이용한 VIM용 코드/텍스트 자동완성 플러그인
Favorite site
- Introducing LLaMA: A foundational, 65-billion-parameter language model
- LLM에 Stable Diffusion Moment가 오고 있다 | GeekNews
- [원문] A brief history of LLaMA models - AGI Sphere
- LLaMA - (7B, 13B, 33B, 65B), CommonCrawl/C4/GitHub/Wikipedia/Gutenberg & Book3/ArXiv/StackExchange
- Alpaca - 52k GPT-3 instructions
- Vicuna - 70k ChatGPT conversations
- Koala - 117k cleaned ChatGPT conversations
- GPT4-x-Alpaca - 20k GPT4 instructions
- WizardLM - 70k instructions synthesized with ChatGPT/GPT-3
- OpenAssistant - 600k human interactions (OpenAssistant Conversations)