SantaCoder
11억개(1.1B) 파라미터로 학습한 코드 생성 모델
Features
- Python, Java, Javascript 코드로 학습한 멀티언어 랭귀지 모델
- LTR 생성 및 Infilling에서 페이스북의 InCoder(6.7B) / 세일즈포스의 CodeGen-Multi (2.7B) 보다는 뛰어나다고
- BigCode가 공개했던 The-Stack v1.1(6TB) 데이터셋의 일부를 사용
11억개(1.1B) 파라미터로 학습한 코드 생성 모델