Skip to content

SantaCoder

11억개(1.1B) 파라미터로 학습한 코드 생성 모델

Features

  • Python, Java, Javascript 코드로 학습한 멀티언어 랭귀지 모델
  • LTR 생성 및 Infilling에서 페이스북의 InCoder(6.7B) / 세일즈포스의 CodeGen-Multi (2.7B) 보다는 뛰어나다고
  • BigCode가 공개했던 The-Stack v1.1(6TB) 데이터셋의 일부를 사용

See also

Favorite site