Cbp-translate
Cyberpunk 2077에 나온 실시간 번역 구현해보기
Features
- 게임에서 캐릭터가 외국어로 얘기하면, 그 캐릭터의 머리위에 원래 언어로 자막을 보여준 후 실시간으로 자신의 언어로 번역됨
- 이 기능을 DL 음성인식/얼굴인식등을 이용해서 구현해 본 코드와 동작방식 상세 소개
- OpenAI Whisper + NVDIA NeMo + DeepL + RetinaFace + DeepFace + Sckikit-learn + Gradio + Modal + PIL/OpenCV + ffpmpeg
동작방식
Cbp-translate-pipeline-diagram.png
- MTCNN/RetinaFace로 얼굴 위치를 추출. Modal로 병렬화해서 빠르게.
- DeepFace/Scikit-Learn 으로 각 얼굴에 임베딩 추출하고 유니크 ID 부여