DeepSeek
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., trading as DeepSeek, is a Chinese artificial intelligence company, based in Hangzhou, Zhejiang, that develops open-source large language models (LLMs). It is owned and funded by Chinese hedge fund High-Flyer, and was founded by Liang Wenfeng, who established the company in 2023 and serves as its CEO.
DeepSeek v3 vs GPT-4o vs 3.5 Sonnet
- 최종 평가
- 추론: Deepseek v3 > Claude 3.5 Sonnet > GPT-4o
- 수학: Deepseek v3 > Claude 3.5 Sonnet > GPT-4o
- 코딩: Claude 3.5 Sonnet > Deepseek v3 ~ GPT-4o
- 창작: Claude 3.5 Sonnet > Deepseek v3 ~ GPT-4o
- 누가 Deepseek v3를 사용해야 할까?
- 대부분의 작업에서 GPT-4o를 대체 가능
- 애플리케이션 구축한다면 최적. 비용 대비 성능이 뛰어나 사용자 애플리케이션 개발에 적합함
- Open-weight 여서 자체 호스팅 가능, 더 큰 제어권 제공
DeepSeek가 대규모에선 저렴하지만 로컬에서는 비싼 이유
DeepSeek-V3와 같은 일부 AI 모델은 대규모 제공 시 저렴하고 빠르지만 로컬 실행 시에는 느리고 비쌈.
- 그 이유는 GPU 활용 효율과 관련된 throughput(처리량)과 latency(지연시간) 의 근본적 트레이드오프에 있음.
- 배치 크기를 키우면 GPU가 효율적으로 동작하지만, 사용자는 토큰이 모일 때까지 대기해야 해 지연시간 증가 현상 발생
- Mixture-of-Experts 구조와 딥 파이프라인을 가진 모델은 높은 배치와 지연시간을 필요로 함
- 로컬 단일 사용자 환경에서는 충분히 큰 배치 형성이 어려워 성능 저하 및 비용 증가 문제 발생
- OpenAI, Anthropic 등은 아키텍처 자체의 효율화, 고도의 배치 전략, 또는 과도한 GPU 투입 등으로 빠른 응답을 구현
See also
- LLM
- DeepScaleR - RL을 활용한 1.5B 모델로 O1-Preview 능가하기
- DeepEP - an efficient expert-parallel communication library
- FlashMLA - Hopper GPU를 위한 효율적인 MLA 디코딩 커널
- DeepGEMM - FP8 행렬 곱셈(GEMM) 을 효율적으로 수행하는 라이브러리로, DeepSeek-V3에서 제안된 미세 조정 스케일링(fine-grained scaling) 방식을 지원함
- 3FS - DeepSeek의 분산 파일 시스템
Favorite site
- DeepSeek
- Github - deepseek-ai/DeepSeek-V3
- deepseek-ai/DeepSeek-V3-Base · Hugging Face
- DeepSeek - Wikipedia
- 딥시크, 오픈 소스 사상 최대 규모 LLM 출시..."GPT-4o 따라 잡았다" < 산업일반 < 산업 < 기사본문 - AI타임스
- AI 뉴스 - 역대급 오픈소스 딥시크 V3, o1 해킹 사건, AGI 정의, 페르소AI, 영상 AI 근황, 오픈AI 전환, 휴머노이드 로봇 발전 등 - YouTube
- Ollama에 공식 DeepSeek R1 등록 | GeekNews (ollama)
- [원문] deepseek-r1
- [원문] 1,156 Questions Censored by DeepSeek | promptfoo
- Promptfoo 팀은 이 CCP 검열 의심 콘텐츠를 평가하기 위해, 1,360개의 ‘민감 주제’ 질문을 담은 데이터셋을 만들었음
- 실험 결과, DeepSeek-R1은 이 중 약 85%의 질문을 거부하는 고정 답변(canned refusal)으로 응답함