Omni SenseVoice
Omni SenseVoice: High-Speed Speech Recognition with words timestamps π£οΈπ―
λ¨μ΄λ³ νμμ€ν¬ν κ°λ₯ν κ³ μ μμ± μΈμ
Features
- μλ μμ± μΈμ(ASR), μμ± μΈμ΄ μλ³(LID), μμ± κ°μ μΈμ(SER), μ€λμ€ μ΄λ²€νΈ κ°μ§(AED) λ±μ κΈ°λ₯μ κ°μΆ λ€κ΅μ΄ μμ± μ΄ν΄ λͺ¨λΈ SenseVoice κΈ°λ°
- μ΄κ³ μ μΆλ‘ κ³Ό μ νν νμμ€ν¬νμ μ΅μ νλμ΄ μμ΄ λ μ€λ§νΈνκ³ λΉ λ₯΄κ² μ€λμ€ νΈλμ€ν¬λ¦½μ μ μ²λ¦¬ν μ μμ
- μ£Όμ μ΅μ
-
--language
- μΈμ΄λ₯Ό μλμΌλ‘ κ°μ§/μ§μ (auto, zh, en, yue, ja, ko) -
--textnorm
- μ ν μ€νΈ μ κ·ν μ μ© μ¬λΆ μ ν(μ μ κ·νλ κ²½μ° withitn, μμ ν μ€νΈμ κ²½μ° woitn) -
--device-id
- νΉμ GPUμμ μ€ν(κΈ°λ³Έκ°: CPUμ κ²½μ° -1) -
--quantize
- λΉ λ₯Έ μ²λ¦¬λ₯Ό μν΄ μμνλ λͺ¨λΈμ μ¬μ©
-