6 января состоялся выпуск 1.7.4 высокопроизводительной системы автоматического распознавания речи whisper.cpp, реализующей модель Whisper от OpenAI, написанной на языках C и C++ и распространяемой по лицензии MIT.
В проекте используется авторская тензорная библиотека машинного обучения GGML, написанная на языке C и оптимизированная для использования различных бэкендов (CUDA, Vulkan, BLAS, SYCL, OpenCL и др.).
Список изменений:
- Переименования исполняемых файлов:
main -> whisper-cli
bench -> whisper-bench
stream -> whisper-stream
command -> whisper-command
server -> whisper-server
talk-llama -> whisper-talk-llama
- Удалены примеры
talk
иtalk.wasm
. - В
whisper-server
добавлена опция подавления неречевых лексем. - Параметр
suppress_non_speech_tokens
переименован вsuppress_nst
. - В API и утилиты добавлена опция
no_speech_thold
для задания вероятности отсутствия речи на уровне сегмента при транскрипции. - В
whisper-cli
добавлена опция--suppress_nst
. - Другие улучшения и исправления ошибок.