Набор голосовых данных Mozilla Common Voice 18

common voice, voice, распознавание речи, синтез речи

0

1

Mozilla объявила о выпуске 18-го набора данных Common Voice, который теперь доступен для скачивания. Этот набор данных является частью стратегии Mozilla по обеспечению более широкого доступа к голосовым технологиям. Он представляет собой бесплатный набор данных многоязычных голосовых фрагментов и связанных с ними текстовых данных, который распространяется под лицензией CC0 (общественное достояние). Создание набора данных — это совместная работа сообщества, включая участников, предоставляющих голос и текст, активистов в области языков, технологов, ученых и других членов сообщества Common Voice.

Общий объем набора данных Common Voice достиг 31 841 часа, из которых 20 789 часов речевых данных проверено сообществом. Это на 700 часов больше речевых данных по сравнению с последним выпуском набора данных и на 381 час больше новых проверенных данных. 18-й набор данных состоит из фрагментов на 129 языках, включая 5 новых языков, добавленных в этом выпуске.

В новом наборе данных представлены пять новых языков: Коса (Xhosa, ЮАР), Календжин (Kalenjin, Кения), Дабида (Kidaw’ida, Кения), Долуо (Dholuo, Кения и Танзания) и Тсва́на (Setswana, Ботсвана, Зимбабве, Намибия, ЮАР). На этих языках говорят сотни миллионов людей по всему миру, которые теперь могут получить более качественную поддержку в области голосовых технологий.

Если вы заинтересованы в Common Voice, есть множество способов присоединиться к сообществу участников. Вы можете поделиться своим голосом или написать и внести оригинальные предложения на своем языке, чтобы помочь создать следующий набор данных. Если вашего языка еще нет в Common Voice, вы можете запросить его добавление с помощью специальной формы. Также приветствуются технические вклады в открытый проект на Github.

Mozilla всегда рада получать отзывы о новых выпусках. Вы можете связаться с ними на форумах Common Voice, пообщаться с ними в Matrix или написать команде напрямую по адресу commonvoice@mozilla.com. Они особенно заинтересованы в изучении того, что пользователи наборов данных создают или исследуют с использованием набора данных. Лучшее понимание потребностей пользователей наборов данных может помочь им определить направление, которое лучше отвечает потребностям пользователей.

>>> Подробности

Ссылка

←	Умер Larry Finger

Budgie 10.9.2

→

Эти языки говорят сотни миллионов людей

На этих языках …

dataman ★★★★★
(23.06.24 14:00:33 MSK)

Ответ на: комментарий от dataman 23.06.24 14:00:33 MSK

«Эти языки говорят: сотни миллионов людей...» ;)

Somebody ★★★
(24.06.24 05:51:54 MSK)

Ссылка

Ответ на: комментарий от dataman 23.06.24 14:00:33 MSK

Да, на этих языках, говорят, сотни миллионов людей.

LightDiver ★★★★★
(24.06.24 08:55:13 MSK)

Ссылка

Было бы интереснее понять сколько часов там собрано на основных европейский языках и на русском.

Xintrea ★★★★★
(24.06.24 11:31:42 MSK)

Ответ на: комментарий от Xintrea 24.06.24 11:31:42 MSK

Было бы интереснее понять сколько часов там собрано на основных европейский языках и на русском.

На русском — 277 часов, 238 из которых проверено.

На английском, очевидно, больше всего: 3554 часа, 2640 проверено.

На остальных европейских — выбирайте интересующий язык тут и смотрите.

CrX ★★★★★
(24.06.24 11:34:53 MSK) автор топика

Ссылка

Бесит лицемерие этих Мозил (и иже с ними). Сами занимаются борьбой за рынок. А выдают это за благотворительность.

стратегии Mozilla по обеспечению более широкого доступа к голосовым технологиям. Он представляет собой бесплатный набор

Здесь смысл имеет только

более широкого

В плане экспансии.

Лучшее понимание потребностей пользователей наборов данных может помочь им определить направление, которое лучше отвечает потребностям пользователей.

Тут уже потребности пользователей аж два раза повторили.

Писали бы уже сразу – анализ гоев с целью прогрева.

thegoldone ★★
(24.06.24 23:46:23 MSK)

Ссылка

ЯННП. Что это?

У меня есть текст. Я могу его озвучить с помощье этой штуки?

Зачем это? Как его используют?

blex ★★★
(25.06.24 08:46:42 MSK)

Ответ на: комментарий от blex 25.06.24 08:46:42 MSK

У меня есть текст. Я могу его озвучить с помощье этой штуки?

Если напишешь ещё и программу-говорилку, то да. Тут только данные, а не программа.

Зачем это? Как его используют?

Голоса в общественном достоянии (CC0), проверенные, и размеченные, где какой текст говорится, которые ты можешь использовать как хочешь, например, наиболее очевидное — в своей программе-говорилке, не привлекая кучу людей за зарплату и не боясь, что на тебя кто-то подаст в суд за то, что ты «украл» его голос. Помимо этого, можно это использовать для обучения распознавалки речи или ещё чего-то подобного.

CrX ★★★★★
(25.06.24 09:45:37 MSK) автор топика