LINUX.ORG.RU

IBM продолжает развивать технологии речи для встраиваемых устройств.


0

0

Согласно статьям в PC Magazine http://www.pcmag.com/article2/0,1895,... и на www.eweek.com http://www.eweek.com/article2/0,1759,... от 24 и 25 января 2006 года IBM существенно улучшила и обновила собственную технологию распознования речи для встраиваемых устройств. Заявлена доступность пакета Встроенный ViaVoice 4.4 для GNU/Linux. В подробностях, мой довольно "сырой" перевод собирательной информации на основе статей.

>>> Подробности

★★

Проверено: Dimez ()

Кстати, конечно и естественно идею они у меня не уводили, однако порадовало вот такое совпадение:
1. Картинка, которую я нарисовал, предлагая рассмотреть концепцию портативного компьютера, с частично речевым интерфейсом: http://www.osrc.info/forum_viewtopic.php?17.1912
2. Фото из статьи IBM о развитии встроенных речевых технологий: http://common.ziffdavisinternet.com/util_get_image/11/0,1425,sz=1&i=11784...

Так же указанные в теме статьи слегка опровергают скептическое отношение некоторых :) к речевому управлению (вот здесь отрывки из старой конференции (примерно май 2005), где мы так же речь обсуждали: http://www.teleology.ru/1/viewtopic.php?id=70 ).

domenick ★★
() автор топика
Ответ на: комментарий от domenick

>Кстати, конечно и естественно идею они у меня не уводили, однако порадовало вот такое совпадение:

вы меня, уважаемый domenick, извините, но вы определенно путаете обычные очки и ваш "головной монитор стереоизображение" :)))

наушников там тоже незаметно?

а эти красные точечки на вашем рисунке - это электроды вживленные в мозг??? >8-[o]

короче вашей идеей и не пахнет в http://common.ziffdavisinternet.com/util_get_image/11/0,1425,sz=1&i=11784...

ЗЫ: "ваша идея" родилась задолго до вас и обсасывается уже в миллионный раз ;)

AcidumIrae ★★★★★
()
Ответ на: комментарий от AcidumIrae

>вы меня, уважаемый domenick, извините, но вы определенно путаете обычные очки и ваш "головной монитор стереоизображение"

Вы, не менее уважаемый :) , AcidumIrae беретесь судить недостаточно полно осмылив идею (причем сходу в довольно агрессивной манере (не обижайтесь, пожалуйста), однако, это мы также проходили уже задолго до Вас и также не в первый раз :) ).

"Наш" головной монитор на нашем наброске лишь обозначает общую идею. Головные мониторы - вполне (и снова - довольно давно) состоявшийся продукт. Более того существуют различные виды головных мониторов, например: с/без возможности изменения прозрачности экрана/экранов; ретинальные дисплеи и другие.

На наш взгляд, не увидев на данной фотографии http://common.ziffdavisinternet.com/util_get_image/11/0,1425,sz=1&i=11784...что на человеке головного монитора - судить, что мы путаем его с обычными очками - по меньшей мере странно, согласитесь. Тем более, судить так однозначно категорично.

>наушников там тоже незаметно?
Смотрите внимательно. Что за устройство (как не монофонический наушник :), в крайнем случае микрофон :) ) тогда, на Ваш взгляд, удерживает тонкий металлический обод на голове изучаемого персонажа с фотографии? :) И к чему тянется проводок отчетливо выделяющийся на фоне рубашки на фото?

>а эти красные точечки на вашем рисунке - это электроды вживленные в мозг??? >8-[o]
Рекомендую Вам лучше ознакомиться с Brain User Interface системами. Красные точки на наброске _символизируют_ :) прикрепляемые (специально для Вас - _невживляемые_, _невстраиваемые_, _невсверливаемые_, а именно прикрепляемые) например, к голове обычные медицинские датчики (могут быть разными) указанной системы.

>короче вашей идеей и не пахнет в http://common.ziffdavisinternet.com/util_get_image/11/0,1425,sz=1&i=11784...
Я не буду сейчас нудно описывать общую идею. Ваше право - не видеть совпадения. Знаю уже несколько человек, которые с Вами не согласятся.

Иллюстрируя речевое взаимодействие, на данной фотографии ввод/вывод звука предполагаются. Надеюсь, с этим Вы не будете спорить. Часть системы выведена(тянется провод) ближе к голове сотрудника (как на моем эскизе), PDA (правда один и с ЖК дисплеем закреплен на руке сотрудника ровно также, как и на моем эскизе) и для речевого взаимодействия используется _именно_ PDA (показано, что его мощности (вероятно, HP 4700) хватает (если конечно IBM несколько не лукавит...)- это Вы называете "идеей и не пахнет...", нда... :)

>ЗЫ: "ваша идея" родилась задолго до вас и обсасывается уже в миллионный раз
Так легче всего говорить, когда "витающая в воздухе" и, на первый взгляд, довольно очевидная вещь получает реальное воплощение. На фотографии есть довольно грубый прототип (как обычно и бывает в начале) лишь обозначающий направление развития. Поверьте, я знаком с большим количеством реализаций/частей носимого компьютера.

Новое в предложенном мной варианте Вы не заметили, а в существующем не нашли сходства. Все это довольно хорошо соответствует духу Вашего комментария :). Время нас рассудит...

domenick ★★
() автор топика
Ответ на: комментарий от domenick

Если я правильно понял субж, ребята из IBM немного схитрили - они использовали речевые шаблоны, адаптированные к environment автомобиля, выдав это совершенно стандартное в практике SR решение за некий прорыв. ИМХО, здесь имеет место одно из двух: либо предыдущие спецы до этого не додумались, либо народ просто бьется за место под солнцем.

aist1 ★★★
()
Ответ на: комментарий от aist1

>они использовали речевые шаблоны, адаптированные к environment автомобиля, выдав это совершенно стандартное в практике SR решение за некий прорыв.

Я, конечно, гораздо хуже тебя разбираюсь в вопросах распознавания речи, но, откровенно говоря, в данном случае считаю, что, скорее всего, было так, как ты говоришь.

domenick ★★
() автор топика
Ответ на: комментарий от domenick

>Вы, не менее уважаемый , AcidumIrae беретесь судить недостаточно полно осмылив идею (причем сходу в довольно агрессивной манере

:)

представьте - читаете вы спокойно газету, а тут радостная новость: "они изобрели самокат!!! посмотрите как он похож на изобретенный мной велосипед!!!"

так понятно? ;) кулибин вы наш :)

AcidumIrae ★★★★★
()
Ответ на: комментарий от AcidumIrae

>так понятно? ;) кулибин вы наш :)

Понятно, понятно :), дотошный Вы наш :) .

domenick ★★
() автор топика

Чем ссориться по пустякам, лучше расскажите, есть что либо для распознования речи под линукс у IBM или таки нет?

Имеется ввиду, чтоб скачать и попробовать, а не вообще...

AVL2 ★★★★★
()
Ответ на: комментарий от AVL2

> Имеется ввиду, чтоб скачать и попробовать, а не вообще...

С распознаванием речи ситуация пока что где угодно не слишком ушла от "вообще" - скачать-то можно, да вот пробовать по большому счету нечего.

anonymous
()
Ответ на: комментарий от AVL2

Я, например, совсем не горю желанием качать и пробовать настольные решения, потому что представляю уровень ожидаемого результата. С встраиваемыми системами всё еще хуже, так как они расчитаны на работу в среде с высоким уровнем шума. А алгоритмы-то одни и те же в обоих случаях.

Не стоит ждать прорыва в области распознавания образов прежде прорыва в области ИИ и понимания механизмов обработки информации в головном мозге. Обратный сценарий, имхо, маловероятен.

aist1 ★★★
()
Ответ на: комментарий от AcidumIrae

>представьте - читаете вы спокойно газету, а тут радостная новость: "они изобрели самокат!!! посмотрите как он похож на изобретенный мной велосипед!!!"

http://offline.computerra.ru/2006/623/248711/
>Иерархическая структура модели "память-предсказание" имеет много общего с парадигмой ООП, которая тоже базируется на эксплуатации иерархических структур. Не кажется ли вам, что предложенные вами подходы уже адаптированы компьютерщиками - пусть и неявно?
- Новые теории обычно стоят на плечах старых теорий. Другими словами, ничто не ново под луною. Конечно, иерархические структуры, математические описания неокортекса и даже идея предсказаний - все это не ново. Но верная теория отличается от неверной тем, что в первой те же самые - пусть уже знакомые - кусочки головоломки собраны в правильном порядке.

domenick ★★
() автор топика
Ответ на: комментарий от domenick

Ну что же так господа всё удручающе звучит, раньше мощности компа не позволяли проводить многоразовые сравнения воспрминимаемых звуков и отличать от них речь а уж потом различать и саму речь, то сейчас ситуация немного изменилась :) , просто еще пару месяцев народ в высокооплачиваемых корпорациях подведет 2+2, а мы немного подождем и с исходничков состряпаем :)

П.С. Ссорится не надо, люди судя по ввинчиваемым тезисам и фопамм речим не молодые, а все как дети - моё нет мое нет не твое..... :)

Shark717
()

Вовсе я с AcidumIrae не ссорился :) . Наоборот - так бодро подискутировали - скорее даже весело :), мне понравилось (я сторонник того, что каждый имеет право на свое мнение).

domenick ★★
() автор топика

В бимерском "полумухе" под названием "Мерин" всё это было. Только где сейчас этот бимерский полумух под названием "Мерин"?:)

Клоуны-маркетологи из ИБМ, млин.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.