История изменений
Исправление ergo, (текущая версия) :
Ты про примитивные «обученные» модели для улучшения фоточек?
примитивные? )))
распознование речи - эти модели, наверное, на порядок сложнее путь прошли, в сравнении с моделями для фотографий. 10 лет назад поработал в стартапе, где разрабатывали распознование речи. в ту пору речь от диктора распознавалась с точностью где-то 78% , что было очень круто и справлялся с этой задачей отдельный комп с кудой на 670ой нвидиа и цпу с 12Мб кеша (это топовый по тем временам камень, модель не вспомню). такой комп умел максимум 4 стрима распознавать. Теперь даже простой телефон очень круто с этим справляется и явно не с дикторской речью.
переводчик - та же история.
могу лишь заключить, что какое-то у вас очень примитивное представление об объемах данных, которые перелопатили эти модели прежде, чем стать таковыми.
Исправление ergo, :
Ты про примитивные «обученные» модели для улучшения фоточек?
примитивные? )))
распознование речи - эти модели, наверное, на порядок сложнее путь прошли, в сравнении с моделями для фотографий. 10 лет назад поработал в стартапе, где разрабатывали распознование речи. в ту пору речь от диктора распознавалась с точностью где-то 78% и цпу с 12Мб кеша (это топовый по тем временам камень, модель не вспомню), что было очень круто и справлялся с этой задачей отдельный комп с кудой на 670ой нвидиа. такой комп умел максимум 4 стрима распознавать. Теперь даже простой телефон очень круто с этим справляется и явно не с дикторской речью.
переводчик - та же история.
могу лишь заключить, что какое-то у вас очень примитивное представление об объемах данных, которые перелопатили эти модели прежде, чем стать таковыми.
Исправление ergo, :
Ты про примитивные «обученные» модели для улучшения фоточек?
примитивные? )))
распознование речи - эти модели, наверное, на порядок сложнее путь прошли, в сравнении с моделями для фотографий. 10 лет назад поработал в стартапе, где разрабатывали распознование речи. в ту пору речь от диктора распознавалась с точностью где-то 78% и цпу с 12Мб кеша (это топовый по тем временам камень, модель не вспомню), что было очень круто и справлялся с этой задачей отдельный комп с кудой на 670ой нвидиа. такой комп умел максимум 4 стрима распознавать. Теперь даже простой телефон очень круто с этим справляется и явно не с дикторской речью.
переводчик - та же история.
могу лишь заключить, что какое-то у вас очень примитивное представление об объемах данных, которые перелапатили эти модели прежде, чем стать таковыми.
Исходная версия ergo, :
Ты про примитивные «обученные» модели для улучшения фоточек?
примитивные? )))
распознование речи - эти модели, наверное, на порядок сложнее путь прошли, в сравнении с моделями для фотографий. 10 лет назад поработал в стартапе, где разрабатывали распознование речи. в ту пору речь от диктора распознавалась с точностью где-то 78%, что было очень круто и справлялся с этой задачей отдельный комп с кудой на 670ой нвидиа. такой комп умел максимум 4 стрима распознавать. Теперь даже простой телефон очень круто с этим справляется и явно не с дикторской речью.
переводчик - та же история.
могу лишь заключить, что какое-то у вас очень примитивное представление об объемах данных, которые перелапатили эти модели прежде, чем стать таковыми.