Apache Software Foundation анонсировал выход Hadoop 2.2, платформы для параллельной обработки больших объемов данных и параллельных вычислений. Версия 2.2 стала первой стабильной версией в семействе 2.x.
Основные новинки Hadoop 2.x:
- YARN — новая платформа управления задачами и ресурсами кластера, расчитанная на одновременный запуск различных приложения на кластере. Помимо Map-Reduce приложений, ядро теперь поддерживает поточные приложения, приложения баз данных, серверы для выполнения интерактивных запросов и т.п. Подробности о отличии новой архитектуры от 1.x можно прочитать в анонсе в блоге компании Hortonworks.
- NameNode, центральный индекс узел файловой системы HDFS, обзавелся собственными средствами обеспечения высокой доступности. В прошлых версиях NameNode являлась единой точкой отказа, и для повышения его надежности использовались сторонние решения
- NameNode теперь может быть разделен на несколько узлов, обслуживающих различные пространства имен
- HDFS, файловая система Hadoop, теперь так же доступна через NFSv3
- Поддержка снапшотов HDFS
- Поддержка шифрования трафика между узлами
- Различные улучшения производительности
>>> Подробности