Сейчас пишу диплом, потом буду писать на магистерку, проведу много research. Меня заинтересовали исследования систем на пример Apache Hadoop и HDFS. Есть некоторые наработки похожей системы со своими особенностями, но пока что в нормальное тестирование выкладывать не хочется. Когда приобретет форму и четко оформленные концепции, тогда обязательно выложу в открытый доступ. На данный момент меня просто интересуют потенциальные оптимизации и повышение масштабируемости, много экспериментирую. Озвучивать пока все что есть не буду, но уже есть хороший сетевой стек на основе polling, сериализация на базе Google Protobuf, кеширование на EhCache, максимальное количество операций асинхронные, HTTP доступ через встроенный Jetty к файлам через любой нод с поддержкой ranges, система репутации нодов, RPC. Добавлю потом автоконфигурацию через UDP мультикаст, кластеризируемый трекер на MongoDB, DHT, прохождение NAT, FUSE доступ, больше и качественнее кеширование, улучшения в балансировке сети, безопасность, подписывание блоков т.д. И конечно MapReduce, хотя его уже можно тестировать на базе одной функции waitForFileAndOpen ) На данный момент эта штука на всех уровнях обростает асинхронщиной.
Сейчас вместо абстрактного «filesystem» хотелось бы переименовать во что-то человеческое. У кого есть желание, можете предложить название для возможно успешного опенсорц проекта. Примеры стильных названий можно смотреть на этой странице