Написал бенчмарк, которые меряет производительность sendfile, sendfile по кускам и простые read/write.
Результаты одинаковы. Но ведь в последнем случае все вытягивается в userspace? В чем подвох? sendfile не нужен?
Но у меня в системе при этом похожие симптомы на 12309. Посмотрите у себя http://pastebin.com/xgQXd8Dh
Копипасту не ругать, так надо. Может размеры блоков порекомендуете или другие условияю.
P.S. Специально для троллей - sendfile честно и правильно вызывается, проверено strace