Собственно, сабж. Думаю, что кто-то уже успел обратить внимание на функцию Reader в Safari, которая извлекает из страницы текст статьи и иллюстрацию, обрубая остальное. И работает в разы корректнее links/lynx/w3m. Почему?
На самом деле, Safari поддерживает эту фичу далеко не для всех сайтов. Как я понимаю, логика следующая. Есть несколько распространенных CMS (Joomla, Drupal, WordPress, MediaWiki, etc) и ряд популярных сайтов, которые написаны на своем движке. Для них пишут специальные шаблоны, которые показывают браузеру, как извлечь текст. Так например, работает как википедия, так и люркмор (но с рядом ошибок), но при этом иконка Reader возникает не везде.
Пишу это просто потому, что идея мне кажется интересной и реализовать ее проще - не нужно запариваться поддержкой всех стандартов. Как я понимаю, похожий принцип есть в surfraw, который содержит специальные интерфейсы к различным сервисам. Что еще сейчас делается на эту тему? Есть ли сейчас активно развивающиеся проекты на эту тему? links/lynx/w3m вроде не слишком динамично двигаются в последнее время