LINUX.ORG.RU

Генерация контента JavaScript'ом и индексация в Яндекс

 , , ,


2

1

Всем привет.

Кто прольёт свет на вопрос, умеет ли яндекс индексировать контент генерируемый яваскриптом? (в моём, конкретном, случае речь идет о backbone.js)

★★★

что значит генерируемый? информацию ты все равно откуда-то получаешь, есть же escape_ четотам для хешбенгов

trashymichael ★★★
()
Ответ на: комментарий от trashymichael

Он его получает не в html, не на всякий хешбенг ведет ссылка, не говоря уже о том, что при живом history api, иметь их стыдно.

zz ★★★★
()

А тебе надо, чтобы индексировал? Делай для поисковиков облегченную статику с ключевыми словами.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от trashymichael

что значит генерируемый? информацию ты все равно откуда-то получаешь, есть же escape_ четотам для хешбенгов

json массив.

VirRaa ★★★
() автор топика
Ответ на: комментарий от Eddy_Em

А тебе надо, чтобы индексировал? Делай для поисковиков облегченную статику с ключевыми словами.

Откуда брать ключевые слова? Данные на странице заполняются пользователями.

VirRaa ★★★
() автор топика
Ответ на: комментарий от VirRaa

Раз в N времени генерируй на основе БД.

А еще проще — генерируй для поисковиков (переправляй запросы от поисковиков на CGI).

Хотя, нет: по таймеру генерировать и хранить статику дешевле будет, если тебя поисковые роботы часто посещают.

А вообще, ХЗ: к тебе как часто поисковые боты заходят? И какая посещаемость? В общем, давай информацию.

Eddy_Em ☆☆☆☆☆
()
Последнее исправление: Eddy_Em (всего исправлений: 32)
Ответ на: комментарий от VirRaa

короче, обычно бекбон используется в одностранчных приложениях, приложениях, тоесть не страницах, там индексироват нечего: формы, админки, яхз, что-то другое стремное, аналитика, что угодно короче, если нужно индексация — для этого и есть эти ескейпед урл, как я понимаю, направив гугл хотя-бы на точку входа, можно ожидать что он проиндексирует выс^Wвыхлоп жаваскрипта, по крайней мере ходят такие слухи. я, используя технологию по назначению, просто не сталкивался с такой задачей. моглу лишь добавить. что гугл заходит на мой сайт, на страницу полностью написанную на бекбоне, но у нее все равно есть ключевые слова и тайтл, так как какая-то разметка должна инициировать скрипт. что он там видит я не знаю, не инетересовался.

trashymichael ★★★
()
Ответ на: комментарий от zz

Обработай событие «Вернуться назад» без перескакивания позиции страницы. Причём, именно назад, а не вперёд.

anonymous
()
Ответ на: комментарий от zz

Немного не осилил о чем идет речь.

Нажми «Назад» в браузере и отлови это событие в JS до того, как браузер проскроллит страницу к позиции, на которой находился на этой самой предыдущей странице.

А также попробуй в том же JS отличить нажатие на кнопку «Назад» от нажатия на кнопку «Вперёд».

Двумя примитивными методами History API на все случаи жизни не обойдешься.

anonymous
()
Ответ на: комментарий от anonymous

А также попробуй в том же JS отличить нажатие на кнопку «Назад» от нажатия на кнопку «Вперёд».

Зачем?

Нажми «Назад» в браузере и отлови это событие в JS до того, как браузер проскроллит страницу к позиции, на которой находился на этой самой предыдущей странице.

Делай replace state мы все-такив подветке про хешбанги в юрле.

zz ★★★★
()
Ответ на: комментарий от Eddy_Em

Раз в N времени генерируй на основе БД.

А еще проще — генерируй для поисковиков (переправляй запросы от поисковиков на CGI).

Хотя, нет: по таймеру генерировать и хранить статику дешевле будет, если тебя поисковые роботы часто посещают.

А вообще, ХЗ: к тебе как часто поисковые боты заходят? И какая посещаемость? В общем, давай информацию.

Посещаемость огромная. 600 тысяч уникальных, в день.

VirRaa ★★★
() автор топика
Ответ на: комментарий от trashymichael

но у нее все равно есть ключевые слова и тайтл

У меня тоже ключевые слова и тайтл есть. Вопрос в том, что основной контент, генерируется из коллекции, а коллекция приходит с сервера (во вопемя рендера страницы) в виде JSON.

VirRaa ★★★
() автор топика
Ответ на: комментарий от Eddy_Em

А боты поисковые часто ходят?

Да, часто.

VirRaa ★★★
() автор топика
Ответ на: комментарий от boombick

Я вот только не понял оттуда, GWT они уже по дефолту парсят нормально, что ли?

GateKeeper ★★
()
Ответ на: комментарий от VirRaa

ну сделай простой хтмл, буквально семантику, для поисковиков, а при включенном яваскрипте запускай клиент, скрывай ссылку на эти страницы, хрен знает, json -> html это же элементарная задача

trashymichael ★★★
()
Ответ на: комментарий от zz

Зачем?

Вопрос десятый. Может у меня веб-приложение, которое работает без перезагрузки страниц, а раз это веб-приложение, у него могут быть свои понятия о навигации.

Делай replace state

Как это поможет странице не скакать?

anonymous
()
Ответ на: комментарий от zz

Гугл тоже не умеет.

Этот, как раз, умеет. Хотя и не безупречно.

KRoN73 ★★★★★
()
Ответ на: комментарий от trashymichael

а при включенном яваскрипте запускай клиент, скрывай ссылку на эти страницы

Главное — не подсовывать поисковым ботам отдельные варианты страниц по тем же адресам. Они этого недолюбливают, могут и рейтинг опустить и, вообще, забанить.

KRoN73 ★★★★★
()
3 января 2014 г.

Подниму тему из небытия, поскольку по этой тематике гуглится именно она, а внятного контента почти нет.

Индексация сгенерированного контента у гугла работает, у яндекса тоже работает, но немного хуже. Думаю, через год это будет уже не актуально, но пока подстаховаться стоит.

Есть у гугла вот такой мануал https://developers.google.com/webmasters/ajax-crawling/docs/getting-started

У яндекса всё работает аналогично, но документация скуднее. http://help.yandex.ru/webmaster/robot-workings/ajax-indexing.xml

Для хэш-навигации курить его можно долго, но если используется history api, то достаточно добавить в хтмл мету <meta name=«fragment» content="!«> и поисковики будут ходить за контентом этих страниц по ссылке с пустым GET параметром _escaped_fragment_ (напр. site.ru/some/url?_escaped_fragment_= )

Дальше нужно сделать так, чтобы по этим ссылкам отдавался уже отрендеренный хтмл. Для создания снапшотов страниц можно использовать PhantomJS. Под некоторые популярные фреймворки можно найти готовые решения.

Есть нюанс: снапшоты в реальном времени создаются довольно долго, а для индексации это плохо. Поэтому имеет смысл написать скрипт, который будет с некой периодичностью делать новые снапшоты и кэшировать их.

А ещё снапшоты можно использовать для редиректа клиентов, у которых эти ваши бэкбоны не работают.

Bogatkin
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.