LINUX.ORG.RU

Гугол как-то странно парсит страницу форума

 


0

2

В кои-то веки решил нажать кнопку g+ в теме (вот в этой, если это кому интересно), а гугол в качестве картинки/описания предложил мне не собственно топик, а первого комментатора.

Я конечно понимаю, что это гугол виноват а не лор, но раз уж все равно тут прикрутили g+ функциональность, может довести дело до конца, и подправить структуру страницы так, чтобы гугол ее парсил нормально.

UPD: Потыкал «плюсадины» в разных темах. В большинстве случаев гугол парсит норм, и в описание попадает то, что нужно. хотя и неприятно что заглавие топика идет общим текстом со всем остальным. Довольно часто лагают аватарки - часто бывает ава первого комментатора, или вообще рандомная. И только изредка гугол в качестве описания берет какой-то рандомные коммент (даже не обязательно первый, может и из середины выволочь).

★★★★★

Последнее исправление: morse (всего исправлений: 1)

Да, действительно как-то не так автомат сработал. Попробую разобраться

maxcom ★★★★★
()

Похоже google плюет на свои же собственные рекомендации по использованию schema.org - я добавил разметку, а результата нет.

Зато понимает разметку opengraph (facebook). Пока получилось сделать две вещи - в title загнать заголовок без раздела и в image для галереи загнать собственно картинку, а не то что туда раньше попадало :)

С description надо отдельно думать, т.к. загнать туда весь текст топика вроде не правильно (если верить документации), а функции вытаскивания первого параграфа из текста у нас пока нету.

maxcom ★★★★★
()
Ответ на: комментарий от maxcom

Чего там разбираться, тот же самый og:image же.

Кстати, имеет смысл и og:url прописать, чтобы разные варианты с неканоническими URL за одну страницу считались.

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

Я как-то пробовал, но не вышло, но теперь я понял почему - маленькие картинки оно не любит. Сейчас туда чего-нибудь покрупнее всуну

maxcom ★★★★★
()
Ответ на: комментарий от KRoN73

приделал туда крупного пынгвына с прозрачным фоном. Выглядит странно, но все равно лучше чем радномный userpic

maxcom ★★★★★
()

Дык это разве не фича? Везде аватарки. Типа автор текста и всё такое.
В выдаче гугла тоже это постепенно вводят и везде user/аватар выводится в качестве картинки.

VictimOfLoveToLinux
()
Ответ на: комментарий от VictimOfLoveToLinux

Это может и фича, но работала она крайне криво.

То, что в выдаче гугла это другое - это специальная разметка для обозначения автора:

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=1408986

она делается по другому, в принципе такое можно и на lor сделать если кто-то хочет. Но придется тогда где-то указывать гугл-профиль, без него оно не работает

maxcom ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.