Мне понадобилось добавить к стандартным полям Recoll значения, не заданные в метаданных документа.
Допустим, есть такой документ:
<html>
<head>
<meta name="author" content="Kosenko" />
<meta name="m:author" content="Maverik" />
<title>An Example</title>
</head>
<body>
Example
</body>
</html>
Здесь поле author является стандартным, а m:author --- пользовательским. Чтобы задать это поле, в
fields указывается:
[prefixes]
m:author=XYMA
[stored]
m:author=
Предположим также, что это результат обработки, например, pdf-файла, исправлять который я не хочу или не
могу. Мне нужно добавить значение Constructor к полю author и значение Eugine к полю m:author.
Для этого в recoll.conf помещается объявление вида:
[~/study/recoll/metadata/trial]
metadatacmds = ; author = echo "Constructor"; m:author = echo "Eugine";
Логично ожидать, что теперь после индексации приведенного документа в поле author будет записано
«Kosenko - Constructor». а в поле m:author --- значение «Maverik - Eugine». Однако оказывается, что
поле «m:author» приняло ожидаемое значение, а поле author --- нет. В нем прописывается только
внутреннее значение Kosenko, полученное в результате обработки самого документа. Внешнее значение,
заданное командой metadatacmds, не добавляется.
Интересно, что если добавить в документ еще один метатэг, например, так:
<meta name="author" content="Constructor" />
то это значение добавляется к полю, но без дефиса-разделителя: «Kosenko Constructor». Это поведение
одинаково как для стандартных, так и для пользовательских полей. А вот если к полю m:author добавить
еще одно внешнее значение, скажем, так:
[~/study/recoll/metadata/trial]
metadatacmds = ; m:author = echo "Eugine"; m:author = echo "Creator";
то последнее значение в последовательности просто перекрывает все предыдущие.
Пока что я спасаюсь тем, что использую только поле m:author (собственно, по описанной причине и
потребовалось еще одно поле для автора), а поле author объявляю его синонимом. Наоборот не получается
--- при индексации синоним m:author вначале приводится к каноническому имени author, а затем все
происходит так же, как и раньше. В результате все значения объединяются как надо, но: во-первых, поле
author в таком случае вообще не заполняется, а во-вторых, искусственное имя для стандартного атрибута
--- это некрасиво.
Непонятно, в чем тут принципиальное отличие в значениях стандартных и пользовательских полей, и можно ли
его преодолеть, не ковыряясь в исходниках?