LINUX.ORG.RU
ФорумTalks

Более уникальная замена ISBN

 


1

1

Видел недавно тему, где человек спрашивал за прогу для каталогизации его книг. Я примерно так же записываю название автора, год издания и ISBN для прочитанных, чтобы не перечитывать через много лет полностью, а только если новые издания и только то что изменилось. А вот вчера в Педивикии нашёл неприятный факт. Оказывается у одной и той же книги, если это электронное издание, в мягкой или твёрдой обложке, то будет 3 разных ISBN. А существует ли некий более уникальный способ идентификации книг, но строго по содержимому, без учета носителя? То есть наоборот, чтобы было не важно, какая обложка, электронная версия или нет, если это одна и та же книга, то она бы имела один и тот же номер. А ещё чтобы это было международное, то есть не только в России или наоборот не только вне. Желательно чтобы и переводы как то можно было соотнести с оригиналом, то есть если оригинал имеет номер 12345, то перевод будет например 12345-6

Двадцать лет ушло на то, чтобы пронумеровать просто буквы в utf8, а ты сразу книги хочешь.

Irma ★★
()

А существует ли некий более уникальный способ идентификации книг, но строго по содержимому, без учета носителя? То есть наоборот, чтобы было не важно, какая обложка, электронная версия или нет, если это одна и та же книга, то она бы имела один и тот же номер.

Так это ж, получается, наоборот, менее уникальный, а не более уникальный.

Вроде нет такого.

Вообще на деле зачастую как минимум у электронной и бумажной версии один и тот же ISBN, по моему опыту.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

один и тот же ISBN, по моему опыту.

Наверное электронная являлась сканом бумажной, тогда да. Я тоже часто именно такие электронные читаю. Во всяком случае в педивикии четко написано что у е-буки и бумажной отличаться будут.
А поэтому мне как то все равно какая обложка, важно что внутри написано. Иначе потенциально вводит в заблуждение, именно поэтому нужно отличие сугубо по содержимому.

justin_case
() автор топика
Ответ на: комментарий от justin_case

Наверное электронная являлась сканом бумажной, тогда да.

Нет, официальный релиз электронной книги. Не скан, сразу в PDF свёрстано.

Вот например есть официальный pdf отсюда (скриншот). А вот бумажная книга на озоне, и в карточке продукта первой же строкой ISBN. Он тот же.

И так очень со многими книгами.

Во всяком случае в педивикии четко написано что у е-буки и бумажной отличаться будут.

Да, я тоже читал, что там написано. Но почему-то на практике это чаще не соблюдается, чем соблюдается*. Не уникально для русскоязычных книг, кстати, с английскими та же фигня зачастую. Не всегда, да. Но часто.

* По крайней мере по моему опыту чаще. Может выборка «не такая». Но в любом случае, если не ЧАЩЕ, то как минимум просто очень часто

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 5)
Ответ на: комментарий от justin_case

А поэтому мне как то все равно какая обложка,… нужно отличие сугубо по содержимому.

Проверенная временем идентификация по содержимому ©:
ISBN от Матфея,
ISBN от Марка,
ISBN от Луки,

:)

quickquest ★★★★★
()
Ответ на: комментарий от einhander

В области физической характеристики указывают либо общий объем документа, либо сведения о местоположении объекта ссылки в до-кументе

Уже не то, что просит ТС, поскольку привязано к разбивке на страницы в конкретном издании, а не просто к тексту.

А с электронными ещё хуже:

Ссылки составляют как на электронные ресурсы в целом (электронные документы, базы данных, порталы, сайты, веб-страницы, форумы и т. д.), так и на со-ставные части электронных ресурсов (разделы и части электронных доку-ментов, порталов, сайтов, веб-страниц, публикации в электронных сери-альных изданиях, сообщения на форумах и т. п.)

То есть, вообще аж конкретный url указывается.

Но да, это более уникальный способ. Проблема в том, что ТС оговорился — по всему остальному тексту ему наоборот нужен менее уникальный способ.


Вообще менее уникальный способ можно очень легко изобрести самому:

«Полное Имя Автора — Полное название книги. Включая все подзаголовки (Издание такое-то, дополненное)»

Собственно, уникально именно для конкретного текста, но не уникально для разных media.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 2)

Штука в том, что определить понятие «одна и таже книга» не так просто как кажется на первый взгляд. На интернет-библиотечных сайтах время от времени возникают споры по этому поводу.

Вот скажи, если текст одинаковый, но с разными рисунками - это одна и таже книга? А с исправлениями опечаток?

А ты вообще замахнулся на то, чтобы перевод с оригиналом сопоставляли.

Ну и кто как, но я например, немало книг читал и читаю, у которых даже ISBN нет. Старые - где его и не могло быть и новые с сетевых ресурсов, вроде автортудей, где их не присвают.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Да, у огромной кучи книг нет ISBN.

CrX ★★★
()
Ответ на: комментарий от quickquest

И даже в этом случае есть разные списки :) Не говоря уже о переводах Библии с древних языков на менее древние. Есть Ветхий завет по масоретскому списку , а есть в т.н. «переводе 70-ти толковников» (на древнегреческий). У Евангелий тоже есть слегка разные версии.

praseodim ★★★★★
()

Нет. ISBM это просто номер издания. Одна и та же книга может иметь разные издания и они могут отличаться ОЧЕНЬ разительно, особенно для хороших книг. Тот же Кнут, Танненбаум, и пр. активно обновляют свои труды. Переводы тоже бывают разные…

Поэтому в глобальном масштабе может быть только номер, если очень хочется заморочиться, то можно сделать связность номеров, т.е. отдельный граф на номерах…

Был я в Вене в одной из старейшик библиотек. Там куча книг со времен начала сборки текстов в книги. Есть огромные в полтора метра с буквами по 20см… Я там спросил – а какая у вас система хранения? По темам, по авторам? Знаешь что мне ответили? Мы храним по размеру, книги одного размера в одном месте, потому что при таком количестве уже никак но темам или по авторам или еще как-то по содержанию их не организовать, поэтому есть каталог где что стоит, а книги в шкафах собраны по их размеру, так удобнее всего.

PS: я храню как-то так:

ls /home/bib/mathematics/optimization/
'1968: Фиакко А., Мак-Кормик Г. Нелинейное программирование Методы последовательной безусловной минимизации.djvu'
'1974: Васильев Ф.П. Лекции по методам решения экстремальных задач.djvu'
'1980: Ponstein J.P. Approaches to the Theory of Optimization.djvu'
'1983: Поляк Б.Т. Введение в оптимизацию.djvu'
'1995: Troutman J.L. Variational Calculus and Optimal Control. Optimization with Elementary Convexity.pdf'
'2004: Boyd S., Vandenberghe L. Convex optimization.djvu'
'2006: Borwein J.M., Lewis-Convex A.S. Convex analysis and nonlinear optimization. Theory and examples.pdf'
'2006: Carl S., Le Vy K., Motreanu D. Nonsmooth Variational Problems and Their Inequalities. Comparison Principles and Applications.pdf'

в некоторых каталогах делаю еще директорию «best»

soomrack ★★★★
()
Последнее исправление: soomrack (всего исправлений: 1)
Ответ на: комментарий от quickquest

Проверенная временем идентификация по содержимому ©: ISBN от Матфея, ISBN от Марка, ISBN от Луки,

Мельком читая прочитал «от Лурки». Потом подумал, «а почему бы и нет?»

vaddd ★☆
()
Ответ на: комментарий от CrX

Нет, официальный релиз электронной книги. Не скан, сразу в PDF свёрстано.

Это электронная версия бумажного издания, т.е. это одно и то же издание, поэтому ISBN один и тот же.

soomrack ★★★★
()
Ответ на: комментарий от praseodim

Если я правильно понял что нужно опу, то нужно что-то типа антиплагиата в обратную сторону и как-то решить задачу с переводами

cobold ★★★★★
()
Ответ на: комментарий от soomrack

Ну вот, очень со многими книгами так, стало быть: их «электронная версия» — это «электронная версия бумажного издания».

CrX ★★★
()
Ответ на: комментарий от CrX

Да. Сейчас часто параллельно делают электронную версию. Удобно.

Особенно, это если это print on demand. Там можно и электронную версию, или твердую, или мягкую обложку, любой каприз за ваши деньги, но качество печати, обычно не очень, как и склейки…

soomrack ★★★★
()
Последнее исправление: soomrack (всего исправлений: 1)
Ответ на: комментарий от CrX

ТС хотел чтобы разные варианты изданий не сильно отличались в обозначениях, как раз ГОСТ в этом и даёт преимущество, общими остаются авторы и название, а отличаются год издания, количество страниц и так далее, при этом общие поля всех изданий идут перед уникальными.

einhander ★★★★★
()

если это одна и та же книга, то она бы имела один и тот же номер

И какой должен быть критерий «одна и та же»? Допустим автор исправил опечатки и ошибки найденные в первом издании. Теперь это второе издание. Уже нужен новый номер, или нет? По-моему твоя затея изначально плохая, по номеру ты никак не поймёшь, существенные там изменения для тебя или нет. Для кого-то другая обложка это существенно.

no-such-file ★★★★★
()

чтобы не перечитывать через много лет полностью

Так что тебе от исбна? Если книжку помнишь, то без него опознаешь а если не помнишь, значит можно ещё разок прочитать - считай что и не читал.

ya-betmen ★★★★★
()
Ответ на: комментарий от praseodim

автортудей

Ну это художественные, на них наплевать, потому что спутать невозможно.

justin_case
() автор топика
Ответ на: комментарий от cobold

Вот именно. Но не факт что в обратную. Надо чтобы некая книга была однозначно идентифицирована, вне зависимости от способа ее издания, то есть не важно сколько в ней в этот раз страниц если текст не отличается.

justin_case
() автор топика
Ответ на: комментарий от CrX

Понятно, что такого тупо нет.

Мало ли, вдруг уже есть а я не знаю. Потому что это логичный вариант, чтоб перевод на другой язык как то соотносился с исходным текстом. НЕ обязательно дублировался номер, но чтоб давалось понять что вот А это перевод B. Это зачем? Ну иногда что-то интересное есть на английском, а перевода нет. Перевод может появится через н лет, то есть опять ради исключения повторов.

justin_case
() автор топика
Ответ на: комментарий от justin_case

Да понятно, зачем это может быть полезно. Но нет, такой полной каталогизацией никто не заморочился. По крайней мере ничего официального и общеизвестного нет. Может есть какие-то начинания энтузиастов. Но даже если они есть, то они 100% будут неполны, и в них не будет и 10% от всех книг.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от justin_case

то есть не важно сколько в ней в этот раз страниц если текст не отличается.

Какие именно критерии для тебя значимы, а какие нет?

Текст — это только plain text, или форматирование всё же важно? Я имею в виду, если в новом издании часть слов выделили жирным, и это повлияло на логическое «ударение» — это ещё тот же текст или другой?

Что по заголовкам? Например, если в однои издании главы идут просто по номерам, а в другом — у каждой помимо номера есть заголовок — это тот же текст или другой?

А если, например, просто главы оформлены тупо по номерам, но в одном текста пронумерованы римскими цифрами, а в другом арабскими — это один текст?

А если непосредственно в самом тексте исправлена опечатка?

А если не опечатка, а матерное слово заменили на эфемизм?

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Какие именно критерии для тебя значимы, а какие нет?

Лично для меня такие изменения как ты описал малозначимы. Основная цель вообще ведения таблицы это НЕ перечитывать прочитанное, если в нем нет добавлений каких то или больших изменений типа новая глава, какой раньше не было. Что касается например «температура кипения прямого угла 89 градусов», а в следующем издании это исправили, я скорее нагуглю верное уже отдельно от книги, в тот момент когда мне это пригодится.

justin_case
() автор топика
Ответ на: комментарий от justin_case

Тогда всё очень просто, и отдельный каталог не нужен.

Твой уникальный идентификатор выглядит так:

Полное Имя Автора — Полное название книги. Со всеми подзаголовками

И я абсолютно серьёзно. Такая строка служит идентификатором с ровно той уникальностью, которая нужна.

Если бы исправления по факту делали книгу таки «другой», в конце можно было бы добавить ещё нормер/названия издания.

Если важно, чтобы были именно цифры — можно взять от этой строки хэш.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 1)

А существует ли некий более уникальный способ идентификации книг

Возьми книгу с полки. Посмотри выходные данные. Видишь какие-то цифры кроме ISBN? Вопросы есть?

MrClon ★★★★★
()
Ответ на: комментарий от ya-betmen

Если книжку помнишь

А вот в том то и дело. Вот это и натолкнуло на ведение такой таблицы. Нашел интересную для себя книгу (не художественную), она кажется подозрительно знакомой, не так чтобы наизусть, но я начал почти угадывать а что будет написано дальше. К середине я понял что ее читал раньше. И да, промежуток может быть овер много лет. А вот еще раз прочитать раз нравится, еслиб я был бессмертным то так бы и делал, но нет, жизнь одна, время потраченое на прочтение по второму разу можно и нужно было потратить на чтение другой книги которую раньше не читал или какое другое полезное для себя дело.

justin_case
() автор топика
Ответ на: комментарий от justin_case

А что за книги хоть, примерно, если не художественные? Просто если это что-то техническое или научное, например, то как-то странно, если за «промежуток овер много лет» знания по-прежнему находятся на том же уровне, что заинтересовала та же книжка, что и годы назад — для того же уровня. В таком случае может следует сам процесс познания как-то улучшаять в первую очередь, а не списки составлять? Больше пользы будет, а список в итоге может оказаться не так уж нужен. Если это научпоп, то как-то тоже примерно так же — со временем же перерастаешь совсем «детское», и хочется чего-то более научного и менее популярного по интересующей теме.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

А что за книги хоть, примерно, если не художественные?

В целом интересует все что касается электричества, электроники и внезапно войны (точнее техники). Естественно это не значит «только». Еще немаловажный фактор - кто-то посоветовал, мол интересно прочитай, просто по названию я не вспомню читал я это или нет, так что помогает.

justin_case
() автор топика

Я примерно так же записываю название автора, год издания и ISBN для прочитанных, чтобы не перечитывать через много лет полностью
А существует ли некий более уникальный способ идентификации книг

Да. Я их на другую полку ставлю.

anc ★★★★★
()
Ответ на: комментарий от justin_case

Я их не воспринимаю в здоровом состоянии.

anc ★★★★★
()

md5 hash от содержимого текста уже предлагали?

ugoday ★★★★★
()
Ответ на: комментарий от Irma

Двадцать лет ушло на то, чтобы пронумеровать просто буквы в utf8

буквы
utf8

utf8
буквы

Это фиаско, сестра.

dataman ★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)