Работа с идентификаторами

0

1

Сразу скажу, что в гугле не забанили, просто хочу получить как можно больше советов и информации как решить задачу.

Суть в следующем: пусть у нас есть база, где есть 100500 имен каждый со своим ID (например, база сотрудников). В течении N-времени некоторые записи удаляются. Получается, что идентификаторы всех записей сдвигаются на один вверх, замещая удаленный.

Как правильно спроектировать БД, чтобы не было глюков из-за сдвигов идентификаторов? Возможно, что я не верно задаю вопрос или в принципе не понял сути самих ID, тогда поправьте меня, может я вообще ищу проблему там, где её нет.

Первый раз столкнулся с задачей сделать систему с большим колличеством пользователей и данных.

Ссылка

←	Node.js что это и с чем едят.

PNG изображения не обрабатываются

→

А зачем их вообще сдвигать? Лишняя огромная работа и внезапно может оказаться что реляционные связи указывают не на ту запись что нужно.

Kalashnikov ★★★
(08.04.12 11:41:08 MSK)

Ответ на: комментарий от Kalashnikov 08.04.12 11:41:08 MSK

Но тогда получается, что будут оставаться пустые ID, верно?
Или они будут автоматически заполняться новыми записями?

~~Quadmonster~~ ★
(08.04.12 11:44:15 MSK) автор топика

Ответ на: комментарий от Quadmonster 08.04.12 11:44:15 MSK

А чем пустые ID мешают? Если значения ключа имеют какой-то смысл, добавьте столбец натурального ключа. Менять же PRIMARY KEY — это может быть дорого с точки зрения производительности и, если не использовать внешние ключи, может привести к ошибкам связности.

sjinks ★★★
(08.04.12 11:55:43 MSK)

Ответ на: комментарий от Quadmonster 08.04.12 11:44:15 MSK

и чем пустые id мешают?

lllnk
(08.04.12 11:56:05 MSK)

Ответ на: комментарий от lllnk 08.04.12 11:56:05 MSK

Если автоинкримент самостоятельно ищет пустые id и присываивает их новой информации, то ничем не мешают :)

Порядка хочется.

1. А
2. Б
3. В
4. Г
5. Д

Удалилили/Добавили:

1.
2. Е
3. В
4. З
5. И

Потом хотим добавить Ъ. Если автоинкримент сделает так:

1. Ъ
... и так далее, то вопрос в общем-то исчерпан.
Но если так:

1.
2. Е
3. В
4. З
5. И
6. Ъ

то я хочу знать как бороться с пустыми ID, сомневаюсь, что они не занимают места в БД и не мешают быстрому поиску.

~~Quadmonster~~ ★
(08.04.12 12:01:46 MSK) автор топика

Записи не смещаются после удаления. Повторно ID не используются, если их прямо не указывать в INSERT.

gatsu ★
(08.04.12 12:02:40 MSK)

Ссылка

Ответ на: комментарий от Quadmonster 08.04.12 12:01:46 MSK

Они не занимают места в бд и не мешают быстрому поиску. Их там просто нет, посмотри на дамп своего же примера, первой строчки там не будет вообще.

Kalashnikov ★★★
(08.04.12 12:04:08 MSK)

Ссылка

Ответ на: комментарий от Quadmonster 08.04.12 12:01:46 MSK

Борьба с пустыми полями — экономия на спичках.

Поиску они никак не помешают, их просто в индексе не будет.

gatsu ★
(08.04.12 12:04:26 MSK)

Ответ на: комментарий от gatsu 08.04.12 12:04:26 MSK

Т. е. в итоге: борьба с пустыми полями — ересь и смысла в этом — ноль?

~~Quadmonster~~ ★
(08.04.12 12:07:58 MSK) автор топика

Ответ на: комментарий от sjinks 08.04.12 11:55:43 MSK

А чем пустые ID мешают?

Не в данном конкретном случае, но вообще:

1. ID могут требоваться исключительно 32-х битные (скажем, требования бинарного протокола), а генерироваться их может много.

2. Даже без ограничения на разрядность, при большом количестве создаваемых ключей может понадобиться переход на BIGINT. А ключи с ним работают уже медленнее, чем с INT(10..11) :)

~~KRoN73~~ ★★★★★
(08.04.12 12:08:23 MSK)

Ответ на: комментарий от Quadmonster 08.04.12 12:07:58 MSK

Только в исключительных случаях.

gatsu ★
(08.04.12 12:10:34 MSK)

Ссылка

Ответ на: комментарий от gatsu 08.04.12 12:04:26 MSK

а вообще какая-нибудь экономия разве будет от этого? ТС неправильно же написал - не будет никакого пустой записи с id=1.

lllnk
(08.04.12 12:10:45 MSK)

Ссылка

Ответ на: комментарий от Quadmonster 08.04.12 12:01:46 MSK

Если автоинкримент сделает так:

1. Ъ

а если у тебя на PK 1 ссылается какая-то другая сущность, то ты отгребешь логическую ошибку, да.

Но если так:

Вот именно так и будет. И это правильно. Попробуй позабивать данных, а потом посмотри на show create table, там будет следующее значение автоинкремента.

то я хочу знать как бороться с пустыми ID, сомневаюсь, что они не занимают места в БД и не мешают быстрому поиску.

Дорогой, тебе правда делать нефиг? Почитай, как мускуль хранит индексы и подумай еще раз.

Если чем-то не подходят автоинкрементные PK, используй свои собственные хеши и сделай шардинг.

P.S. и почитай, что есть преждевременная оптимизация.

KDE41user ★
(08.04.12 12:15:43 MSK)

Ответ на: комментарий от KDE41user 08.04.12 12:15:43 MSK

Спасибо за совет, пойду читать и дальше проектировать.

~~Quadmonster~~ ★
(08.04.12 12:21:35 MSK) автор топика

Ссылка

Как правильно спроектировать БД, чтобы не было глюков из-за сдвигов идентификаторов?

Исключить сдвиги. Всё остальное - костыли.

VirRaa ★★★
(08.04.12 12:50:29 MSK)

Ссылка

Ответ на: комментарий от Quadmonster 08.04.12 12:07:58 MSK

борьба с пустыми полями

Вот они, Дон-Кихоты нашего времени :)

Главное убедиться, что в связанных таблицах не осталось фантомных записей, ссылающихся на эти идентификаторы. Для этого есть всякие cascade delete.

d9d9 ★★★★
(08.04.12 13:27:39 MSK)

Ссылка

Ответ на: комментарий от KRoN73 08.04.12 12:08:23 MSK

1. ID могут требоваться исключительно 32-х битные (скажем, требования бинарного протокола), а генерироваться их может много.

1000 записей в секунду в течение 24 часов — понадобится где-то полтора месяца, чтобы исчерпать 32-битный диапазон :-)

И будет ли база данных подходящим генератором таких дентификаторов? :-)

sjinks ★★★
(08.04.12 15:52:46 MSK)

Ответ на: комментарий от sjinks 08.04.12 15:52:46 MSK

1000 записей в секунду в течение 24 часов — понадобится где-то полтора месяца, чтобы исчерпать 32-битный диапазон :-)

Представь себе, бывают системы, работающие годами :) 32 беззнаковых бита за два года исчерпаются всего на скорости 34 записи в секунду. А за пять лет — на 13 записях в секунду. У меня же есть работающие БД, которым за 12..13 лет. К счастью, там обновлений поменьше ;)

И будет ли база данных подходящим генератором таких дентификаторов? :-)

Это уже от конкретной задачи зависит, конечно.

~~KRoN73~~ ★★★★★
(08.04.12 16:32:13 MSK)

Ответ на: комментарий от KRoN73 08.04.12 16:32:13 MSK

Представь себе, бывают системы, работающие годами :)

Я в курсе :-) Мой комментарий относился к протоколу, требующему уникальные 32-битные идентификаторы.

Идея в том, что если требуется именно натуральный ключ, то псевдоключ — это не самая удачная его реализация — как с точки зрения целостности, так и производительности.

sjinks ★★★
(08.04.12 16:50:33 MSK)

Ссылка

Ответ на: комментарий от KRoN73 08.04.12 16:32:13 MSK

А за пять лет — на 13 записях в секунду.

За пять лет можно вполне догадаться изменить тип столбца ;-)

Wizard_ ★★★★★
(09.04.12 10:37:12 MSK)

Ответ на: комментарий от Wizard_ 09.04.12 10:37:12 MSK

За пять лет можно вполне догадаться изменить тип столбца ;-)

Работа с идентификаторами (комментарий)

~~KRoN73~~ ★★★★★
(09.04.12 10:43:14 MSK)

Ссылка

Закажите Java EE + Oracle DB прямо сейчас, и вы получите целых 10 бесплатных идентификаторов в подарок!

anonymous
(09.04.12 10:59:39 MSK)

Ссылка

Ответ на: комментарий от KRoN73 08.04.12 12:08:23 MSK

Даже без ограничения на разрядность, при большом количестве создаваемых ключей может понадобиться переход на BIGINT. А ключи с ним работают уже медленнее, чем с INT(10..11) :)

Специально вчера перстроил таблицу (~250 миллионов записей, InnoDB), изменив PK с BIGINT UNSIGNED на INT UNSIGNED. Выборок/сортировок по первичному ключу в приложении достаточно. Но скорость изменилась в пределах статистической погрешности.

sjinks ★★★
(09.04.12 11:04:55 MSK)

А мне вот интересно, а как действительно решается проблема с пропусками в значениях, учитывая, что разрядность числа для идентификатора конечна, а автоинкремент или его аналог будут просто увеличивать некую переменную, значение которой впоследствии будет использована в дальнейшем для ID некой записи в таблице.

Т.е если была последовательность ide'шников:
1, 2, 3, 4
Вызвали DELETE, в итоге, получили например следующее:
1, 2, 4
Потом вывали INSERT, в итоге:
1, 2, 4, 5

?

anonymous
(09.04.12 11:20:29 MSK)

Ссылка

Ответ на: комментарий от KRoN73 08.04.12 16:32:13 MSK

32 беззнаковых бита

ССЗБ, нефиг юзать 32-битные системы)

boombick ★★★★★
(09.04.12 13:16:21 MSK)

Ответ на: комментарий от boombick 09.04.12 13:16:21 MSK

ССЗБ, нефиг юзать 32-битные системы)

Как бы очевидно, что речь о legacy :)

~~KRoN73~~ ★★★★★
(09.04.12 13:40:48 MSK)

Ссылка

Ответ на: комментарий от sjinks 09.04.12 11:04:55 MSK

Хм, думаю, что надо исключительно реальной базе смотреть. Взять в пример тот же ВК - там овер9000 записей, миллион хомячков зарегистрировано, но поиск работает быстро, страница выдается практически мгновенно. Фейков было убито масса и еще сколько будет удалено. Там пустых ID навалом. По мне, так это «вес» базы. Ясно, что песчинка ничего не весит, но набери песчинок на 10 киллограм и это будет очень даже ощутимо.

~~Quadmonster~~ ★
(11.04.12 00:01:45 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Node.js что это и с чем едят.

Web-development

PNG изображения не обрабатываются

→

Похожие темы