Как решаются подобные задачи?

На лекциях объясняли.

dn2010 ★★★★★
(16.06.13 16:55:55 MSK)

Ответ на: комментарий от dn2010 16.06.13 16:55:55 MSK

а вот и нет.

Есть что по делу сказать?

snaf ★★★★★
(16.06.13 16:57:39 MSK) автор топика

Первая ассоциация — теория информации: оптимальный префиксный код. Хотя в данном случае, да, можно проще.

Sadler ★★★
(16.06.13 16:59:56 MSK)
Последнее исправление: Sadler 16.06.13 17:04:06 MSK (всего исправлений: 2)

Ссылка

a) log2(кол-во символов), округлять вверх

б) кол-во символов умножить на пункт а

ziemin ★★
(16.06.13 17:00:10 MSK)

Ответ на: комментарий от snaf 16.06.13 16:57:39 MSK

http://ru.wikibooks.org/wiki/Системы_счисления

dn2010 ★★★★★
(16.06.13 17:03:04 MSK)

Я не прошу чтобы за меня решили. Мне достаточно объяснения.

Тыц :)

quickquest ★★★★★
(16.06.13 17:10:45 MSK)

Ссылка

Ответ на: комментарий от dn2010 16.06.13 17:03:04 MSK

разве это то?

snaf ★★★★★
(16.06.13 17:11:54 MSK) автор топика

Ссылка

Ответ на: комментарий от ziemin 16.06.13 17:00:10 MSK

Исключительно ради проверки. Ответ на пункт б = 5 ?

snaf ★★★★★
(16.06.13 17:20:28 MSK) автор топика

б) посчитайте в байтах объём информации который содержится в письме числа 31214

Даже вопрос нормально сформулировать не могут.

~~geekless~~ ★★
(16.06.13 17:21:26 MSK)
Последнее исправление: geekless 16.06.13 17:21:40 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от snaf 16.06.13 17:20:28 MSK

а) log2(5) = 3 бита на символ

б) 3 * 11 символов = 33 бита

ziemin ★★
(16.06.13 17:26:19 MSK)

Ответ на: комментарий от ziemin 16.06.13 17:00:10 MSK

Это разве не для позиционных систем счисления?

keyran ★★
(16.06.13 17:27:33 MSK)

Ответ на: комментарий от keyran 16.06.13 17:27:33 MSK

Причём тут СС? Чмсло вам показали чтобы запутать. Имеем некоторый алфавит и сообщение на нём.

ziemin ★★
(16.06.13 17:28:55 MSK)

Древнекритский ребус.

CYB3R ★★★★★
(16.06.13 17:32:15 MSK)

Ссылка

Ответ на: комментарий от ziemin 16.06.13 17:26:19 MSK

Теперь понял. Спасибо)

snaf ★★★★★
(16.06.13 17:33:48 MSK) автор топика

Ответ на: комментарий от snaf 16.06.13 17:33:48 MSK

в байтах

В байтах да 5

ziemin ★★
(16.06.13 17:39:31 MSK)

Ссылка

Ответ на: комментарий от ziemin 16.06.13 17:28:55 MSK

Объясняю. Допустим, алфавит: a-1 b-10 c-100 d-1000 e-10000

Допустимые варианты - это

eeedddcba

Недопустимые -

abcde

То есть есть ограничение на порядок следования символов, за счет чего количество информации принципиально иное.

keyran ★★
(16.06.13 17:47:25 MSK)

Ответ на: комментарий от keyran 16.06.13 17:47:25 MSK

Недопустимые

Это откуда? Не было такого. У меня все ходы записаны.

ziemin ★★
(16.06.13 17:50:07 MSK)

Ответ на: комментарий от keyran 16.06.13 17:47:25 MSK

В непозиционных системах порядок не имеет значения.

note173 ★★★★★
(16.06.13 17:50:44 MSK)

Ответ на: комментарий от ziemin 16.06.13 17:50:07 MSK

А посмотри, как кодируется число по ссылке. Там как раз аналог eeeddcbbaaaa.

keyran ★★
(16.06.13 17:52:17 MSK)

Ответ на: комментарий от note173 16.06.13 17:50:44 MSK

Возможно, я что-то перепутал, но согласно википедии

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе. При этом система может накладывать ограничения на положение цифр, например, чтобы они были расположены в порядке убывания.

Что и показано на второй ссылке.

keyran ★★
(16.06.13 17:54:23 MSK)

Ссылка

Ответ на: комментарий от keyran 16.06.13 17:52:17 MSK

Не выдумывай. Или ты в этих значках вычитал?

ziemin ★★
(16.06.13 17:54:44 MSK)

Ответ на: комментарий от ziemin 16.06.13 17:54:44 MSK

Да. Смотри сам.

Число - 31214

Запись - три значка, означающих 10000, один, означающий 1000, два, означающих 100, один 10, четыре по одному.

Аналогия видна?

keyran ★★
(16.06.13 17:57:15 MSK)

Ответ на: комментарий от keyran 16.06.13 17:57:15 MSK

От перестановки слагаемых сумма не меняется.

ziemin ★★
(16.06.13 17:59:41 MSK)

Ответ на: комментарий от ziemin 16.06.13 17:59:41 MSK

Верно. В отличие от позиционной системы счисления, формулы для которой ты и привел.

keyran ★★
(16.06.13 18:02:22 MSK)

Ответ на: комментарий от keyran 16.06.13 18:02:22 MSK

Это формулы для сообщения с помощью некоторого алфавита.

ziemin ★★
(16.06.13 18:03:55 MSK)

Ответ на: комментарий от ziemin 16.06.13 18:03:55 MSK

Хорошо. Но здесь они неприменимы по причине того, что в сообщении переставлять местами символы нельзя, иначе его суть изменится. Здесь - можно.

keyran ★★
(16.06.13 18:05:03 MSK)

Ответ на: комментарий от keyran 16.06.13 18:05:03 MSK

Хорошо. Но здесь они неприменимы по причине того, что в сообщении переставлять местами символы нельзя, иначе его суть изменится. Здесь - можно.

Но здесь они неприменимы ... Здесь - можно.

Быстрей разупоряйся - завтра понедельник :)

ziemin ★★
(16.06.13 18:07:08 MSK)

Ответ на: комментарий от ziemin 16.06.13 18:07:08 MSK

А по делу сказать есть что?

Возьмем простейший случай. Алфавит - 1 и 0

Если имеет значение позиция символов, сообщение 10011100 содержит ровно 8 бит информации. Если позиция значения не имеет, то важно только то, что в сообщении 4 нуля и 4 единицы, и требуется только 6 бит - 3 на количество нулей и 3 на количество единиц.

Пример ясен?

keyran ★★
(16.06.13 18:11:25 MSK)

Мне достаточно объяснения.

Я сам подумать попробуй. Закодировать ты можешь любое десятичное число длиной не более 5 цифр. Нуля наверно есть (пустое сообщение). И того 10^5 вариантов. Ну а дальше логарифм по основанию 2.

ival ★★
(16.06.13 18:15:32 MSK)

Ссылка

Ответ на: комментарий от keyran 16.06.13 18:11:25 MSK

Ты изобрел сжатие. Но в случае ТС'а таких указаний не было. Сказано

содержится в письме числа

ziemin ★★
(16.06.13 18:18:06 MSK)

Ответ на: комментарий от ziemin 16.06.13 18:18:06 MSK

Я показал отличие количества информации при позиционной и непозиционной записи. У ТС она непозиционная, это видно из второй ссылки. Ты дал формулы для позиционной. Ergo, твои формулы неприменимы в случае ТС.

keyran ★★
(16.06.13 18:22:34 MSK)

Ответ на: комментарий от keyran 16.06.13 18:22:34 MSK

в письме числа

В ЗАПИСИ числа!

Чьорд. Пойду тоже что ли пиваса возьму.

ziemin ★★
(16.06.13 18:26:49 MSK)

Ответ на: комментарий от ziemin 16.06.13 18:26:49 MSK

Именно в записи. Если запись подчиняется определенной структуре, то количество информации, заложенное в этой записи, меньше, чем если бы она была абсолютно неструктурирована.

Что такое количество информации?

За единицу количества информации принимается такое количество информации, которое содержится в информационном сообщении, уменьшающем неопределенность знания в два раза.

Приняв это определение, посмотрим, как увеличивается информация в ЗАПИСИ при добавлении к этой записи одного символа.

В случае неструктурированной записи, действительно, оно увеличивается на ceil(log_2(5)) бит.

В случае структурированной, как у ТС записи, новый элемент может быть либо текущим, либо следующим за ним. То есть информация увеличивается только на один бит.

keyran ★★
(16.06.13 20:34:07 MSK)

Ответ на: комментарий от keyran 16.06.13 20:34:07 MSK

То есть информация увеличивается только на один бит.

Отнюдь. А какой стартовый элемент, чтоб считать его текущим?

ziemin ★★
(16.06.13 20:36:24 MSK)

обычная десятичная система счисления. Просто вместо 40 пишут ☣☣☣☣, здесь ☣ значит: «десятки».

Что-бы получить число символов, нужно сложить все ЦИФРЫ, например 3+1+2+1+4 == 11

~~drBatty~~ ★★
(16.06.13 20:41:15 MSK)

Ссылка

Ответ на: комментарий от ziemin 16.06.13 20:36:24 MSK

Исправляюсь. Неточно описал. Текущий элемент действительно кодируется ceil(log_2(n)) битами информации. Пусть этот элемент - k<n. Но тогда следующий за ним, новый элемент, может быть только элементом >=k, то информация, данная следующим элементом, будет составлять только ceil(log_2(n-k+1)) бит.

keyran ★★
(16.06.13 20:42:56 MSK)

Ответ на: комментарий от keyran 16.06.13 20:34:07 MSK

Приняв это определение, посмотрим, как увеличивается информация в ЗАПИСИ при добавлении к этой записи одного символа.

при добавлении одного символа количество информации увеличивается неравномерно, и его так просто не посчитать. Смотря какое число, и какой символ. Можно посчитать группируя символы в метасимволы. Например ☣☣☣☣ == 40, а ☣☣☣☣☣ == 50. Тогда можно посчитать энтропию «4» и «5», она равна -log₂(1/10) (в битах).

~~drBatty~~ ★★
(16.06.13 20:48:41 MSK)
Последнее исправление: drBatty 16.06.13 20:50:34 MSK (всего исправлений: 1)

Ответ на: комментарий от keyran 16.06.13 20:42:56 MSK

А как разделить элементы? Чтоб было понятно, что следующая запись на бит меньше?

ziemin ★★
(16.06.13 20:52:00 MSK)

Ответ на: комментарий от drBatty 16.06.13 20:48:41 MSK

пояснение: после девяти ☣, энтропия ☣ равна 0, ибо мы знаем, что чисел с 10ю десятками не бывает. После восьми ☣, равна 1/10, ибо только в каждом десятом числе есть ровно 9 десяток.

~~drBatty~~ ★★
(16.06.13 21:00:25 MSK)

Ссылка

Ответ на: комментарий от keyran 16.06.13 20:42:56 MSK

ceil

откуда у тебя это взялось? Энтропия совсем не обязана быть целой. И да, она совсем никак не зависит от целой части логарифма. Да ещё и двоичного. Она зависит от дробной части десятичного логарифма, т.к. СС десятичная.

~~drBatty~~ ★★
(16.06.13 21:04:33 MSK)

Ссылка

Ответ на: комментарий от ziemin 16.06.13 20:52:00 MSK

первый элемент задан точно. Второй - разница между тем, что должно и предыдущим. И так далее. То есть если следующий =k, то кодируется 0, если k+i, то i.

keyran ★★
(16.06.13 21:49:48 MSK)

Ссылка

Ответ на: комментарий от drBatty 16.06.13 20:48:41 MSK

Так я об этом и говорю. Да, так можно, и количество информации при таком кодировании меньше, чем при кодировании каждого знакоместа ln_2(n) битами. А ceil - для компьютерного кодирования, там все целое.

keyran ★★
(16.06.13 21:51:38 MSK)

Ответ на: комментарий от keyran 16.06.13 21:51:38 MSK

Да, так можно, и количество информации при таком кодировании меньше, чем при кодировании каждого знакоместа ln_2(n) битами.

столько же. Если считать ценность одного «знакоместа» целиком.

А ceil - для компьютерного кодирования, там все целое.

энтропия в битах целая только если есть ровно 2^n равновероятных варианта. В общем случае энтропия дробная. Обычно она ещё и трансцендентная. Т.к. на практике нужно много кодировать, то и кодируют скажем 2 символа по 1.5 бита, тремя битами.

~~drBatty~~ ★★
(16.06.13 22:01:57 MSK)

Ответ на: комментарий от drBatty 16.06.13 22:01:57 MSK

Если считать целиком. А у ТС оно зависит от предыдущих знакомест.

keyran ★★
(16.06.13 22:05:12 MSK)

Ответ на: комментарий от keyran 16.06.13 22:05:12 MSK

от предыдущих НЕ зависит. Пример: 123456? Как зависит "?" от предыдущих? Никак.

Зато знакоместо зависит само от себя, ибо оно из нескольких определённых символов.

~~drBatty~~ ★★
(16.06.13 22:17:51 MSK)

Ответ на: комментарий от drBatty 16.06.13 22:17:51 MSK

из нескольких определённых символов.

Вот именно, оно зависит тем, что эти определенные символы определены предыдущими. То есть если взять нотацию, как я приводил выше, то к записи fffeedddcc можно добавить только c, b и a, но нельзя f, e и d. Вот таким образом зависит.

keyran ★★
(16.06.13 22:21:41 MSK)

Ответ на: комментарий от keyran 16.06.13 22:21:41 MSK

то к записи fffeedddcc можно добавить только c, b и a, но нельзя f, e и d. Вот таким образом зависит.

все меньше c можно добавлять, с равной вероятностью, от 0 до 9 штук. И это ни от чего не зависит. А вот саму c можно добавлять только от 0 до 7 штук, потому-что 2 уже есть. Энтропия больше c равна 0, ибо их вероятность известна, и равна тоже 0.

Энтропия количества символов c в данном случае ровно 3 бита, ибо 2³ вариантов(равновероятных и независимых).

~~drBatty~~ ★★
(16.06.13 22:50:29 MSK)

Ответ на: комментарий от drBatty 16.06.13 22:50:29 MSK

Так. Верно. Но в запись мы добавляем лишь один символ. Это может быть c, b, a. В запись ffeedd можно добавить уже d, c, b, a. То есть количество информации, требуемой для записи одного следующего символа зависит от того, какие символы были ранее.

Мы ведь сейчас не о кодировании самого числа говорим, а о его записи в системе того жителя Крита.

keyran ★★
(16.06.13 22:57:39 MSK)

Ссылка

Похожие темы