LINUX.ORG.RU

Пятая редакция стандарта XML 1.0 несовместима с XML Namespaces 1.0

 ,


0

0

Попытка сделать XML более интернациональным привела к несовместимости с текущей редакцией стандарта XML Namespaces 1.0.

Один из изобретателей XML, Тим Брей, написал возражение по поводу готовящегося принятия пятой редакции XML 1.0:

http://lists.w3.org/Archives/Public/x...

Суть проблемы заключается в следующем. До пятой редакции стандарт XML 1.0 позволял использовать символы Unicode, принятого в 1998 году. Это означает, что символы, добавленные в более поздней версии Unicode, не могут быть использованы в названиях тагов и атрибутов XML 1.0 до пятой редакции. К таким символам относятся, например, буквы Амхарского языка и языка индейского племени Чероки. Пятая редакция XML 1.0 позволяет пользоваться любыми символами Unicode, добавленными после 1998 года. Однако текущий стандарт на XML Namespaces 1.0 всё ещё не позволяет этого.

>>> Подробности

★★★★★

Проверено: Shaman007 ()

> может, я действительно неясно выражаюсь? казалось бы, какая связь.

Суть в том, что ты можешь до бесконечности жаловаться, что у тебя две ноги вместо трёх, одно голова вместо четырёх, но толку от этого не будет. То же и с XML, при всех своих недостатках, ту ерунду, что ты привёл для примера нельзя даже сравнивать с XML. Смешно было бы посмотреть на то, как будут выглядеть иерархия, атрибуты, схемы и прочее при такой "нотации". В общем складывается впечатление, что для тебя XML - это формат хранения настроек программ и не больше.

Bohtvaroh ★★★★
()

> зачем в диалоге МАШИНА <-> МАШИНА переводить данные на человеческий язык?

Всемирного машинного языка не существует.

парсинг бинарных данных подразумевает половые отношение с:

размером, выравниванием, порядком байт, размещением знака,... можно продолжать еще долго.

PS. большинство интернет-протоколов "разговаривают" ЧАЛОВЕЧЕСКИМ ГОЛОСОМ.

anonymous
()
Ответ на: комментарий от dimonzi_

> мне не ясно, что же мещает в XML 1.0 использовать "новый" юникод?

Что тут неясного? XML Namespaces 1.0, используемый совместно с XML 1.0, не позволяет использовать новый юникод. Это примерно как добавить 33-ю букву в ураинский язык и запретить в типографиях ей пользоваться.

bbk123 ★★★★★
() автор топика
Ответ на: комментарий от Bohtvaroh

Re^8: Пятая редакция стандарта XML 1.0 несовместима с XML Namespaces 1.0><

>> может, я действительно неясно выражаюсь? казалось бы, какая связь.

> Суть в том, что ты можешь до бесконечности жаловаться, что у тебя две ноги вместо трёх, одно голова вместо четырёх, но толку от этого не будет. То же и с XML, при всех своих недостатках, ту ерунду, что ты привёл для примера нельзя даже сравнивать с XML. Смешно было бы посмотреть на то, как будут выглядеть иерархия, атрибуты, схемы и прочее при такой "нотации". В общем складывается впечатление, что для тебя XML - это формат хранения настроек программ и не больше.



для меня XML - это позор нации. причём любой, которая его использует, вот до недавнего времени испытывал гордость за Чероки

GuttaLinux
()
Ответ на: комментарий от anonymous

Re^4: Пятая редакция стандарта XML 1.0 несовместима с XML Namespaces 1.0

> PS. большинство интернет-протоколов "разговаривают" ЧАЛОВЕЧЕСКИМ ГОЛОСОМ.

И Карузо и анонимус с лора - и то и то чаловеческий голос. Только вот больно разные мысли при их прослушивании возникают.

GuttaLinux
()
Ответ на: комментарий от Bohtvaroh

>> зачем в диалоге МАШИНА <-> МАШИНА переводить данные на человеческий язык?

> А что за машина? be? le? Целое и указатель какого размера? А?

Против be да le придуман, например, EBML. XML всё-таки всем своим видом намекает на то, что его хотя бы изредка читает или пишет человек.

const86 ★★★★★
()
Ответ на: комментарий от const86

> XML всё-таки всем своим видом намекает на то, что его хотя бы изредка читает или пишет человек.

Ну да, до тех пор, пока не уберёшь весь лишний whitespace. ;)

Bohtvaroh ★★★★
()
Ответ на: комментарий от anonymous

>> > Произойдет. Произойдет прецедент забивания на символы определенных языков. В следующем стандарте забить могут на ваш язык. А потом все опять начнут изобретать национальные кодировки и подстандарты.

на уже добавленные языки никто забивать не будет.

В мире есть еще дохрена всяких племен, куда меньших, чем Чероки, этак 10-15 семей. Что ж теперь, ждать, когда юникод охватит все языки и лет через +∞ таки выпустить стандарт?

Проблема есть, но решаема новым стандартом. Или простым переписыванием парсеров XML'а для поддержки "нового" юникода

dimonzi_
()
Ответ на: комментарий от dimonzi_

жах какой... прям ни дня без XML-размети на языке ирокезоязычных индейских племён...

los_nikos ★★★★★
()
Ответ на: комментарий от dimonzi_

Мдя... я уже лет 5 пытаюсь понять, зачем нужен этот XML и что всех так от него штырит.....

Имхо .ini файлы куда как удобнее

Много всего прочитал про XML, но так и не придумал куда его всунуть в своих проектах.. разве что в биореактор.

anonymous
()
Ответ на: комментарий от anonymous

> Много всего прочитал про XML, но так и не придумал куда его всунуть в своих проектах.. разве что в биореактор.

Ух, батенька... А что за проекты?

Bohtvaroh ★★★★
()

XML - поделие извращенцев.

я понимаю, что у разработчиков из W3C очень стоит от ихнего скрипта разметки страниц, и всё такое, но XML - убожество, которое невозможно ни парсить по человечески, ни читать. так уж ли нужен этот формат, может проще сделать компилятор язык разметки -> бинарный документ, а сам язык сделать подобным хотя бы перлу? нет, пропёрло их на тэги.

anonymous
()
Ответ на: комментарий от r

Re^2: Пятая редакция стандарта XML 1.0 несовместима с XML Namespaces 1.0

>>Имхо .ini файлы куда как удобнее

> Представляю себе вебсервисы на ini файлах.



православен только Plain Text. XML ни в каком месте не Plain, хоть я и понятия не имею, как это переводится.

GuttaLinux
()
Ответ на: XML - поделие извращенцев. от anonymous

Как же это я его, интересно читают? Наверное воздествую кибер-телепатией, не иначе. А сайты на ini-файлах это конечно да, ынтыпрайзно.

Deleted
()

Если тролишь то троли тоньше. В XML есть стандартизированная иерархичноть, структурирование(разделение контента и метаинформации), символьная структура, валидация, возможности смешивания данных, возможность ключения или ссылок.

Попробуй все это реализовать в другом тектосовм протоколе - изобретешь свой собственный XML.

r ★★★★★
()
Ответ на: XML - поделие извращенцев. от anonymous

> я понимаю, что у разработчиков из W3C очень стоит от ихнего скрипта разметки страниц, и всё такое, но XML - убожество, которое невозможно ни парсить по человечески, ни читать. так уж ли нужен этот формат, может проще сделать компилятор язык разметки -> бинарный документ, а сам язык сделать подобным хотя бы перлу? нет, пропёрло их на тэги.


просто ынтерпрайзчикам очень хочется отличаться от обычного быдла

GuttaLinux
()

> буквы Амхарского языка и языка индейского племени Чероки

Пипец, половина из них из письменности только подпись свою осиливают, а из-за них ломать стандарт...

anonymous
()

Почему нельзя исправить XML Namespaces, aka errata или новая редакция, не понятно.

Deleted
()

> К таким символам относятся, например, буквы Амхарского языка и языка индейского племени Чероки

Вот прямо каждый индеец племени Чероки - юниксоид и программист, которые не может выжить без тегов XML.

Flaming ★★
()
Ответ на: комментарий от r

Re^4: Пятая редакция стандарта XML 1.0 несовместима с XML Namespaces 1.0

> Если тролишь то троли тоньше. В XML есть стандартизированная иерархичноть, структурирование(разделение контента и метаинформации), символьная структура, валидация, возможности смешивания данных, возможность ключения или ссылок.

> Попробуй все это реализовать в другом тектосовм протоколе - изобретешь свой собственный XML.


А теперь, папа, объясни, нахрена нам всё это в зоопарке?

GuttaLinux
()

>А теперь, папа, объясни, нахрена нам всё это в зоопарке?

Если вам это не надо, значит вы лепите пасочки из песка в детской песочнице и вообще можете не волноваться.

r ★★★★★
()
Ответ на: комментарий от anonymous

> парсинг бинарных данных подразумевает половые отношение с:

> размером, выравниванием, порядком байт, размещением знака,... можно продолжать еще долго.

А можно остановиться и таки вспомнить о SunRPC, ASN.1, CORBA и даже двоичном варианте XML Infoset.

> PS. большинство интернет-протоколов "разговаривают" ЧАЛОВЕЧЕСКИМ ГОЛОСОМ.

Человеческим, но не ксымелем.

tailgunner ★★★★★
()

Хорошая новость. Так, глядишь, это позорище (XML) само и вымрет.

Rexy-Craxy
()
Ответ на: комментарий от r

> Я себе уже ярко представляю бровзерный жабаскрипт который зовет SunRPC :)

JSON премного лучше XMLя - даже для жаба-скрипта

anonymous
()

Unfortunately, XML is not well suited to data-interchange, much as a wrench is not well-suited to driving nails. It carries a lot of baggage, and it doesn't match the data model of most programming languages. When most programmers saw XML for the first time, they were shocked at how ugly and inefficient it was. (C)

anonymous
()
Ответ на: комментарий от r

> Я себе уже ярко представляю бровзерный жабаскрипт который зовет SunRPC :)

Во-первых, речь шла о том, что двоичные форматы ниэпически сложны в распознавании; во-вторых, ну у меня Питон зовнет SunRPC, что такого в Явасрипте, что он этого не может?

tailgunner ★★★★★
()

кричащим про хмл как лучший формат для ИПЦ - вспомнить про MIME:
http://en.wikipedia.org/wiki/MIME
которым вы реально пользуетесь, который существует давным давно и работает как часы (и легко распарсивается).
Для более простых случаев - именованные пары (as properties in java or .ini) или JSON.

anonymous
()
Ответ на: комментарий от anonymous

>JSON премного лучше XMLя - даже для жаба-скрипта

Ты уже ассоциативные массивы научился в JSON сериализовать? JSON является иерархией типа ключ значения. Фигня типа

<value sec="restricted" key="1">bla-bla</value>

в JSON выглядит феерически. Потому между XML и JSON нет взаимно-однозначного соответствия.

r ★★★★★
()

кастую заменитель fb2 в INI стандарте...

anonymous
()

еще кастую selectSingleNode("//client[attribute::name="+login+"]");

anonymous
()
Ответ на: комментарий от anonymous

>http://xmlsucks.org/but_you_have_to_use_it_anyway/does-xml-suck.pdf

КГ/АМ. Он сравнивает хрен с пальцем. Его пример XML имеет значительно больше информации в себе чем его текстовая версия. Одно одновременно обращзает внимание что для текстовой версии нужны специальные парсеры и одновременно забивает на это. Да еще написал практически максимально-многословный вариант XML-предаствления - я удивляюсь как он не додумался дату разложить по состваляющим с тегами. Все остальное сводится к набору нетехнических терминов "толстый", "сложный", "многословный", "ненатуралоьный". ПУсть идет стишки пишет натуралист хренов.

Если уж задумал писать подоюные поделки - пусть проводит сравнительный анализ а не говрит "тут много" но не показывает по сравнению с чем.

"суперпупервсеподдерживающий XML парсер написать - сложная задача". Я посмотрю как он напишет плейнтекстовый парсер который поддерживает все те фишки, что он заявил XML парсер должен поддерживать.



r ★★★★★
()
Ответ на: комментарий от tailgunner

>что такого в Явасрипте, что он этого не может?

В бровзерном? Основная фишка XML таки в переносимости по гетерогенным средам. Посмотри на пример на e4x. Никакой бинарный протокол такого не сделает - развечто тапихать туда огромную кучу метаданных либо писать специфичные для каждого случая данных парсеры.

r ★★★★★
()
Ответ на: комментарий от anonymous

>кричащим про хмл как лучший формат для ИПЦ - вспомнить про MIME

Иерархичность где? Изоляция неймспейсов где?

r ★★★★★
()
Ответ на: комментарий от r

> Никакой бинарный протокол такого не сделает - развечто тапихать туда огромную кучу метаданных

Ну TLV уже давно изобрели. Да и по факту XML - это средство для разработки собственного протокола. Документы одного приложения другим приложением не обработаются (если не следуют стандартизованной схеме). То есть имеем прямое соотвествие: схема == *.x, документ - RPC-сообщение.

tailgunner ★★★★★
()
Ответ на: комментарий от r

> Ты уже ассоциативные массивы научился в JSON сериализовать? JSON является иерархией типа ключ значения. Фигня типа
<value sec="restricted" key="1">bla-bla</value>


что за бред несёшь?
ассоциативные массивы - это и есть ключ-значение.
In JSON:
{кеy1:value1,key2:value2,key3:value3}

или нагляднее (с другими делимитерами: s/:/=/, s/,/\n/):
{
key1=value1
key2=value2
}

так что ты не могешь передать в ассоциативном массиве - что можешь - в ХМЛе?
(хинт: в ИИ фреймы переносят _любую_ информацию, а фреймы - это всего-лишь хеш хешей)

anonymous
()
Ответ на: комментарий от tailgunner

2tailgunner. Верно, но для ХML уже сейчас есть XSLT, и конвертация возможна. Ни для бинарей, ни для INI этого нет и в помине.

Ясен пень XML не серебрянная пуля, но все, что предлагается для сравнения крап в гораздо большей степени

anonymous
()
Ответ на: комментарий от r

> Иерархичность где? Изоляция неймспейсов где?

Вылезай из танка^WХМЛя.

клади JSON в MIME - и нет проблем: MIME - протокол, JSON - иерархии. Можно без JSON. Легко. Подумай как (обговорено много раз на Лоре)

anonymous
()
Ответ на: комментарий от anonymous

>XSLT

XSLT - это очень плохо. Код должен быть написан на императивном языке. Как в ИИ фреймах - в одном из фреймов - какой-нить жава-скрипт или жава или <нужное подставить>.

anonymous
()
Ответ на: комментарий от anonymous

>XSLT

XSLT - это очень плохо. Код должен быть написан на нормальном языке. Как в ИИ фреймах - в одном из фреймов - какой-нить жава-скрипт или жава или <нужное подставить>.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.