Наименьший достаточный набор соглашений.

Страница: 1 2 »

Сообщений 1 страница 30 из 51

Поделиться12019-03-21 15:29:52

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Я надеюсь, что это будут разумные требования - только русская раскладка, символы других раскладок (например английские) недопустимы, чтобы пользователи не путались в раскладках.

(Это, говорят, не будет работать для Email-ов, а значит нужно делать авторизацию не по учётным данным протокола SMTP, а взять какой-нибудь другой протокол, например XMPP)

Очевидно, возможности некоторых протоколов дублируют возможности других.
А главное - они требуют разное кол-во латиницы.
Основной набор должен подразумевать все данные в двоичном виде - насколько это возможно.
Нет ни одной причины представления нетекстовых данных в виде текста, кроме плохого уровня соглашения.
Ключевые данные должны быть нетекстовыми.

Соответственно, нужно пройтись по вороху снизу вверх, разобрав соглашения на:
- основополагающие
- временно-необходимые, требующие проработки замены
- вредные, которые уже есть чем заменить

Поделиться22019-03-21 15:46:33

Автор: ВежливыйЛис
Активный участник
Сообщений: 408
Провел на форуме:
2 дня 13 часов
Последний визит:
2021-07-13 18:36:29

Поделиться32019-03-22 12:22:30

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Мой опыт общения с бухгалтерской и отчетной ерундой показывает, что текстовое представление таких данных удобно для поиска ошибок. Сами программы об этом обычно сообщают мало. Типичный пример, одна программа готовит данные для другой. У первой все ОК, данный выгрузились. Вторая категорически отказывается их принимать по разным причинам. Текстовый поиск по тем минимальным данным об ошибке позволяет находить и устранять проблему. Даже элементарной правкой текстового файла в каком-нибудь Notepad++. С двоичными данными такой костыль вещь из разряда садо-мазо.

Нет ни одной причины представления нетекстовых данных в виде текста, кроме плохого уровня соглашения.

XML это отличный уровень соглашения. Он единый и универсальный. А что у двоичных форматов?

Соответственно, нужно пройтись по вороху снизу вверх, разобрав соглашения на:
- основополагающие
- временно-необходимые, требующие проработки замены
- вредные, которые уже есть чем заменить

И XML и JSON это основополагающие форматы. Причем текстовые.

Отредактировано utkin (2019-03-22 12:24:16)

Поделиться42019-03-22 13:45:16

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

текстовое представление таких данных

Является весьма специфическим и не м.б. хорошей основой для другого вида данных.

И XML и JSON это основополагающие форматы.

Основополагающие для текста в предопределенного вида кодировках. При том что обычный текст для передачи в виде кодировки знаков неэффективен (сжимается в 3-4 раза нехитрыми и шустрыми алгоритмами), а представление служебной части знаками текста порождает костыли в виде экранирования и спецобозначений.

А что у двоичных форматов?

Есть базы данных. И там текст всего лишь частный случай. Есть записи/структуры и массивы/вектора (в определениях Паскаля/Сплющенных Сей) - это двоичные данные.
Надо разделять "описания данных" от собственно данных. Описание м.б. избыточным или необходимым. М.б. текстовыми (названия), а могут и нет (размеры).
Если мы берем однозначное описание двоичных данных в каком-то Паскале, то их однозначное описание в XML определенно избыточный труд для прикладного программиста. Либо должно поддерживаться компилятором, но тогда требуется, чтобы описания совпадающих структур данных от разных компиляторов разных языков (Сей/Паскаля/Джавы и пр.) совпадали.

Речь же про OSI, сетевые соглашения в целом. Где-то там прошита латиница и кодировка, где-то - нет. Нужна некоторая выборка, т.к. там очень много лишнего.
Если нужно передать, например, 1000 картинок 200х200 точек некоторого набора цветов - должна быть возможность минимума текста.

Поделиться52019-03-24 07:59:39

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Является весьма специфическим и не м.б. хорошей основой для другого вида данных.

Картинки в вебе через XML (и HTML) обычное дело. И не только векторные.

Основополагающие для текста в предопределенного вида кодировках. При том что обычный текст для передачи в виде кодировки знаков неэффективен (сжимается в 3-4 раза нехитрыми и шустрыми алгоритмами), а представление служебной части знаками текста порождает костыли в виде экранирования и спецобозначений.

И между тем все работает . Есть специальный протокол отправки данных в XML

Есть базы данных

Не универсально и не совместимо. XML можно проверить в любом валидаторе (включая удаленно), если есть схема проверки. Нет кучи форматов баз данных. Есть БД у которых даже версии между собой не совместимы.

Есть записи/структуры и массивы/вектора (в определениях Паскаля/Сплющенных Сей) - это двоичные данные.

Начнем с того, что я имел ввиду внешнее хранение и передачу данных. Внутреннее хранение это другой вопрос. Так-то браузер тоже не HTML хранит, а DOM и там вполне себе полноценные компоненты с событиями и свойствами, а не пары тегов.

Если мы берем однозначное описание двоичных данных в каком-то Паскале, то их однозначное описание в XML определенно избыточный труд для прикладного программиста.

Есть готовые библиотеки на разный вкус.

Либо должно поддерживаться компилятором, но тогда требуется, чтобы описания совпадающих структур данных от разных компиляторов разных языков (Сей/Паскаля/Джавы и пр.) совпадали.

Ну и что это за дискриминация? Еще скажите, что данные в Паскале/Си/Джава однозначно переводятся между собой. Возьмите строки например.

Если нужно передать, например, 1000 картинок 200х200 точек некоторого набора цветов - должна быть возможность минимума текста.

Для картинки в формате SVG, да?

Поделиться62019-03-24 11:29:15

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Картинки в вебе через XML (и HTML) обычное дело. И не только векторные.

И там не только картинки.

Есть готовые библиотеки на разный вкус.

Есть куча зависимости, потому что протоколы - высокоуровневые. А нужно рассматривать глубже, весь ворох, а не только то, что сверху.

Возьмите строки например.

Строки Сей не имеют ряда эффективных алгоритмов. Поэтому их применение очень плохо. Размер приходится хранить отдельно и компилятор не знает о нем явно.
Поэтому и нужно рассматривать разные протоколы.

Поделиться72019-03-24 12:18:57

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

И там не только картинки.

Да, в XML можно не только картинки :rofl:

Есть куча зависимости, потому что протоколы - высокоуровневые. А нужно рассматривать глубже, весь ворох, а не только то, что сверху.

Тогда нужен полный список требований.

Поделиться82019-03-24 12:26:51

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Да, в XML можно не только картинки

И только картинки без текстовой оболочки - нельзя. Набор же знаков там явно слишком избыточный и специфичный.

Еще скажите, что данные в Паскале/Си/Джава однозначно переводятся между собой.

Дело не в переводе м/у собой а в описании и передаче с наименьшим кол-вом костылей. Для передачи совместимость типов компилятора не требуется - уровнем ниже передаются пакеты байтов.
Если отправление и обработка написаны на одном языке, то XML - просто лишняя прослойка и альтернативное включение в цепочку обмена должно идти через изучение нашего языка, а не библиотеки обработки XML.

Поделиться92019-03-24 18:00:53

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Дело не в переводе м/у собой а в описании и передаче с наименьшим кол-вом костылей.

Особенность программирования в том, что если костыль уже есть и работает, то является технологией. Вы просто подключаете ее и используете.

Набор же знаков там явно слишком избыточный и специфичный.

Да, взамен удобства чтения человеком.

Для передачи совместимость типов компилятора не требуется - уровнем ниже передаются пакеты байтов.

XML тоже поток байтов.

Если отправление и обработка написаны на одном языке

В этом и есть проблема. Мир таков, что нужно интегрироваться с разными системами. Я же привел практический пример. Есть бухи, есть всякие госнадзорные конторы. Между ними разные языки, разные среды исполнения и разные уровни применения. Здесь бинарность среды тормозит процессы интеграции систем.

изучение нашего языка

Значит наш язык должен быть лучше или не хуже. С точки зрения разработчиков, а не приказом какого-то министерства.
Если идти нормальным процессом диалога, то технологий может быть больше одной. Пусть будет универсальный двоичный формат передачи данных и аналог XML, проблем нет. Разработчик сам решит, что лучше в том или иной ситуации. В случае передачи большого объема (видеопоток например) передача в двоичном контейнере конечно предпочтительней. Отправка чека OFD (это с онлайн-кассы) лучше проводить в текстовом формате. Каждому по способностям, каждому по потребностям.

Отредактировано utkin (2019-03-24 18:12:12)

Поделиться102019-03-24 19:43:25

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Отправка чека OFD (это с онлайн-кассы) лучше проводить в текстовом формате.

Это неэффективно. Текст вообще неэффективен в системах учета как связующая информация - ни одна существующая кодировка. Два алфавита с пересечинем букв - уже ахтунг. Привет коррупция, фишинг и т.п. Ну, конечно же, лютые тормоза.

Здесь бинарность среды тормозит процессы интеграции систем.

Необязательно так. 1С вполне может навязывать свои бинарные форматы, удобно читаемые средствами этой платформы.
Процесс интеграции тормозят люди - технологическая доля издержек просто ничтожна и легкость манипуляции текстовых данных для бюрократов, которые еще можно и догадаться распечатывать, скорее всего, большой-пребольшой тормоз.
Программисты не должны ковыряться в дампах памяти и кусках рабочих данных - во-первых, это уровень быдлокодинга, во-вторых, нарушение чьей-то личной жизни.
Если будет почтовая служба читать Ваши письма, чтобы разобраться с их хранением и передачей - очевидно, что это непрофессионально.
А уж про коммерческие данные просто молчу.

Поделиться112019-03-24 21:15:18

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Привет коррупция, фишинг и т.п.

Это не проблема стандарта, а проблема кривых рук всяких там Сбербанков. Коррупция вообще отдельный феномен.

Ну, конечно же, лютые тормоза.

Тормоза действительно есть, но уже давно не лютые.

1С вполне может навязывать свои бинарные форматы, удобно читаемые средствами этой платформы.

Тут приходит очередь выгрузки зарплат в банк и 1С поднимает лапки.

Процесс интеграции тормозят люди - технологическая доля издержек просто ничтожна и легкость манипуляции текстовых данных для бюрократов, которые еще можно и догадатся распечатывать, скорее всего, большой пребольшой тормоз.

Ну так-то да. Я же писал - можно всем приказать, а кто не согласен расстреливать без суда и следствия прямо на рабочем месте. Вопрос только станет ли от этого жизнь лучше, а работа эффективней? Ответ нет . Процесс интеграции тормозят не люди, а организация их работы. Не сказать, что она прямо вот ужасна. Просто она ориентирована для другого.

легкость манипуляции текстовых данных для бюрократов, которые еще можно и догадатся распечатывать, скорее всего, большой пребольшой тормоз.

На самом деле нет - в HTML обработка намного сложней реестра сумм и зарплатных карт. Объектов может быть много, но все они примитивны.

Программисты не должны ковырятся в дампах памяти и кусках рабочих данных - во-первых, это уровень быдлокодинга

Уровень быдлокоддинга это когда приходится ковырять бинарные данные. Ковырять данные которые изначально предусматривают такую возможность это норм.

во-вторых, нарушение чьей-то личной жизни.

Для этого есть допуски и шифрованные каналы связи. ЭП вполне эффективная вещь.

Если будет почтовая служба читать Ваши письма, чтобы разобраться с их хранением и передачей - очевидно, что это непрофессионально.

Яндекс, Майл и Гугл и так читают Ваши письма.

А уж про коммерческие данные просто молчу.

Но сейчас это так и работает и никто еще не умер от этого. Все эти онлайн-банки передают в основном XML .

Поделиться122019-03-24 22:56:58

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Это не проблема стандарта

Это проблема стандарта.

Тормоза действительно есть, но уже давно не лютые.

Дело же не только в ожидании сотрудников, но и в умножении стоимости развертывания на большой коэффициент.
Как бы это лучше пояснить... приличный китайский маршрутизатор за штуку баксов обрабатывает порядка 150 млн. пакетов в секунду и практически любой магазинный чек можно закодировать в 1 пакет.

Ковырять данные которые изначально предусматривают такую возможность это норм.

Это жуткий быдлокодинг, утечки, риски и прочий дикий капитализм. Свободное ковыряние должно быть предусмотрено только для тестовых данных.
За сбор личных выписывают миллионные и миллиардные (в долларах) штрафы.

Но сейчас это так и работает и никто еще не умер от этого.

А почему должны умирать? Тут же денежные утечки.

Все эти онлайн-банки

Имеют безопасность ниже уровня плинтуса. Поэтому США ловят хакеров по всему миру, крадущих через технологии Visa и MasterCard, делая вид что только хакеры плохие, а дырявые во всех местах технологии - хорошие.

Поделиться132019-03-25 07:19:49

Автор: Павиа
Активный участник
Сообщений: 355
Провел на форуме:
18 дней 8 часов
Последний визит:
2020-11-06 19:50:25

Картинки в HTTP передаются жутким способом.

Массив пикселей сжатый zip на ввходе png. Перекодированные в Base64 сохранённый в xml. Который сжат протоколом http(zip) и зашифрован припомощи SSL.

Удобин ли xml? Да, программисты могут говорить что у них есть валидация. Тестирование по входу. А что наделе? А на дели оказывается что те проверки которые есть недостаточны. Они лишь проверяют при переводи в бинарный вид. Но не проверяют допуска бинарных данных.

Xml удобин тем что можно обрабатывать невсе поля, а только нужные. Их можно добавлять и убирать, а вот с бинарными так неполучится.

Поделиться142019-03-25 07:47:30

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Это проблема стандарта.

Эти вопросы решаются другими средствами. Утечки данных возникают по причине тотальной неграмотности пользователей, а не слабости XML. Ну в чем проблема открыть бинарник, скажите мне? Вот старые форматы, ладно там csv - это фактически археологический предок XML (в смысле широкого применения до), но возьмите DBF. Очень популярный формат и до сих пор некоторые онлайн системы принимают и DBF и XML. И что там мешает открыть и поправить данные? Берете Экзель (а в Опенофисном Калке даже лучше) и понеслась. Какие проблемы? Ответ - никаких. Те же траблы с кодировкой текстовых данных.

Дело же не только в ожидании сотрудников,

Независимо от формата данных стандартный ответ банка в течение 3 дней. То есть банк имеет право выполнить платеж в течение трех дней. Поэтому тут проблемы в ожидании сотрудников минимальны, так как банк выполняет свои технологические процедуры (гоняет деньги со счетов, для накопления нужной суммы, проводит проверку безопасности и т.д.). То есть люди получат зарплату в течение дня (как правило, но банк может затянуть время отправки средств) и это абсолютно не связано с временем отправки XML.

Как бы это лучше пояснить... приличный китайский маршрутизатор за штуку баксов обрабатывает порядка 150 млн. пакетов в секунду и практически любой магазинный чек можно закодировать в 1 пакет.

Соответственно он отправляет текстовые данные не за 0,001, а за 0,01 секунду. Это конечно очень печально, да. На фоне остального трафика, забитого видео с котиками из Вконтакте для данной организации это реальная проблема Это еще IPv6 не работает как положено, там пакет до 4-х Гб может быть. Ну ничего, IPv4 уже кончились, еще лет 5-10 и котиков можно будет смотреть в FULL HD не страдая от каких-то там отправок XML в банк.
Ну, а если отбросить сопли, а взять калькулятор. Средний такой XML для большого числа сотрудников (вот прям с конкретной организации) - 37 кБ на 70 сотрудников. На оптоволокне это не чувствуется от слова никак. И даже если там будет 3,7 кб, а не 37 кб я это не замечу.

Это жуткий быдлокодинг

Весь мир начал движение от бинарных форматов в текстовые (и от компиляции к интерпретации) и это жжжж не спроста! И потом 20% Интернета построено таким образом (я про HTML и всех его родственников и прихвостней, навроде CSS). И все существования веба доказывает нам, что в этом есть смысл. Да есть грехи, но не так, чтобы прямо убиться головой об стену.

Свободное ковыряние должно быть предусмотрено только для тестовых данных.

Я уже писал - формат CSV

За сбор личных выписывают миллионные и миллиардные (в долларах) штрафы.

Все верно. А теперь давайте рассмотрим детали. Кому их выписывают? Всяким ~~ВК (хотя кто выпишет филиалу наших органов безопасности )~~ Фейсбукам и Твиттерам. Почему, потому что утекают миллионы учетных записей. Вы верите что это утекло в XML? Это утекают бинарные базы данных. Выводы сделаете сами.

А почему должны умирать? Тут же денежные утечки.

Если сравнивать объем денежного потока (РФ не берет, потому что тут все искусственно и Сбербанк не отвечает за свои утечки, так как монополист) и объем потерь, то в процентном соотношении проблема оказывается ничтожной. Причины описал выше - дело в самом нестабильном элементе информационных систем - в человеке. Само слово человек с машинного переводится как рас3,151592здяй и никак иначе.

Имеют безопасность ниже уровня плинтуса.

Опять же не технологически. Тот же несчастный Сбер имеет ВПН канал для организации передачи данных личного кабинета (речь идет о корпоративном обмене, а не шифрование через браузер для физ лица).

Поэтому США ловят хакеров по всему миру, крадущих через технологии Visa и MasterCard, делая вид что только хакеры плохие, а дырявые во всех местах технологии - хорошие.

В таких компаниях в процент обслуживания банков, подключенных к данной системе вложена сумма хакерского ущерба. Поэтому все ОК.

Массив пикселей сжатый zip на ввходе png. Перекодированные в Base64 сохранённый в xml. Который сжат протоколом http(zip) и зашифрован припомощи SSL.

Поэтому и придумали SVG.

А на дели оказывается что те проверки которые есть недостаточны.

Ложки нет нигде. Но зачатки системы контроля есть. И она может отловить значительную часть проблем.

Картинки в HTTP передаются жутким способом.

Картинки передаются разными способами. Есть SOAP в него пихают XML. А что внутри XML может быть ведомо только Аллаху. Там есть способ передачи двоичных данных в текстовом формате.
Есть WSDL это прямо вот вообще все что хочет Михалник, но только для Интернета и на буржуйском (и естественно на XML).
WDDX - это упорядоченный стандарт, там есть определения для кучи типов данных. Соответственно валидация более строга и уменьшает количество ошибок.
И вообще как мне кажется Михалник проспал наступление текста. Читаем про YAML:
- быть легко понятным человеку;
- поддерживать структуры данных, родные для языков программирования;
- быть переносимым между языками программирования;
- использовать цельную модель данных для поддержки обычного инструментария;
- поддерживать потоковую обработку;
- быть выразительным и расширяемым;
- быть лёгким в реализации и использовании;
Вы же к этому стремитесь?
XAML, например, текстовый формат описания графического интерфейса программ на C#. Альтернатива XUL.
Да и Дельфи/Лазарус хранят свои формы до компиляции в текстовом виде.

Отредактировано utkin (2019-03-25 08:30:30)

Поделиться152019-03-25 08:19:35

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Вот как устроена форма:

object Form1: TForm1
Left = 22
Height = 342
Top = 205
Width = 414
Caption = 'Form1'
ClientHeight = 342
ClientWidth = 414
object Label1: TLabel
Left = 8
Height = 15
Top = 24
Width = 121
Caption = 'Количество войнов, n'
ParentColor = False
OnClick = Label1Click
end
object SpinEdit1: TSpinEdit
Left = 152
Height = 23
Top = 16
Width = 90
MinValue = 2
TabOrder = 0
Value = 2
end
object Label2: TLabel
Left = 8
Height = 15
Top = 64
Width = 106
Caption = 'Убиваемый воин, k'
ParentColor = False
end
object SpinEdit2: TSpinEdit
Left = 152
Height = 23
Top = 64
Width = 90
MinValue = 1
TabOrder = 1
Value = 1
end
object Button1: TButton
Left = 312
Height = 25
Top = 40
Width = 75
Caption = 'Расчет'
OnClick = Button1Click
TabOrder = 2
end
object Memo1: TMemo
Left = 8
Height = 184
Top = 144
Width = 398
TabOrder = 3
end
object Label3: TLabel
Left = 8
Height = 15
Top = 128
Width = 53
Caption = 'Результат'
ParentColor = False
end
end

Ну, не XML конечно. Но я думаю, что вполне читаемо и понятно из Блокнота. Можно даже восстановить как это выглядело бы на экране при желании.

Отредактировано utkin (2019-03-25 08:20:38)

Поделиться162019-03-25 08:44:09

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Весь мир начал движение от бинарных форматов в текстовые (и от компиляции к интерпретации) и это жжжж не спроста!

Наоборот. Мир только начал разрабатывать более эффективные и удобные форматы.

Поделиться172019-03-25 09:17:29

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Наоборот. Мир только начал разрабатывать более эффективные и удобные форматы.

Ну вот я Вам их и привел .

Поделиться182019-03-25 09:19:26

Автор: ВежливыйЛис
Активный участник
Сообщений: 408
Провел на форуме:
2 дня 13 часов
Последний визит:
2021-07-13 18:36:29

МихалНик держись, твоя точка зрения - правая (правильная). А Уткин, если бы столько же текста писал в свой транслятор - уже бы закончил его.

Поделиться192019-03-25 09:41:28

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

А Уткин, если бы столько же текста писал в свой транслятор - уже бы закончил его.

Задача писать правильно, а не все подряд . Когда я писал все подряд, получилась В-1.

МихалНик держись, твоя точка зрения - правая (правильная).

Опять 19-й век пришел учить 21-й . Правильны обе точки зрения. Это вопрос специализации. Я уже писал выше - потоковые данные гонять в XML это интересно. Речь там, видео. Относительно небольшое число записей (скажем менее 5-10 тыщ.) можно паковать в XML. Я вам говорю - парсинг этой страницы форума сложней, чем парсинг каких-нибудь данных в Фонд социального страхования.

Поделиться202019-03-25 10:19:28

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Тот же несчастный Сбер имеет ВПН канал для организации передачи данных личного кабинета (речь идет о корпоративном обмене, а не шифрование через браузер для физ лица).

Но Вы же сами выше написали, что все уязвимости через физ. лица)

Вот как устроена форма

Но с ней в Делфи/Лазарусе/Тайфуне никто не работает как с текстом. Какой там формат - вообще никому не важно.

парсинг каких-нибудь данных в Фонд социального страхования.

Потому что надо стандартизировать язык работы на гос. уровне. И представление данных на языке вплоть до каждого бита, а не так чтобы отгадывать какие-то кодировки.
Это не значит, что не должно быть текста - это значит что знакоряд должен быть глубже и точнее проработан с разных сторон: эффективность, полноста, простота, гибкость, безопасность.

- быть лёгким в реализации и использовании;

Это не совместимые пункты. Улучшение пользовательских качеств требует существенного усложнения внутренней модели.

- поддерживать структуры данных, родные для языков программирования;
- быть переносимым между языками программирования;

Эти тоже неоднозначны. Точнее, наш ЯП должен легко описывать данные любых других языков, чтобы переводить все в него.

- быть выразительным и расширяемым;

Расширяемость через терминальные знаки некоторой кодировки - это кривой путь. Потребовалось очень много лет, чтобы ввести в стандарт С++ элементарные строки с явным хранением длины.
А деревья и вовсе прекрасно упаковываются без текста и без мат. ожидаемой необходимости переписывать полфайла при изменении данных, чего XML не умеет.
Да, многие данные отдельного учреждения можно хранить и обрабатывать в XML. Да, мощности только растут.
Но это плохо масштабируемое решение. ПО масштабируется намного дешевле, чем вычислительные мощности.

Поделиться212019-03-25 10:44:29

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Но с ней в Делфи/Лазарусе/Тайфуне никто не работает как с текстом. Какой там формат - вообще никому не важно.

Вы только, что ударили по двоичным форматам. Сами же пишете не важно. На самом деле важно. Я даже знаю почему там так сделано . Потому что так быстрей отладить выгрузку/загрузку данных в программе. Намного проще сопровождать такой формат, в сравнении с двоичным.

Потому что надо стандартизировать язык работы на гос. уровне.

Нет, не надо. Тоталитаризм ни к чему хорошему не приводит. Как говорил не забвенный Черномырдин - хотели как лучше, а получилось как всегда. Государство не умеет само решать такие вопросы и поэтому он стопроцентно будет решен через задницу. И это касается всех государств без исключения. Такие вещи должен регулировать рынок, а он в мировом масштабе недвумысленно говорит об XML. Посмотрите на РФ - постоянно создаются какие-то тепличные условия, все время госмонополии тянут одеяло на себя. И к чему это хорошему приводит? Качество падает настолько, что видно невооруженным глазом для неспециалиста.

И предствление данных на языке вплоть до каждого бита, а не так чтобы отгадывать какие-то кодировки.

Потеряете в гибкости и в результате отстанете от остального мира. Потому что межбанковское взаимодействие Вы через собственную систему не организуете, а извольте соответствовать. В XML к тому же можно указывать кодировку. Если ее нет, то это Юникод независимо есть там BOM или нет.

Это не значит, что не должно быть текста - это значит что знакоряд должен быть глубже и точнее проработан с разных сторон: эффективность, полноста, простота, гибкость, безопасность.

XML куда уже гибче и полней? Современные парсеры весьма эффективны. Я уже писал и еще раз скажу разбор HTML5 намного сложней именно из-за того что теги наполнены смыслом, а не просто теги. Здесь же Вы получаете эффективный контейнер данных. А уже как парсить логику это Ваши проблемы.

Но Вы же сами выше написали, что все уязвимости через физ. лица)

Ну? Бросил человек флешку с DBF и бросил человек флешку с XML. Что поменялось-то? Открыл в Экзеле или в Блокноте. И? Кто здесь крайнее звено? XML? DBF? Или все-таки тот кто бросил флешку, где попало?

Отредактировано utkin (2019-03-25 10:52:58)

Поделиться222019-03-25 10:51:20

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Государство не умеет само решать такие вопросы и поэтому он стопроцентно будет решен через задницу. И это касается всех государств без исключения.

Так и запишем: ASCII не использовать.

Поделиться232019-03-25 10:54:47

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Так и запишем: ASCII не использовать.

Она уже обречена. Вероятно будет использоваться где-нибудь в утюгах и холодильниках нашего производства и то не факт. Юникод все равно сожрет всех, если не придумают что-то поумней. И нравится Вам это или нет, но тенденция очевидна - использование данной кодировки растет и быстро. Винда тоже умеет Юникод ~~(просто притворяется)~~, а в Линуксах это вообще богоугодное дело.

Неэффективны и создают эти самые монополии. Смотрите еще раз: 1 китайский маршрутизатор за штуку баксов способен в секунду разрулить 1 пакет от каждого жителя РФ к другому.

Я Вам писал - уже каналы шире, чем 37 Кб. Я же приводил пример. Еще пример - выгрузка примерно 40 человек в ЕГИССО (это льготы по пенсионному фонду) - 85 кб, csv точно такой же 19 кб.

Отредактировано utkin (2019-03-25 10:57:06)

Поделиться242019-03-25 10:56:27

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

XML куда уже гибче и полней? Современные парсеры весьма эффективны.

Неэффективны и создают эти самые монополии. Смотрите еще раз: 1 китайский маршрутизатор за штуку баксов способен в секунду разрулить 1 пакет от каждого жителя РФ к другому.
Теперь посмотрите на интернет-тарифы мобильной связи и набор их услуг, про ограничения кол-ва смс и объема траффика не забудьте.
Тут Utkin может сказать, что, конечно, к нему требуется целая инфраструктура (что правда), но по факту и устройства за 50 баксов способны обрабатывать много тысяч пакетов/секунду.
Где-то люди прикидывали - 5000 смартов достаточно объединить в сеть, чтобы обеспечить связью смс-ками всю Москву.

Юникод все равно

Небезопасен от слова совсем. Притом что абсолютно все редакторы (а также некоторые аукционы) закрывают на это глаза.

Поделиться252019-03-25 11:00:04

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Теперь посмотрите на интернет-тарифы мобильной связи и набор их услуг, про ограничения кол-ва смс и объема траффика не забудьте.

1,5 Гб бесплатно на ежемесячной абонентской плате (там пакет минут, пакет трафика и пакет СМС) за 300 руб. в месяц. Не вижу проблему.
Скорость здесь: https://corp.megafon.ru/press/news/fede … -1307.html
Я понимаю так это самая крутая, можно смело делить на 2 или 3 для повседневного использования.

Поделиться262019-03-25 11:01:59

Автор: utkin
Цензор
Сообщений: 517
Провел на форуме:
6 дней 17 часов
Последний визит:
2020-01-16 09:53:03

Небезопасен от слова совсем. Притом что абсолютно все редакторы (а также некоторые аукционы) закрывают на это глаза.

Это как?????????? Чем АСКОИ безопасней ?

- вредные, которые уже есть чем заменить

Я бы использовал формулировку - устаревшие, а не вредные. Раз они использовались, значит польза была все же какая-то. Вот, например, csv, он не вреден, он просто стар.

Отредактировано utkin (2019-03-25 11:34:07)

Поделиться272019-03-25 16:05:03

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

1,5 Гб бесплатно на ежемесячной абонентской плате (там пакет минут, пакет трафика и пакет СМС) за 300 руб. в месяц.

У мну за те же 300р на порядок больше (+более чем достаточно минут и смс-ок). В "Гадюкино" в Алт. крае еше 5 лет назад был ночной безлимит и 50 Гб на дневной в месяц, кажется, рублей за 600, а в потом Подмосковье был круглосуточный безлимит за те же деньги (но с ограничением в неск. Гб/мес внутри МКАД).

Скорость здесь: https://corp.megafon.ru/press/news/fede … -1307.html

300 рублей за 12 секунд пиковой скорости?) Получается, где-то за один фильм онлайн - за такие деньги можно в кинотеатр сходить.

Не вижу проблему.

Взял первого попавшегося оператора в Москве (скорее всего есть выгоднее, просто лень искать):
500 р/мес за 200Мбит/с. Гигабитка - 1,5 т.р/мес (пропускной объем более 300 Тбайт - в 200 тысяч раз больше). Подумаешь, перепраплата за передачу единицы данных в десятки тысяч раз, не проблема. Правда, называется жутким монополизмом криминального происхождения. Млярдный штраф он минюста США за делишки в Узбекистане вполне намекает.
Реальная московская мобильная связь - около 10Мбит/с. Это 20 и 150 линий соответственно на тариф. На одну выходит 25 и 10 руб/мес.
Вафля на 300 Мбит/с дешевле 50 баксов и потребляет около или даже менее бакса в месяц электроэнергии.

Поделиться282019-03-25 16:32:33

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

Чем АСКОИ безопасней

В нем меньше похожих знаков. Только для нас бесполезен.

Раз они использовались, значит польза была все же какая-то.

Но их переиспользование и расширение м.б. для нас вредным. Например, расширение чужой кодировки нашими знаками, некоторые из которых выглядят аналогично.
В старом стандарте на эти случаи неспроста были одни и те же самые коды для русского и английского.

Вот, например, csv, он не вреден, он просто стар.

Там вредные разделители. Поэтому для него не существует ряда эффективных основных алгоритмов использования. Аналогично и с сишечными строками и XML.

Поделиться292019-03-25 20:11:05

Автор: Павиа
Активный участник
Сообщений: 355
Провел на форуме:
18 дней 8 часов
Последний визит:
2020-11-06 19:50:25

МихалНик написал(а):

В нем меньше похожих знаков. Только для нас бесполезен.

Но их переиспользование и расширение м.б. для нас вредным. Например, расширение чужой кодировки нашими знаками, некоторые из которых выглядят аналогично.
В старом стандарте на эти случаи неспроста были одни и те же самые коды для русского и английского.

Там вредные разделители. Поэтому для него не существует ряда эффективных основных алгоритмов использования. Аналогично и с сишечными строками и XML.

Не вижу проблем строи индекс и делаем, что хотим.
Что касается вставки внутри текста. Ну извените меня но большинство форматов файлов такое не позволяет. Исключения пожалуй БД и то не все. Даже MS имея такую фишку в DOC отказался от неё и перешёл на DOCX.
И правильно, так как это не задача формата файла а задача файловой системы.

В войне форматов выживут самые приспособленные. Вот к примеру WAV формат хороший бинарный формат. Но когда у вас вибро диагностика с 10-30 датчиков да ещё длиною в час и размеры файлов на ГБ они перестают быстро отображаться. И пока не построишь пирамиду(вейвлет разложение) быстрая перемотка и масштабирование работать не будет.

И вставка требует пересчёта и смещения. что для TXT то и для WAV и Bitmap.

Поделиться302019-03-25 20:54:47

Автор: МихалНик
Администратор
Сообщений: 586
Провел на форуме:
15 дней 9 часов
Последний визит:
2022-12-14 01:09:12

это не задача формата файла а задача файловой системы.

Она вообще не обязана что-то знать о видах данных, коих м.б. придумано сколь угодно. Те же "расширения" в именах файлов - просто жуткие костыли.