Ремесло программиста

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Ремесло программиста » Кодирование символов » Выбираю внешний формат хранения данных для Яра


Выбираю внешний формат хранения данных для Яра

Сообщений 1 страница 8 из 8

1

Хочу взять подмножество UTF-16LE, кодируемое одним символом (без суррогатных пар). При всём уважении к китайским товарищам, они, похоже, в пролёте.

Попробовал вот такие значки:

Код:
kÁkІіIiЯD¿☭«»≠@†☼♥≡≈ѴѵѢѣѲѳ

Всё отображается.
notepad2, просмотровщик Total Commande, vs code под Linux открывают корректно. mc не смог открыть, даже после добавления в
usr/share/mc/mc.charsets соответствующей строчки про UTF-16LE. Ну и ладно, он мне надоел уже давно, этот mc.

Ссылки по теме.
https://c.devhelping.com/article/215797 … er+Windows

Какие ещё грабли меня ждут?

2

Double Commander понимает. Жаль, что не консольный, ну да ничего. И редактировать не разрашает... Но хотя бы ищет, кодировка там называется UCS-2LE
Плохо то, что не позволяет искать по файлам сразу в нескольких кодировках.

Отредактировано budden (2018-09-26 00:13:53)

3

Беру пока utf-8, можно расслабиться :)

4

budden написал(а):

Беру пока utf-8, можно расслабиться

Таблица будет под рукой. (так удобнее)))

Таблица символов юникода

[html]<iframe width="100%" height="800" src="https://unicode-table.com/ru/#control-character" allowfullscreen="allowfullscreen" allowpaymentrequest frameborder="0"></iframe>[/html]

5

Вот сижу себе и думаю:
А не подвести ли нам некую результирующую, подытожив кое-какие высказывания. В первую очередь то, что касается кодировки - в сокращённом виде перенесём в похожую тему в разделе  "Кодирование символов", но из предыдущей темы пока убирать не будем.
Итак, имеем три основных высказывания:

utkin написал(а):

Ну можно опять использовать хитрость. Какая-такая кириллица? Мы за юникод . Ах, Вы не поддерживаете Юникод? Ну значит Вам какие-нибудь препятствия . Ну и опять же, если ИТ фирма получит преференции в виде -1 процента к налогу на прибыль, она, я думаю, быстрей Вас одного найдет решение.  Для какого-нибудь Яндекса 1 процент налога гигантская сумма. И вот обязать более мягко можно. Не кириллицу допустим в ВУЗах использовать, а тотальный Юникод. А уже он дает базу для использования кириллицы . То есть не отнять и поделить, а сначала подготовить условия для использования нужных штук.

budden написал(а):

Юникод - это всего лишь одна из возможных технологий для кириллицы, причём не лучшая. Наша страна достаточно открыто продвигает русский язык и отечественные технологии. Есть закон о гос. языке, закон о запрете вывесок на иностранных языках (или штрафы, я не знаю точно). Есть закон об импортозамещении. Так что тут нет нужды хитрить, а можно просто придумывать наиболее эффективные меры.  Мы ведь в своей стране и, слава богу, обладаем минимальным уровнем суверенитета хотя бы для того, чтобы защищать свой язык на своей территории. Единственное, что государство пока не обратило внимания на эту проблему. Достаточно всего лишь обратить внимание и придумать хороший комплекс мер.

Это непросто. Но тут и можно проявить хитрости. Не один андроид есть на свете, есть несколько платформ для тех же смартфонов. Мы вполне можем выставить требование, что кто не поддерживает русские URL-ы, тот уходит с рынка. Если конкуренция реальна, а не все разработчики платформ возглавляются офицерами Пентагона, то они сделают нам русские URL-ы. А остальные нам не нужны. Если же не дать нам использовать родной язык для них важнее, чем получить с нас денег, то уже тогда придётся раскошелиться на ту платформу, которую мы уже лицензировали (отечественная платформа для смартфонов существует, как минимум, в виде процесса, не знаю насчёт результата).

utkin написал(а):

На данный момент лучшая.

Юникогд и есть эффективная мера. Сухой закон про кириллицу ни к чему хорошему не приведет. 100%. Вы сами пишите, что внедрить русский без участия иностранных компаний проблематично. И тут же хотите внедрить запрет на иностранное. Иностранцы должны помочь нам запретить иностранное? Вам не кажется что это немного наивная детская логика? Бизнес на запретах невозможен. Предложите им что-нибудь, чтобы добиться своих целей. Именно так это работает. И Юникод в этой модели и содержится. Мы не требуем русский, мы требуем право на использование русского. Это справедливо, а мультиязычность это современно. Вот первый этап. А второй этап это обязать свои структуры использовать русский (кнутом и пряником). Все запретить, никого не пущать это даже не 20-й век, а 19-й. Просто не взлетит.

Юрий написал(а):

На данный момент распространённая. Не более того. Популярна за счёт того, что универсальным способом охватывает все живые языки. А мне хотелось бы иметь такую универсальную кодировку.

Любая последовательность символов предваряется кодом языка/алфавита. Затем идут коды символов, которые являются порядковыми номерами букв в этом алфавите. При этом буквы в алфавите располагаются в таком порядке: А, а, Б, б,... Я, я. Не правда ли логично, что буква «а» идёт впереди «Я», а не наоборот, как в Юникоде или в cp-1251? Ну и буква «ё» на своём месте, а не на задворках. Эта кодировка хороша для операций сравнения строк.

Вот тогда возможно кодирование русских букв одним байтом, ведь русских букв — всего 66. Количество китайских иероглифов велико, поэтому для порядкового номера иероглифа в алфавите нужно будет 2 байта. О том, сколько байтов требуется под символ, говорит код языка/алфавита.

И чем Юникод лучше такой кодировки? Только распространённостью...

- Ну вот, тема Юникода переехала в раздел "Кодировка" внутрь темы "Выбираю внешний формат хранения данных для Яра".

6

На самом деле, что касается моего нового проекта, у меня жёсткий дефицит ресурсов, поэтому юникод и utf-8. Но вообще надо как-то абстрагировать кодировку, чтобы потом её можно было бы сменить. А использование кириллицы и использование юникода - это разные вещи, хотя и коррелированные.

Отредактировано budden (2018-09-30 20:27:55)

7

Кодировка - очень больная тема и когда мы хотим изменить что-то в этой теме в лучшую сторону, то просим боженьку дать нам и мозги "по-ширше", да и ум "по-вёртче".
Глянул в сторону принтеров; "ай-ай, вот это да"... Уже вживую печатают всё, что пожелаешь, - вот это техника... (!!!)
Как только эту пресловутую "гайку" не извлекали; и токарь точил, и пресс изготавливал, и из металло-порошка запекали, а теперь вот и на принтере печатают...
И вот она, задача:
Напечатать на принтере букву. Без использования кодировок. Программно. - К чёрту кодировки вообще!...

8

Сандро написал(а):

Без использования кодировок. Программно. - К чёрту кодировки вообще!...

Например, расположение текста в 3 абзаца, да ещё и с отступами в "красной строке" - ну не счастье ли это?

[html]<iframe width="100%" height="800" src="http://patterns.playcode.io/" allowfullscreen="allowfullscreen" allowpaymentrequest frameborder="0"></iframe>[/html]


Вы здесь » Ремесло программиста » Кодирование символов » Выбираю внешний формат хранения данных для Яра