[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: Untitled.png -(81 KB, 640x400, Untitled.png)
81 No.20037  

Столкнулся в ФФ с проблемой, что в китайском тексте те иероглифы, которые есть в японском он иногда показывает японским шрифтом. В основном пространстве сайта такое редко, но вот во всяких перапера и заголовках постоянно. Я сделал для всех вариантов китайского и японского один шрифт MingLiU и задумался, а как сделать чтобы всё было правильно? вдруг мне и японский пригодится когда-нибудь
Отсюда вопросы:
Какими шрифтами в браузере анон пользуется для китайского? Наверняка МинЛи не самый удобный.
А какими шрифтами анон пользуется в браузере для японского?
А как сделать, чтобы ФФ не вёл себя как бака?

>> No.20038  

>>20037
У меня обратная проблема, хром всегда берёт китайские глифы для японского, от чего у меня РАЗДРАЖЕНИЕ и юзерстили на нужные мне сайты.

Рекомендую послать луч рака яичек разработчикам юникода, которые решили объединить разные по сути глифы, против сути юникода.

>> No.20039  

Например мой стиль для ычана выглядит так:

body {
font-family: Calibri, Meiryo;
}
>> No.20040  

Я обожаю шрифт Microsoft JhengHei, что появился в Висте, до сих пор не могу на него нафапаться.

>>20038

> Рекомендую послать луч рака яичек разработчикам юникода, которые решили объединить разные по сути глифы, против сути юникода.

Я бы послал лучи ненависти японцам, которые считают одинаковые глифы разными.

Это из-за чёртовых японцев создатели уникода не могли объединить упрощённые с традиционными (в японских кодировках есть и 學, и 学 => нельзя объединять их в уникоде для совместимости => придётся кодировать упрощённые и традиционные раздельно).

Вообще, в идеальном мире 應, 应 и 応 кодировались бы одинаково и выбирались бы по шрифту. Вот это соответствовало бы принципам уникода.

>> No.20041  

>>20040
Разные же символы в восточных языках могут писаться разным образом блин. Просто символ, комбинации и прочее. Так почему они объеденили разные начетрания в CJK. Точнее я знаю почему, тк тогда юникод был ещё двухбайтовым.

Нужно, чтобы браузеры нормально понимали разные языки и выбирали глифы и шрифты. (Афаик правильно это делает внезапно только IE) Но всё-таки по-моему каждый вариант написания должен иметь свой кодпоинт. Выбирать шрифтами по контексту сложнее (особенно на странице где у нас дофига разных языков), чем если у каждого символа свой кодпоинт.

>> No.20042  

>>20041

> восточных

европейских я имел в виду

>> No.20043  

>>20041

> Разные же символы в восточных языках могут писаться разным образом блин. Просто символ, комбинации и прочее. Так почему они объеденили разные начетрания в CJK.

В европейских языках комбинации и штуки типа ς/σ вводятся только для совместимости с legacy encodings. Новые не добавляются. Если бы уникод создавался с нуля, никаких ä/ö/š/ς там бы не было.

Вообще, в случае с иероглифами мне кажутся логичными два кодирования:

  • Полностью графическое; этому мешают ограничения на кол-во символов;
  • Полностью логическое; этому мешает тот факт, что у китайцев и японцев разные взгляды на то, что такое «одинаковые иероглифы» (у китайцев 学=學, у японцев 学≠學).

Вообще, идеальным IMHO было бы «разбиение» иероглифов на комбинируемые куски, типа 䒤 = combining grass radical on the top+ 日, 萌=combining grass radical on the top+combining sun to the left+月. Понятно, что в сложных случаях такого не сделаешь (в CangJie эту идею довели до абсурда — такого не надо), но это бы сократило число иероглифов на порядок. Заодно появилось бы место для графических вариантов: так, стало бы просто добавить тайваньскую траву (в 4 черты) и материковояпонскую (3 черты) отдельно.

>> No.20044  

>>20043
Комбинации в юникоде есть потому, что есть языки с комбинациями, типа арабского. А европейское добавили как возможно и как совместимость и как фишку.

> этому мешают ограничения на кол-во символов;

Неправда. 200 тысяч кодпоинтов выделить вполне можно, причём это не сильно уменьшит банк символов. А 200к - это с избытком хватит вообще на всё.

>> No.20045  
>Я бы послал лучи ненависти японцам, которые считают одинаковые глифы разными.

А сам, поди, считаешь к, о, а в кирилице отличными от k, o, a в латинице. Почему кирилице и латинице не надо делить кодпоинты друг с другом, а японским иероглифам с китайскими надо?

>> No.20046  

>>20045

> А сам, поди, считаешь к, о, а в кирилице отличными от k, o, a в латинице. Почему кирилице и латинице не надо делить кодпоинты друг с другом, а японским иероглифам с китайскими надо?

Кстати, нет, не считаю. Считаю, что куча проблем бы исчезла, если бы их кодировали одинаково. Про k с оговорками (в принципе, можно и его объединить ради болгарской кириллицы), а вот a/а, e/е, h/һ, i/і, j/ј, о/o, с/c, s/ѕ, y/у, х/x и объединять — было бы классно.
>>20040-кун

>> No.20048  

>>20046
А ты в курсе, что из себя представляют шрифт. Там таблицы codepoint->glyph к примеру? Никто не запрещает сослаться на один и тот же глиф с двух разных кодпоинтов. Но кодировать разные буквы одинаково странно, я считаю.

>> No.20049  

>>20048

> А ты в курсе, что из себя представляют шрифт. Там таблицы codepoint->glyph к примеру? Никто не запрещает сослаться на один и тот же глиф с двух разных кодпоинтов.

Ну так это же ужасно. Потом кто-то напишет х вместо x — и ищи себе ошибку до скончания веков.

> Но кодировать разные буквы одинаково странно, я считаю.

А как определить, что такое разные буквы? В куче языков диграфы считаются одной буквой. Почему гражданское а и устаное а — это одна буква, а гражданское я и уставное ѧ — разные? В любом случае приходится идти на компромисы.

Я щитаю, что графическое кодирование самое логичное из всех возможных.

>> No.20050  

>>20049

>Почему <…> гражданское я и уставное ѧ — разные?

По-моему ответ очевиден. 學 и 学 тоже нужно кодировать по-разному.

>> No.20053  
Файл: cyrillic.GIF -(1 KB, 84x87, cyrillic.GIF)
1
> По-моему ответ очевиден.

Очевидно только то, что ты не знаешь матчасти. Была куча начертаний, где юс малый с одной ножкой, и куча стилизированных под устав шрифтов, где я писали ѧ.

Заодно в качестве примера на пикрелейтед пару букв, которые уникод кодирует одинаково. Тоже, видимо, «очевидно».

>> No.20054  

>>20053
Матчасть я знаю достаточно. Это очевидно разные глифы, которые должны кодироваться по-разному.

>> No.20055  

>>20053
На твоей картинке одни и те же буквы написанные разными шрифтами. Что ты хотел ей показать?

>> No.20056  
Файл: Screen Shot 2012-07-07 at 11.51.15 PM.png -(105 KB, 726x584, Screen Shot 2012-07-07 at 11.51.15 PM.png)
105

ОП, у меня была подобная проблема на iOS; решилась коррекцией приоритета языков — надо было поменять местами японский и китайский. http://waytheysayit.tumblr.com/post/23096938957/fix-chinese-text-on-ios Не исключено, что тут нечто похожее. Попробуй поковыряться с этими настройками.

>> No.20057  
> 20055
> На твоей картинке одни и те же буквы написанные разными шрифтами. Что ты хотел ей показать?

Я хотел показать, что разница между я и ѧ такая же, как и между гражданским и десятичным и уставным.

>> No.20058  

>>20054

>Матчасть я знаю достаточно. Это очевидно разные глифы, которые должны кодироваться по-разному.

Лол. Ты даже не понимаешь, что такое глиф.

>> No.20059  

>>20057
Да, но ведь в соверменной русской орфографии юс использовать нельзя, и он в ходу только в церковнославянском. Так же нельзя мешать старые формы иероглифов и новые. Посему лучше бы кодировать их отдельно.
>>20058
Что простите? Я написал всё верно, вы что-то путаете. http://ru.wikipedia.org/wiki/Глиф

>Глиф (др.-греч. γλύφω — вырезаю, гравирую) — элемент письма, конкретное графическое представление графемы, иногда нескольких связанных графем (составной глиф), или только части графемы (например, диакритический знак). Два или более глифа, представляя один и тот же символ, используемые попеременно или выбранные в зависимости от контекста, называются аллографами друг друга. И если графема — это единица текста, то глиф — единица графики.
>> No.20061  

>>20059

> Что простите? Я написал всё верно, вы что-то путаете. http://ru.wikipedia.org/wiki/Глиф

Объясняю популярно: а из шрифта Ариал и в шрифте Таймс — разные глифы. Так же как и курсивная и прямая а.

Ты предлагаешь кодировать их по-разному? Пиши кодпойнты конкретного шрифта и не трогай уникод.

>> No.20062  

>>20061
Объясняю популярно.
Это совсем другое. У глифов разных шрифтов нет различий по употреблению в тексте, а у глифов буквы я есть.
С иероглифами та же ситуация. Захочет например кто-нибудь оформить текст в старой орфографии, а не получится, потому что новые и старые формы кодируются одинаково. Проблемы описанные в ОП-посте как бы намекают, что лучше кодировать отдельно, тем более что места в юникоде предостаточно.




[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]