太清博客
262月/’100

满文与锡伯文的差别

锡伯,满:ᠰᡳᠪᡝ (Sibe),锡:ᠰᡞᠪᡝ (Sibe),简中:锡伯,繁中:錫伯,拼音:Xībó,日:シボ,英:Sibe / Xibe / Sibo / Xibo。

新疆的锡伯族讲锡伯语。锡伯语与满语互为方言。

锡伯文1947年由满文稍加改变而产生。

1. 满文和锡伯文的绝大多数字母都是相同的。只有7个字母稍有差别。Unicode中,这些不同的字母分别编码。

这7个字母是:i、f、k、ng、j、j’、r。

222月/’100

蒙古国货币:图格里克

蒙古图格里克为蒙古国所通用的货币。1图格里克=100蒙戈。

图格里克:英:tögrög / tugrik 新蒙:төгрөг
蒙戈:英:möngö  新蒙:мөнгө
符号:₮
代码:MNT

202月/’102

汉字“〇”

汉字“〇”在中国大陆的使用错误率不小于99%!有用阿拉伯数字0替代的,有用大写O替代的,有用小写o替代的,也有用零替代的。在日本,“〇”被正常的使用。

正确:“二〇〇九”
错误:“二00九” “二OO九” “二oo九” “二零零九”

汉字数字

小写:〇一二三四五六七八九  十百千万亿
大写:零壹贰叁肆伍陆柒捌玖  拾佰仟万亿

小寫:〇一二三四五六七八九  十百千萬億
大寫:零壹[......]

深入阅读 »

202月/’104

奇怪的蒙古数字

Unicode中包含有多套数字系统,蒙古数字是其一。初看蒙古数字很正常,但是,有很多奇怪的地方。

阿拉伯数字
0 1 2 3 4 5 6 7 8 9

蒙文数字
᠐ ᠑ ᠒ ᠓ ᠔ ᠕ ᠖ ᠗ ᠘ ᠙

藏文数字
༠ ༡ ༢ ༣ ༤ ༥ ༦ ༧ ༨ ༩

天城文数字
० १ २ ३ ४ ५ ६ ७ ८ ९

相关资料非常少。我和Sure讨论和研究过蒙古数字的用法问题。我们的出了下面的结论——虽然我们并没有足够使人信服的证据。

蒙[......]

深入阅读 »

182月/’103

国号上加大字

国号是一个国家的称号,即国家的名称或名号。为表示新朝的“圣明”,每个开国之君都要定国号以彰其“明德”。各朝代的建立都有其一定的历史背景,国号的确定也有各自的原因。

明朝朱国祯《涌幢小品》卷二“国号”条:“国号上加大字,始于胡元,我朝因之。……其言大汉、大唐、大宋者,乃臣子及外夷尊称之词。”

至元八年(1271年),元世祖忽必烈用光禄大夫、太保、参领中书省事、同知枢密院事刘秉忠的意见,公布《建国号诏》,取《易经》“大哉乾元”之意,将蒙古国号更名为[......]

深入阅读 »

182月/’102

藏文编码思考

Unicode的藏文编码,支持藏文、宗喀文(不丹语言“宗卡”)、锡金文、拉达克文、巴尔蒂文等。总体来说非常优秀。但是,一套编码的制定,要权衡各种力量:传统、政府、党派、宗教、专家等等。也受当时的技术和参与者的理解的局限。

我认为Unicode的藏文编码最优秀的地方就是对堆叠字母的处理:字母只分两种,基本字母和下接字母。不然,按照传统的做法,要么给每种可能的组合(字丁)一个编码1,要么非常复杂的区分基字、上加字、下加字2,事情就太复杂了。

1 加上不可能的组合也需要编码,藏文编码就会变得像谚文(朝鲜字/韩字)一样。Unicode编码很快就像IPv4一样不够用了。

2[......]

深入阅读 »

162月/’100

如何屏蔽Google AdSense中的不雅广告

君子爱财,取之有道。我也在自己的网站和博客中放置了Google AdSense的广告。AdSense的英文广告总体很好,可是AdSense的中文广告中有大量的不雅广告,尤其以各种医院广告(男子医院、女子医院、美容医院、不孕不育等。为什么国人病这么多?)和欺诈广告(QQ欺诈等。为什么中国骗子这么多?)为主,严重影响网站形象。当然,AdSense中文广告还是远远强过其他中文广告,至少没有色情(性暗示)广告。(我记得以前读到一篇文章叫:为什么国人都是性饥渴?)

为什么要屏蔽这些广告?

道德问题:读者不要通过我的网站上当。“虽然在中国上网,本来就是陷阱满布。”
形象问题[......]

深入阅读 »

152月/’100

朝鲜 · 皇帝

朝鲜有皇帝吗?不熟历史但看过韩剧的人会理所当然的认为有,而且有很多。大多数韩国历史剧中都会出现皇帝。其实,这真是一个很复杂的问题。

我们常说的历史上的朝鲜,正式国号是朝鲜国(조선국/朝鮮國)(1392年–1897年)。中国、日本、朝鲜的历史学界一般习惯称呼朝鲜国为李氏朝鲜,简称李朝。朝鲜民主主义人民共和国官方也使用李氏朝鲜(李朝),但韩国人认为“李氏朝鲜”有侮辱性。大韩民国在多数场合称呼这一历史时期为“朝鲜王朝”。并把历代大王实录定名为《朝鲜王朝实录》,而不是东亚史学界普遍使用的名称《李朝实录》。

朝鲜国是大明和大清的藩属国,其国[......]

深入阅读 »

142月/’101

太清天城文输入法

所有婆罗米文都属于元音附标文字,辅音默认都包含隐含的a音。(一般认为藏文也一样,不过我认为有很大的差别,见《由藏文转写透视转写与音译》,原题《透视:太清藏文转写》。)

这里,天城文转写为IAST。比如,ka 在转写中是2个字符,在天城文中是1个字符 क。k 在转写中是1个字符,在天城文中是2个字符 क् (क 加 ्)。kṣ 在转写中是2个字符,在天城文中是4个字符 क्ष् (क 加 ् 加 ष 加 ्)。

在一般的输入法中,就会发生这样的情况,ka 打1个键就行了,k 反而打2个键,kṣ 打4个键,kṣa 打3个键,kṣe 打4个键。有点乱,是不是?

这个问题是转写造成的。如果输入天[......]

深入阅读 »

132月/’100

Uniscribe & USP10.DLL

【首先还是要强调一下,是字体决定复杂文字是如何变形的。Windows中,USP10.DLL决定的是变还是不变。】

【USP10决定变不变,字体决定如何变。】

其实汉字字体、英文字体也涉及到变形,也是字体决定的。

汉字的变形包括竖排标点符号的位置变化、方向变化、形态变化(如引号由 “ ” ‘’ 自动变为『』「」),文字的方向变化(半角和全角变化不同),复杂的还包括文字变体的选择(中国大陆字形、台湾字形、香港字形、日本字形……)。再复杂的,竖排时字形的变化。

英文字体涉及字间距、连体、条件变体(古英语有)等。

对[......]

深入阅读 »

22/23«...10...1920212223