太清博客
27二/’105

键盘布局和输入法

Microsoft Keyboard Layout Creator,即微软键盘布局生成器,简称MSKLC,是微软提供的免费工具。最新版本1.4,可在微软下载中心下载。

当前太清输入法均使用该工具生成。注意:太清在线输入法使用JavaScript。

“太清输入法”标准的应该称为“太清键盘”,但为了汉语习惯,称为“太清输入法”。英文仍称为“太清键盘”即“Abkai Keyboard”。“键盘布局(Keyboard Layout)”这个名称,一些人会认为[......]

深入阅读 »

27二/’100

关于蒙古锡伯音节边界标记

【注意:原文题为《不要使用锡伯音节边界标记》。但是经过这么长时间,我的观点已经发生了变化。题目更改为《关于锡伯音节边界标记》。】

Unicode U+1807定义为蒙古标点符号,命名为“Mongolian Sibe Syllable Boundary Marker”(MSSBM),即“蒙古锡伯音节边界标记”。这个符号的显形与字母a的词中型,也就是字牙,完全相同。

The Unicode Standard, Version 5.0

Syllable Boundary Marker. U+1807 MONGOLIAN SIBE SYLL[......]

深入阅读 »

27二/’100

什么是达斡尔文?

满/达:ᡩᠠᡥᡡᡵ, Dahu'r,简中:达斡尔,繁中:達斡爾,拼音:Dáwò'ěr,日:ダウール,英:Daur, Dagur, Daguor, Dawar, Dawo’er, Tahuerh, Tahur

达斡尔语是中国达斡尔族所用的语言,使用者分布于内蒙古自治区呼伦贝尔市海拉尔区、黑龙江省齐齐哈尔市附近的嫩江流域、新疆维吾尔自治区塔城地区,属于阿尔泰语系蒙古语族东蒙古语支。

达斡尔文至今并没有国家或国际标准。

清朝时,达斡尔文用满文书写,只是增加了一些表示长元音的方法。现在互联网上,一般用拉丁字母书写。【没有标准。】历史上,达斡[......]

深入阅读 »

26二/’100

满文与锡伯文的差别

锡伯,满:ᠰᡳᠪᡝ (Sibe),锡:ᠰᡞᠪᡝ (Sibe),简中:锡伯,繁中:錫伯,拼音:Xībó,日:シボ,英:Sibe / Xibe / Sibo / Xibo。

新疆的锡伯族讲锡伯语。锡伯语与满语互为方言。

锡伯文1947年由满文稍加改变而产生。

1. 满文和锡伯文的绝大多数字母都是相同的。只有7个字母稍有差别。Unicode中,这些不同的字母分别编码。

这7个字母是:i、f、k、ng、j、j’、r。

22二/’100

蒙古国货币:图格里克

蒙古图格里克为蒙古国所通用的货币。1图格里克=100蒙戈。

图格里克:英:tögrög / tugrik 新蒙:төгрөг
蒙戈:英:möngö  新蒙:мөнгө
符号:₮
代码:MNT

20二/’102

汉字“〇”

汉字“〇”在中国大陆的使用错误率不小于99%!有用阿拉伯数字0替代的,有用大写O替代的,有用小写o替代的,也有用零替代的。在日本,“〇”被正常的使用。

正确:“二〇〇九”
错误:“二00九” “二OO九” “二oo九” “二零零九”

汉字数字

小写:〇一二三四五六七八九  十百千万亿
大写:零壹贰叁肆伍陆柒捌玖  拾佰仟万亿

小寫:〇一二三四五六七八九  十百千萬億
大寫:零壹[......]

深入阅读 »

20二/’104

奇怪的蒙古数字

Unicode中包含有多套数字系统,蒙文数字是其一。初看蒙古数字很正常,但是,有很多奇怪的地方。

阿拉伯数字
0 1 2 3 4 5 6 7 8 9

蒙文数字
᠐ ᠑ ᠒ ᠓ ᠔ ᠕ ᠖ ᠗ ᠘ ᠙

藏文数字
༠ ༡ ༢ ༣ ༤ ༥ ༦ ༧ ༨ ༩

天城文数字
० १ २ ३ ४ ५ ६ ७ ८ ९

相关资料非常少。我和Sure讨论和研究过蒙文数字的用法问题。我们的出了下面的结论——虽然我们并没有足够使人信服的证据。

蒙[......]

深入阅读 »

18二/’103

国号上加大字

国号是一个国家的称号,即国家的名称或名号。为表示新朝的“圣明”,每个开国之君都要定国号以彰其“明德”。各朝代的建立都有其一定的历史背景,国号的确定也有各自的原因。

明朝朱国祯《涌幢小品》卷二“国号”条:“国号上加大字,始于胡元,我朝因之。……其言大汉、大唐、大宋者,乃臣子及外夷尊称之词。”

至元八年(1271年),元世祖忽必烈用光禄大夫、太保、参领中书省事、同知枢密院事刘秉忠的意见,公布《建国号诏》,取《易经》“大哉乾元”之意,将蒙古国号更名为[......]

深入阅读 »

18二/’102

藏文编码思考

Unicode的藏文编码,支持藏文、宗喀文(不丹语言“宗卡”)、锡金文、拉达克文、巴尔蒂文。总体来说非常优秀。但是,一套编码的制定,要权衡各种力量:传统、政府、党派、宗教、专家等等。也受当时的技术和参与者的理解的局限。

我认为Unicode的藏文编码最优秀的地方就是对堆叠字母的处理:字母只分两种,基本字母和下接字母。不然,按照传统的做法,要么给每种可能的组合一个编码1,要么非常复杂的区分基字、上加字、下加字2,事情就太复杂了。

1 加上不可能的组合也需要编码,藏文编码就会变得像谚文(韩字)一样。Unicode编码很快就像IPv4一样不够用了。

2 写在上面的字母可[......]

深入阅读 »

16二/’100

如何屏蔽Google AdSense中的不雅广告

君子爱财,取之有道。我也在自己的网站和博客中放置了Google AdSense的广告。AdSense的英文广告总体很好,可是AdSense的中文广告中有大量的不雅广告,尤其以各种医院广告(男子医院、女子医院、美容医院、不孕不育等。为什么国人病这么多?)和欺诈广告(QQ欺诈等。为什么中国骗子这么多?)为主,严重影响网站形象。当然,AdSense中文广告还是远远强过其他中文广告,至少没有色情(性暗示)广告。(我记得以前读到一篇文章叫:为什么国人都是性饥渴?)

为什么要屏蔽这些广告?

道德问题:读者不要通过我的网站上当。“虽然在中国上网,本来就是陷阱满布。”
形象问题[......]

深入阅读 »

9/10«...678910