给影子输入法定制一个双拼辅助码的设想及实现
一直以来,拼音使用者都有一个共同的困惑——单字重码率太高。于是辅助码应运而生。辅助码,顾名思义,说的是附加的用以辅助筛选目标文字的输入码表。通过它,可以将需要的目标字词定位到候选框的首页甚至到最前面来。第三代拼音输入法面世之前,辅助码就已发明出来并在很多拼音输入法里得到应用,并逐渐形成了各自的风格与规范。今天,几乎所有的主流拼音输入法都支持辅助码并使用或沿用不同的规范。
从个人的使用经历看,我对辅助码的规范没有特别的要求,都能使用。但从习惯上讲,每一种规范对我来说都似乎不太理想。因此我就萌生一个想法:定制一份自己的辅助码。
因为我使用双拼,因此我的设想当然就是使用双拼的规范来定制辅助码。接触字海的两分输入法后,我觉得我找到了可以实现的思路:用两分输入法的拆字原理来定制双拼辅助码。
影子输入法的特色之一是高度定制,辅助码也是可以完全更换的。当然,它使用的小雨点辅助码已经非常优秀,且是双拼特性的东东,但如果能换上两分法原理的辅助码则更符合我的需求。说做就做,先小试一下牛刀看看利否。我先拿100个单字做实验,按如下方式编写辅助码:
侣=rl
锕=ja
第一个字,侣,两分法将其分为 亻吕,代码各取首字母 r 和 l;第二个字 锕,拆分为 钅阿,代码为 j 和 a。
测试结果:
侣:打 lv 是主拼音,加上 r,“侣”字就排到前面来了
锕:打 aa 是“锕”字的双拼主拼音,再打 j,“锕”就已排到了最前面
成功。
下一步就是制作GBK汉字单字双拼编码。字海的码表可以拿到,并可以筛出GBK单字,但它是全拼码表,单字基本由两个拼音组成(少量不是),这样就增加了全拼变双拼的难度:两个连在一起的拼音,事实上是一个拼音流,比较难于“断”字。比如出现这样的一组拼音,怎么处理:
luan
是单字节,还是双字节?两种可能都有,不好判断。
所以,粗暴的转换方法肯定有小范围差错,估计会占5%,只能姑且使用,并在使用中逐一纠错,不然,一个一个编制码表,很耗时,很累人。
黑黑厉害,虽然影子输入法能高度定制,但定制很花费功夫啊。黑黑能研究到这种程度,很厉害了{:4_199:} 小黑,只有佩服了,让我都学,肯定也是学不会的,每天看看你发的,长点知识{:4_204:} 看這些字都是^#@%..^@#$!..^...滿天飛
不過很佩服黑黑的電腦專業知識~
哪天有需要 我就來挖{:5_106:} 朵嫣 发表于 2021-8-10 21:42
看這些字都是^#@%..^@#$!..^...滿天飛
不過很佩服黑黑的電腦專業知識~
哪天有需要 我就來挖
蟹蟹。你說有亂碼吧?支持GBK字庫的,不應出現亂碼 马黑黑 发表于 2021-8-10 21:50
蟹蟹。你說有亂碼吧?支持GBK字庫的,不應出現亂碼
腦袋是亂碼{:5_106:} 朵嫣 发表于 2021-8-10 21:52
腦袋是亂碼
那塞個GBK進去吧 马黑黑 发表于 2021-8-10 21:53
那塞個GBK進去吧
今天塞滿糖漿記憶體已滿~{:5_106:} 朵嫣 发表于 2021-8-10 21:56
今天塞滿糖漿記憶體已滿~
可以格式化,徹底清空 红影 发表于 2021-8-10 21:18
黑黑厉害,虽然影子输入法能高度定制,但定制很花费功夫啊。黑黑能研究到这种程度,很厉害了
用的时间长了就想让它能更适合自己,就动动脑、动动手 小辣椒 发表于 2021-8-10 21:38
小黑,只有佩服了,让我都学,肯定也是学不会的,每天看看你发的,长点知识
我也是灌灌水而已,不必太认真 马黑黑 发表于 2021-8-10 22:03
用的时间长了就想让它能更适合自己,就动动脑、动动手
好在这个输入法是便携式,可以一直用自己定制的。
想起以前用cad也制作自己熟悉的命令集,只是那个只能在自己的电脑上用。换个电脑就不行了。 红影 发表于 2021-8-10 22:29
好在这个输入法是便携式,可以一直用自己定制的。
想起以前用cad也制作自己熟悉的命令集,只是那个只能 ...
命令集可以带走吧?把它们弄成文本文档 影子输入法拼音辅助码仅支持来个码元(字母),这是为了照顾速度问题而考虑的吧。
QQ输入法似乎没有限定辅助码个数,追求的可能是精准(但牺牲了速度) 马黑黑 发表于 2021-8-10 22:31
命令集可以带走吧?把它们弄成文本文档
哦,这个倒没想过,不过我只是有一段时间用到那个,后来不再用了,也就不研究了{:4_173:} 红影 发表于 2021-8-11 13:00
哦,这个倒没想过,不过我只是有一段时间用到那个,后来不再用了,也就不研究了
没关系
凡是代码类,或说字串类,集合成一个文档,可以带走 马黑黑 发表于 2021-8-10 22:37
影子输入法拼音辅助码仅支持来个码元(字母),这是为了照顾速度问题而考虑的吧。
QQ输入法似乎没有限定 ...
各有利弊。 红影 发表于 2021-8-11 13:01
各有利弊。
世事如此,只好在一个层面上去接受 马黑黑 发表于 2021-8-11 13:01
没关系
凡是代码类,或说字串类,集合成一个文档,可以带走
看到你的帖子,想起这个,有近似功效呢。
是的,应该可以导入别的电脑。不过很多东西还是自己去设置的好,会更熟悉,别人的,总需要适应。 马黑黑 发表于 2021-8-11 13:02
世事如此,只好在一个层面上去接受
嗯,前者省时但需要适应,后者费时但应该是大家熟悉的。
页:
[1]
2