马黑黑 发表于 2021-10-4 08:07

谈谈搜狗输入法的辅助码

本帖最后由 马黑黑 于 2021-10-4 08:18 编辑

这里所谈的搜狗输入法,指搜狗拼音输入法和搜狗拼音输入法智慧版,不包含搜狗五笔输入法。

搜狗输入法早就引入辅助码理念,其实现机制官网并没有哪怕是只言片语的说明,仅使用极其简短的语言介绍了一下使用方法。它以“娴”字做例子,告诉大家如何启用辅助码功能快速定位“娴”字令其上屏:先输入“娴”字的拼音 xian,按一下Tab 键,再输入 nx 即告完工。

这是典型的“拼音+辅码”的做法,其中辅码也是用了拆字法。对于像“娴”字那样恰好能快速拆分为两个部分的字,通过辅码检索过滤很是方便。再如“㐩”字,读 xing 音,输入拼音全码后再输入两个 j 便能检索出“㐩”字来。这类字,如果不会读,还可通过U模式输入:按一下U键,输入该字的两个部件的拼音便可。

辅码的拆分可以是成字或偏旁的部件,也可以是笔画;输入方法则既可以是部件的全拼,也可以是部件的简拼,甚至还可以是部件的笔画拼音名首字母。以“傩”字为例,此字读 nuo,输入全码后,辅码可以是如下任意一种:

1)rn
2)rennan
3)ps

实际上,全拼和笔画辅码使用时基本不用打全目标单字就已检索出来,还是比较实用的。

PS:关于笔画,搜狗用 h s z p n 分别代表 横竖折撇捺,其中 捺 包含了 点 的笔画。

以上,讨论了搜狗输入法原生的辅助码输入机制,它采用的是拆字法,可拆部件,可拆笔画,输入方式则支持简拼、全拼及笔画名首拼音等几种类型,比较灵活实用。要使用辅助码,输入字的全拼拼音串后,按一下Tab建,再输入辅助码。

(下一帖将继续此话题的扩展讨论,敬请期待……)

马黑黑 发表于 2021-10-4 08:07

本帖最后由 马黑黑 于 2021-10-4 10:16 编辑

(沙发接一楼继续讨论)
和手心输入法的直接辅助码功能相比,按一下Tab键才能引导辅助码模块的应用,明显有些不便;同时,搜狗输入法也不像手心输入法那样可以导入自定义辅助码。前者,估计是基于这样的考量:狗狗是个优秀的输入法,重在词、句输入,词句输入重码率不会太高,只有极少数不得不输入单字的情形下才会启用辅助码功能,所以为了兼顾词句的优先权,牺牲直接辅助码是必要的;后者,大约因为狗狗自认为自己的辅助码模块的拆字法够全、够简单了,用户无需增添自己定义的辅助码。

但用趁手的东西人们觉得异常珍贵,舍不得丢掉。于是很多强迫者不满意狗狗的Tab键引导方式,执意要整个直接辅助码功能来。虽然狗狗不支持导入自定义辅助码,他们通过努力探索,还是找到了实现的办法来——通过编辑自定义短语加以实现。

在狗狗属性设置(最新版本称为“我的输入法”)的“高级”项里,有“自定义短语设置”,点击它可以进入自定义短语的查看和编辑页面,我们如果要导入自定义短语,可点击该页面的“直接编辑配置文件”按钮,狗狗会启动系统默认的文本编辑器(一般是记事本),然后我们将事前准备好的辅助码表复制于其内、保存即可完成直接辅助码的导入工作。

直接辅助码或自定义短语的格式如下(俺采用的是双拼格式编码):

aiue,1=砈
aiug,1=濭
aiug,2=饚
aiuh,1=䠹
aiuh,2=䬵
aiuh,3=硋


其中,等号左边由两部分组成:编码和序号,两者用小角逗号隔开。编码通常为字的拼音+辅助码构成(连在一起写),序号表示在上屏候选框的显示顺序;等号后面是字(或短语)。一个词条一行。

如果自定义的码表过长,记事本的打开和保存需要一些时间,要耐心等待。如果条件许可,可以考虑使用第三方功能强大的文本编辑器。

导入工作完毕后,我们就可以使用直接辅助码了,比如输入“砈”字,直接输入 aiue 输入串,“砈”字就出现在第一候选位置。

直接辅助码实现了,值得高兴,但也有一些问题:当有词句的编码与之相同,词句的候选位置将受到影响。这在输入体验上还是带来一定的困惑。所以是否添加自定义直接辅助码,得看个人的取舍。

(以上讨论了如何给搜狗输入法自定义直接辅助码,稍后还将有一些不重要的讨论,敬请期待……)

马黑黑 发表于 2021-10-4 08:08

本帖最后由 马黑黑 于 2021-10-4 12:34 编辑

(板凳我也占了吧,用来做后续的不那么重要的讨论)
辅助码对于很多使用拼音的专业录入人员或对拼音输入法过度依赖的使用者而言,是刚需,也是选择输入法的一个重要参考因素。手心输入法之所以在面世的时候就获得一片叫好,主要原因就在于它的辅助码实现机制。

首先,手心输入法的直接或半直接辅助码的理念顺应了专业或类专业录入人员的需要。录入时,无需通过引导键,直接或通过翻页后输入辅助码对目标字词进行快速定位,这是辅助码的无缝应用,自然而快捷。

其次,手心的辅助码可以自定义,事先准备好的辅助码表直接导入就能立马可用,还可在使用过程中随便切换,这对辅助码的应用已自成体系的使用者来说是天大的福利。

但手心的辅助码仅针对双拼,全拼使用者无福消受辅码带来的好处。这是手心输入法在辅助码方面的致命弱点。

谷歌输入法是最安静、高效的输入法,可惜:① 它不支持辅助码;② 谷歌公司在中国市场受挫后放弃了对谷歌拼音输入法的后续维护。

PC端的百度输入法也不错(据说手机端的更好),市场占比现在直接挑战狗狗,但它的辅助码机制来得晚,到目前止好像进展不讨喜,似乎是学华宇的音调辅助。

QQ输入法东抄西抄也抄出了个人模狗样来,它的很多元素直接来自狗狗(狗狗和企鹅有合作,早期版本的文件属性还有狗狗的信息),只是辅助码机制太难用,学不到狗狗的一小半。

不需要云的中州韵(RIME引擎,window版叫小狼毫)是众多输入法中功能最单纯也最完备的输入法引擎作品,但门槛高,同时不支持拼音的辅助码输入。作者佛振演示过如何通过词典改制添加辅助码机制,也还算是有解决方案。但这是一个内存消耗极大的输入框架,维护也需极强的专业水平。

影子输入法是开源的、可外挂的便携性输入法,它的辅助码表甚至是最核心的码表都是开放性的,这对有能力制作和编辑码表的使用者来说是件好事。不过,由于起步晚、开发环境等制约因素,它的算法当前比较一般,尤其在智能录入方面,还有很大的长进空间。难能可贵的是它的直接辅助码实现机制,维护和使用比手心更直接、方便,精准度无异于狗狗。

通观各大大小小的输入法,发现其开发者都不同程度意识到辅助码的重要,也都有相应的努力,但做到极致的还需要认识的提升和开发上的心态。不管怎么说,开发者的付出是值得敬佩和尊重的,本帖最后隆重地向开发者们致敬!

红影 发表于 2021-10-4 08:59

输入拼音后,按一下Tab建,,再输入拆分后的首字母,或者h s z p n 横竖折撇捺的简单笔画,就能找到平日里很少用到的字,这个比在里面翻半天的确要方便很多。学习了{:4_187:}

红影 发表于 2021-10-4 09:01

我来试试燚字,燚,真方便,yi然后加hh,直接出来。嗯,这个功能太方便了{:4_199:}

红影 发表于 2021-10-4 09:03

燚,,又试了一下,yi加np,也找到了这个字,有趣有趣,以前找这个字要翻半天{:4_173:}

红影 发表于 2021-10-4 09:04

马黑黑 发表于 2021-10-4 08:07
沙发是我的

沙发本来有可能是我的,被你自己抢了{:4_170:}

马黑黑 发表于 2021-10-4 09:27

红影 发表于 2021-10-4 09:04
沙发本来有可能是我的,被你自己抢了

沙发上要放东西的

马黑黑 发表于 2021-10-4 09:28

红影 发表于 2021-10-4 09:03
燚,,又试了一下,yi加np,也找到了这个字,有趣有趣,以前找这个字要翻半天

所以我觉得有必要介绍一下狗狗的辅码,虽然我不怎么用它

红影 发表于 2021-10-4 10:04

马黑黑 发表于 2021-10-4 09:27
沙发上要放东西的

哦哦,原来是这样,误解你了{:4_189:}

红影 发表于 2021-10-4 10:05

马黑黑 发表于 2021-10-4 09:28
所以我觉得有必要介绍一下狗狗的辅码,虽然我不怎么用它

我用的是狗狗呢,正好对我很实用{:4_173:}

马黑黑 发表于 2021-10-4 10:20

红影 发表于 2021-10-4 10:05
我用的是狗狗呢,正好对我很实用

我知道很多拼音使用者都用搜狗,所以专门介绍一下

马黑黑 发表于 2021-10-4 10:20

红影 发表于 2021-10-4 10:04
哦哦,原来是这样,误解你了

没关系,俺就是喜欢灌水

红影 发表于 2021-10-4 10:47

马黑黑 发表于 2021-10-4 10:20
我知道很多拼音使用者都用搜狗,所以专门介绍一下

替自己也替大家一并谢谢黑黑{:4_187:}

马黑黑 发表于 2021-10-4 10:50

红影 发表于 2021-10-4 10:47
替自己也替大家一并谢谢黑黑

不用客气的

红影 发表于 2021-10-4 10:50

马黑黑 发表于 2021-10-4 10:20
没关系,俺就是喜欢灌水

看到了沙发楼的内容,黑黑研究得很深,赞{:4_204:}

马黑黑 发表于 2021-10-4 10:51

红影 发表于 2021-10-4 10:50
看到了沙发楼的内容,黑黑研究得很深,赞

也不算太深,浅尝辄止或蜻蜓点水的那种

红影 发表于 2021-10-4 10:59

马黑黑 发表于 2021-10-4 10:50
不用客气的

黑黑的分享很实用{:4_187:}

红影 发表于 2021-10-4 10:59

马黑黑 发表于 2021-10-4 10:51
也不算太深,浅尝辄止或蜻蜓点水的那种

我要求不高,能用tab解决问题就已经很不错了呢。

马黑黑 发表于 2021-10-4 11:00

红影 发表于 2021-10-4 10:59
黑黑的分享很实用

是有一点点价值的
页: [1] 2 3
查看完整版本: 谈谈搜狗输入法的辅助码