影子输入法之词库导入篇
本帖最后由 马黑黑 于 2021-7-21 07:58 编辑在各大平台看到大咖们对影子输入法的讨论,发现有不少人不满意影子输入法的词库。作为致力于输入平台的开发,个人觉得影子把更多的精力放在了开发上,对词库的维护并不特别用心,是满足于基本应用的心态,将词库定制权交给使用者,换言之,用户可以高度自定义自己的词库。
仅从词库管理的易用性,就可佐证我上面的说法:
以拼音为例加以说明(五笔的操作同)。即使是小白,只要你有一个文本文档,无须编码,无须词频,就一行一个词语,保存为 pinyin_xxx.txt 的文件名,文件编码为 UTF-8 Bom 即有签名的格式、换行符为 LFWindows 即可(可以考虑用比 Windows 自带的记事本聪明的文本编辑器编辑、保存),导入后影子的词库管理工具自动生成编码、加入到主词库中去。我试过20多万个纯汉语词条库的加入,一瞬间完成导入工作。
用户导入的词库可能会与原词库有重合部分,需要整理一下,通过整理去重、重新排序以优化词库、提升效率。影子的词库管理有此类功能,操作不难。
PS:影子词库导入虽门槛低,但:
① 对文件名要求严格,拼音词库命名以 pinyin_ 开头,外加 xxx ,如 pinyin_加加.txt 即为合乎要求的文档名(其中 .txt 是文本文档后缀名,无须手动添加);五笔型则参考拼音的命名规则完成,道理一样。
② 文件(档)的编码需为 UTF-8 带签名的格式,文本编辑器在保存文件时都提供相应操作功能。
词库可以自己拟定,这个不错。字库也可以么? 文件编码为 UTF-8 Bom ,——这个知道是怎么弄,保存的时候进行选择。换行符为 LFWindows ,——这个没明白是怎么操作的。 “导入后影子的词库管理工具自动生成编码、加入到主词库中去。”
这个可能要运行这个输入法去找找在哪里。
“可能会与原词库有重合部分,需要整理去重。”
这个也需要找找才能知道在什么地方。 若自定义的词库某些词不想要了,是怎样删的呢,能扩充应该也能删除的吧? 红影 发表于 2021-7-21 09:42
若自定义的词库某些词不想要了,是怎样删的呢,能扩充应该也能删除的吧?
可以删除。单个删除,在候选词界面可右击操作。批量删除,进入词库管理页面。也可以用Access或第三方工具进行管理。
词库位于 Data 文件夹下,ciku.db时主词库,可以替换(意思是说可以用备份的替换它) 马黑黑 发表于 2021-7-21 12:07
可以删除。单个删除,在候选词界面可右击操作。批量删除,进入词库管理页面。也可以用Access或第三方工具 ...
这么多可用的方式,黑黑真棒。看起来单个删除比较保险,批量或者替换风险较大。 红影 发表于 2021-7-21 13:19
这么多可用的方式,黑黑真棒。看起来单个删除比较保险,批量或者替换风险较大。
碰上就操作也挺好。说实话,由于操作环境问题,有时批量管理会出现程序错误 马黑黑 发表于 2021-7-21 14:44
碰上就操作也挺好。说实话,由于操作环境问题,有时批量管理会出现程序错误
哦哦,这个倒没想到,我只想到了可能会误删的事。 红影 发表于 2021-7-21 09:36
词库可以自己拟定,这个不错。字库也可以么?
影子输入法字库词库放一起 马黑黑 发表于 2021-7-23 21:21
影子输入法字库词库放一起
自己随身带着的输入法,有着自己用得最习惯的方式,这样真好{:4_204:} 红影 发表于 2021-7-24 13:41
自己随身带着的输入法,有着自己用得最习惯的方式,这样真好
便携的对特殊需求还是有好处的 马黑黑 发表于 2021-7-24 17:04
便携的对特殊需求还是有好处的
是的,特别方便。 红影 发表于 2021-7-24 21:21
是的,特别方便。
所以握经常使用。也是工作环境经常变换造成的。 马黑黑 发表于 2021-7-24 22:13
所以握经常使用。也是工作环境经常变换造成的。
对于需要变换工作环境来说,的确很需要。 红影 发表于 2021-7-24 22:19
对于需要变换工作环境来说,的确很需要。
经常变换又要高效,就得像我这样。否则,有时会很尴尬,我亲眼目睹过这种现象。 马黑黑 发表于 2021-7-24 22:22
经常变换又要高效,就得像我这样。否则,有时会很尴尬,我亲眼目睹过这种现象。
一个字难倒英雄汉{:4_173:} 红影 发表于 2021-7-25 22:10
一个字难倒英雄汉
很多时候会酱紫 马黑黑 发表于 2021-7-29 15:44
很多时候会酱紫
不过大多数人工作场所是固定的,所以也想不起来随身带着自己的输入法。 红影 发表于 2021-7-29 20:38
不过大多数人工作场所是固定的,所以也想不起来随身带着自己的输入法。
如此甚好
页:
[1]
2