两分输入法码表抽样分析报告
<style>.artBox { font-size: 20px; margin: 30px 0; left: calc(50% - 81px); transform: translateX(-50%); width: 1200px; font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Helvetica, Arial, sans-serif; background: #eee; color: #333; padding: 20px; box-shadow: 2px 2px 4px gray; position: relative; }
.artBox h2 { color: #1a73e8; border-bottom: 2px solid #eee; padding-bottom: 8px; margin-bottom: 20px; }
.artBox > p { margin: 15px 0; line-height: 1.8; text-align: justify; }
.artBox blockquote { background: #f9f9f9; border-left: 4px solid #1a73e8; padding: 15px 20px; margin: 20px 0; color: #555; }
.artBox code { background: #eee; padding: 2px 6px; border-radius: 3px; font-family: 'Consolas', 'Monaco', monospace; font-size: 0.95em; }
.artBox .mid { text-align: center; }
.flex { display: flex; gap: 20px; flex-wrap: wrap; }
.bigsize { font-size: 60px; }
</style>
<div class="artBox">
<p>在长期使用两分输入法的过程中,笔者时常遇到编码存疑或难以理解的现象。由于输入过程不宜中断,往往无法在第一时间记录问题。然而,随着此类情况的积累,其对输入效率的影响日益凸显。为此,笔者决定腾出时间对码表进行一次抽样分析。</p>
<p>本次分析的码表来源为 <a href="http://yedict.com/" title="点击访问" target="_blank">字海网</a> 下载页面提供的“两分输入法5.0 Rime版”。该码表收录单字98,793个,涵盖CJK统一表意文字,绝大部分单字无需专业字库支持便可在Windows 11环境下正常显示。抽样依据为国家语言文字工作委员会、国家教育委员会于1988年1月26日联合发布的《现代汉语常用字表》,从Rime码表字典中抽取了全部现代汉语常用字,包括一级常用汉字2,500个和二级常用汉字1,000个,共计3,500个。分析方法为逐一校对,旨在找出其中的错漏与不合理编码。</p>
<p>以下是具体的分析结果:</p>
<p><strong>一、明显的编码错误(3处)</strong></p>
<blockquote class="flex">
<div class="bigsize">涩</div>
<div>
<span>原始编码 :<code>shuitu</code> ☒</span><br>
<span>正确编码 :<code>shuzhi</code> ☑</span><br>
<span>两分字元 :<code>氵止</code></span>
</div>
<div class="bigsize">胃</div>
<div>
<span>原始编码 :<code>weiyue</code> ☒</span><br>
<span>正确编码 :<code>tianyue</code> ☑</span><br>
<span>两分字元 :<code>田月</code></span>
</div>
<div class="bigsize">发</div>
<div>
<span>原始编码 :<code>yidian</code> ☒</span><br>
<span>正确编码 :<code>yiyou</code> ☑</span><br>
<span>两分字元 :<code>乙又</code></span>
</div>
</blockquote>
<p>【涩】字的两分字元官方拆分方法为:第一字元取左边的部首三点水【氵】,读音为“水”(<code>shui</code>);第二字元取右部的【止】偏旁,读音为(<code>zhi</code>);剩余部分【刃】忽略。此拆分符合两分手册中“将一个汉字拆成两个部件,叫做两分字元。两分字元规定只可在常用字(简、繁均含)中选取。若该字仅一个笔画,则第二个两分字元为空。若拆完字后有剩余笔画,请忽略”的规定。基于此,第二字元的编码不可能是<code>tu</code>,而应为<code>zhi</code>。</p>
<p>至于【胃】字的编码错误,应是受到了“胃”字自身的读音先行误导所致;【发】字取细分了【又】字元,取小了,应遵循手册提出的逆向取大规则。</p>
<p><strong>二、编码疑似错误(1处)与编码缺漏(2处)</strong></p>
<blockquote class="flex">
<div class="bigsize">拣</div>
<div>
<span>原始编码 :<code>shouhuo</code></span><br>
<span>建议编码 :<code>shoujian</code></span><br>
<span>两分字元 :<code>扌𫠣</code></span>
</div>
<div class="bigsize">练</div>
<div>
<span>原始编码 :<code>si</code></span><br>
<span>补全编码 :<code>sijian</code></span><br>
<span>两分字元 :<code>纟𫠣</code></span>
</div>
<div class="bigsize">炼</div>
<div>
<span>原始编码 :<code>huo</code></span><br>
<span>补全编码 :<code>huojian</code></span><br>
<span>两分字元 :<code>火𫠣</code></span>
</div>
</blockquote>
<p>上述三个字的问题均集中于右偏旁【𫠣】字元的编码上。首先,【拣】字定义编码为<code>shouhuo</code>,这显然缺乏合理性,指向【火】字难以解释,或许原作者对此字元的编码感到困惑,但这并非严谨的编码逻辑。实际上,【𫠣】即为【柬】字,读音为<code>jian</code>,将其视为偏旁的简化而非已经作废的二简字即可,完全可依此定码。</p>
<p>此外,【练】和【炼】两字仅给出单字元编码(<code>si</code>、<code>huo</code>),属于明显的编码缺漏。推测原因可能是编码者因对【𫠣】的编码存疑而暂未补全,随后遗忘。建议统一将【𫠣】部件编码定位<code>jian</code>。 </p>
<p><strong>三、疑似笔顺问题(5处)</strong></p>
<blockquote class="flex">
<div>
<span class="bigsize">九</span><br>
<code>yipie</code>
</div>
<div>
<span class="bigsize">门</span><br>
<code>shuyi</code>
</div>
<div>
<span class="bigsize">及</span><br>
<code>yishui</code>
</div>
<div>
<span class="bigsize">山</span><br>
<code>kuangshu</code>
</div>
<div>
<span class="bigsize">火</span><br>
<code>renba</code>
</div>
</blockquote>
<p>根据原始编码分析,【九】字以折笔起头,所有折笔画在两分输入法中均视为【乙】(<code>yi</code>),这一点本身没有问题。但问题在于,【九】字的标准首笔应为【丿】(<code>pie</code>),当前的编码属于倒装,既不符合标准笔顺规则,也不符合使用者拆分字元的常规心理预期。</p>
<p>同理,【门】字的标准起笔为【丶】,首字元理应取它,而原始编码却使用了第二个笔画【丨】,显然不合理。【及】、【山】、【火】等字的编码同样存在颠倒笔顺的情况。当起笔为单一笔画时,绝对应取第一笔画作为第一个字元,这既符合笔顺规范,也顺应拆字逻辑;若字元均为完整部件,道理亦同。</p>
<p><strong>四、框和口前后编码不一致</strong></p>
<p>在两分输入法中,【框】与【口】的区别主要在于字元是否闭合:闭合的视为【口】,而“网开一面”的视为【框】。例如,「国、回、团」等字的外围字元编码均为<code>kou</code>,而「同、凶、皿」等字的第一字元编码均为<code>kuang</code>。这一约定非常合理,但比较以下几组字的编码时,却显得前后矛盾:</p>
<blockquote class="flex">
<div>
<span class="bigsize">己</span><br>
<code>kuangyi</code> ☑
</div>
<div>
<span class="bigsize">已</span><br>
<code>kuangyi</code> ☑
</div>
<div>
<span class="bigsize">巳</span><br>
<code>kuangyi</code> ☑
</div>
<div>
<span class="bigsize">巨</span><br>
<code>kuangkunag</code> ☑
</div>
<div>
<span class="bigsize">弓</span><br>
<code>kouyi</code> ❓
</div>
<div>
<span class="bigsize">尸</span><br>
<code>koupie</code> ❓
</div>
</blockquote>
<p>前四个字的编码无可厚非。问题在于后两字,即【弓】和【尸】的首字元编码。原始编码将朝左开口的【框】误视为【口】,令人费解。【弓】字的第一字元显然是一个向左开口的框,应与前四字保持一致,定为【框】而非【口】;【尸】字的两字元交而不连,其首字元也是典型的朝左开口的框,同样不应视为【口】。此类前后混淆的编码规则极易造成记忆混乱,建议统一同类部件的编码规范。</p>
<p>类似的框口编码问题还体现在对捺笔的处理上。部分字的捺笔被视作【水】,而另一部分则被看作【丶】,试比较:</p>
<blockquote class="flex">
<div>
<span class="bigsize">乂</span><br>
<code>piedian</code>
</div>
<div>
<span class="bigsize">八</span><br>
<code>piedian</code>
</div>
<div>
<span class="bigsize">长</span><br>
<code>piedian</code>
</div>
<div>
<span class="bigsize">人</span><br>
<code>pieshui</code>
</div>
<div>
<span class="bigsize">入</span><br>
<code>pieshui</code>
</div>
<div>
<span class="bigsize">义</span><br>
<code>piedian</code>
</div>
</blockquote>
<p>上述字例中,每个字的捺笔形态或许存在细微差异,但纵观两分输入法的全码表,其具备相当的灵活性(例如【然】字的首字元为【月】,而非更细节的拆分)。因此,对于形态相近的捺笔,建议统一归为【丶】类,无需另立形似流水状的【shui】编码。此举旨在实现编码规则的前后统一,提升用户拆字的精准度与一致性。</p>
<p><strong>结语</strong></p>
<p>以上是针对两分输入法码表的抽样分析报告。尽管样本量仅占全码表的3.5%,但发现的几类问题具有一定的代表性。修正这些编码瑕疵,不仅有助于提升码表的严谨性,也能优化用户的输入体验。希望这份分析能为两分输入法的维护与完善提供有益参考。</p>
</div> 关于【拣】字的右边偏旁,可以视其为一个偏旁,不必跟“二简字”挂钩。
我猜测,编码者可能就该字元纠结,意在避开已经作废的“二简字”的干扰。其实没有必要,它来源于【柬】,是一简简化字偏旁,视同【柬】合情合理。 谢谢黑黑老师分享。{:4_187:} 马黑黑 发表于 2026-1-22 13:19
关于【拣】字的右边偏旁,可以视其为一个偏旁,不必跟“二简字”挂钩。
我猜测,编码者可能就该字元纠结 ...
【𫠣】这个字还真的不认识,艾玛。。
它拆成手和小不是更好。。{:4_173:}
这几种错误分类看着清晰明了,特别有道理。。
感觉二分输入法爱好者应该特别喜欢这样的讨论。。{:5_162:}
不过笔顺那个九字,我在写的时候就是先写弯的那一笔,再写撇那一笔的。。天辣,小时候就学错了。。
花飞飞 发表于 2026-1-22 18:00
这几种错误分类看着清晰明了,特别有道理。。
感觉二分输入法爱好者应该特别喜欢这样的讨论。。
...
你去查一下汉典,每一个字书写播放:
https://www.zdic.net/hans/%E4%B9%9D 花飞飞 发表于 2026-1-22 17:57
【𫠣】这个字还真的不认识,艾玛。。
它拆成手和小不是更好。。
最后一笔画不是小额 梦江南 发表于 2026-1-22 16:52
谢谢黑黑老师分享。
{:4_180:} 本帖最后由 霜染枫丹 于 2026-1-22 21:24 编辑
马老师晚上好!您写的教材总是很好懂,无论是否采用,都涨了知识,会感到:“原来如此“的愉悦,
谢你分享,这个知识点掌握一下很有必要,抱走了。谢您分享。{:4_204:}{:4_190:}
https://www.yueyijyw.com/forum.php?mod=viewthread&tid=1259&page=1&extra=#pid4621
这个和设计者对笔顺的认识正确与否有关。不过,如果有使用者和他们的笔顺错一起去了,用起来倒是正好了{:4_173:} 这里面还有这么多讲究,这需要很了解才能找出这么多失误之处呢。
又是很好的讲解帖,黑黑辛苦了{:4_187:} 红影 发表于 2026-1-22 22:17
这个和设计者对笔顺的认识正确与否有关。不过,如果有使用者和他们的笔顺错一起去了,用起来倒是正好了{:4_ ...
我觉得还是规范的嚎,输入法编码应该是严谨的 霜染枫丹 发表于 2026-1-22 21:14
马老师晚上好!您写的教材总是很好懂,无论是否采用,都涨了知识,会感到:“原来如此“的愉悦,
谢你分 ...
{:4_180:} 红影 发表于 2026-1-22 22:18
这里面还有这么多讲究,这需要很了解才能找出这么多失误之处呢。
又是很好的讲解帖,黑黑辛苦了
我看到交流页面里,字海网的老师似乎是不太耐心接受大家的意见,所以我也没有跟他们说啥,就自己发着玩玩。我自己用的码表当然要修改,我主要还是冲着这个而来。 马黑黑 发表于 2026-1-22 23:10
我觉得还是规范的嚎,输入法编码应该是严谨的
那是当然,严谨是必须的,毕竟是面向大众的东西。 马黑黑 发表于 2026-1-22 23:13
我看到交流页面里,字海网的老师似乎是不太耐心接受大家的意见,所以我也没有跟他们说啥,就自己发着玩玩 ...
不想听就不理他们好了,自己知道是最厉害的。 红影 发表于 2026-1-22 23:40
不想听就不理他们好了,自己知道是最厉害的。
厉害不厉害倒没啥,自己用着趁手是要追求的 红影 发表于 2026-1-22 23:38
那是当然,严谨是必须的,毕竟是面向大众的东西。
面向谁都需要严谨,这是学术范畴 马黑黑 发表于 2026-1-22 19:26
你去查一下汉典,每一个字书写播放:
https://www.zdic.net/hans/%E4%B9%9D
{:5_162:}好哒,这个最权威的。。这个汉典是个宝贝,收了。。 马黑黑 发表于 2026-1-22 19:27
最后一笔画不是小额
{:4_173:}好哒,不能随心所欲。。拆字必须遵守规则。。