花潮论坛

搜索
热搜: 活动 交友 discuz
查看: 13|回复: 6

两分输入法码表捺笔编码问题

[复制链接]
  • TA的每日心情
    奋斗
    2026-1-24 08:19
  • 签到天数: 1710 天

    [LV.Master]伴坛终老

    3084

    主题

    13万

    回帖

    28万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

    花潮帅哥鼠牛虎兔龙蛇马羊猴鸡狗猪多彩人生星月交辉奔放热烈海样胸怀春风拂面火热情怀优雅迷人神秘浪漫相遇之美鹰傲苍穹花好月圆紫色情节飞龙在天王者至尊大将风范音画大师天籁妙音共看流星风雨同行我心永远幸福快乐喜乐安康侠骨柔肠心想事成开朗大方花潮管理

    发表于 2026-1-24 13:29 | 显示全部楼层 |阅读模式

    请马上登录,朋友们都在花潮里等着你哦:)

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x

    综观两分输入法码表,其对第二字元为捺笔的字,在编码中对捺笔画字元以三种形式进行编码:其一,视为【丶】(dian),这与多数需要处理笔画的输入法做法一致,方案可取;其二是,看成【水】(shui),取其形状与【水】字末笔画相似联想而得,属“形托”做法,其做法在输入法领域也不鲜见;其三,保持笔画原本名称,【捺】(na),“音托”做法,亦为可以接受的处理方式。然而,三者混用则令人莫名其妙,试比较如下例字:


    liaodian

    piedian

    koushui

    yishui
    𢎡
    gongna
    𠮺
    kouna

    分析上述随机抽取的例字,很难找到将末笔画捺笔字元编码为点、水、捺的依据或规律,两分手册(第一版)亦未对此提供细节说明,这会造成编码难度的提升,更给文字录入操作带来诸多困惑。实际上,抽样检测发现,字海网在对以捺笔收笔、不能拆出成字的字进行两分字元拆解时,都确定捺笔画为【丶】字元,二字元拆解思路一以贯之。但码表编码环节却将此类字的一部分定义捺笔字元的编码为【丶】,另一部分为【水】和【捺】,不知是何用意、依据何来。笔者曾向DS、Kimi等AI求解,它们认为原因应该是内部编码优化需求所致,具体而言是为了分化重码。如果确实是为了减少部分编码的重码率,那么不妨检索码表,将以捺笔画作为第二字元进行编码的单字全部找出,然后进行分析比较。以下汇总的例字数据均来源于字海官网中州韵版两分法码表5.0,检索结果应该没有重大遗漏:

    1️⃣捺笔画编码为「丶」的例字:

    乂 义 乑 八 刄 发 孓 尺 衣 豖 长 𠆢 𥫻 𩁾 𫝕 𰀠 𰛅 𱍸 𱝪 𲇆

    2️⃣捺笔画编码为「水」的例字

    序号单字原始编码原始编码数字元一+点编码数
    1changshui38
    2changshui38
    3daoshui75
    4hengshui812
    5hengshui812
    6hengshui812
    7koushui1016
    8pieshui515
    9pieshui515
    10xiaoshui20
    11xueshui88
    12yishui1417
    13yishui1417
    14yishui1417

    【注】「水」字的第二字元编码亦为shui,整体编码为yishui,疑为取「水」的左右合成部件,类似的例字还有其变体「氺」yishui,后者以收尾,不编码为dian就是将其左右合成部件视为「水」,因此可以佐证笔者对前者编码规则推测的合理性。

    3️⃣捺笔画编码为「捺」的例字

    序号单字原始编码原始编码数字元一+点编码数
    1𦍖bana42
    2𠔇bana42
    3𤵑bingna85
    4𦬤caona1816
    5𤓰changna48
    6𨑃changna48
    7𠂢changna48
    8𡘎dana57
    9dingna10
    10𢎡gongna24
    11𩨶guna20
    12𧰧hengna212
    13𠅕jiaona30
    14𢁤jinna128
    15𠹩junna10
    16𠮼kouna2516
    17𠯁kouna2516
    18𠮺kouna2516
    19𩡬mana35
    20𣏛muna1912
    21𣕹muna1912
    22piena215
    23𧘇piena215
    24𠇊renna1613
    25𨱗renna1613
    26𡺒shanna117
    27𧰨shanna117
    28𣲐shuina2012
    29𣲓shuina2012
    30𣽍shuina2012
    31𥾙sina1118
    32𦂵sina1118
    33𤲄tianna14
    34𩂢yuna1713
    36𠧹zhanna10
    36𥫪zhuna89
    37𧿓zuna85

    前面提到,字海网拆分字元时均将捺笔画当作【丶】,而从上述罗列的例字看,真正将捺笔当作【丶】的占比并不高,保留原本【捺】的编码数量最多、编码为【水】的次之。官网拆分字元的方法与码表编码实际情况存在较大分歧,编码规则与编码操作思路并不完全一致。

    比较两个表格提供的各例字原始编码总条数和现有该编码第一字元不变第二字元为【丶】编码的现有条目总数,可以发现若将这些例字捺笔画原始编码的第二个字元替换为【丶】,其所产生的重码率并不特别严重,在近十万单字的码表中属于正常现象,而且还存在相反的情形即一些例字反而可以倒过来分化原始编码的重码率。由此可以认为,分化重码并非客观和急切需要,之所以出现捺笔画作为三种形态进行编码的现象,应是在编码过程中多次进行规则调整和修正,最后定型的内部规则未能全面落实到码表制作中,或说由于种种原因尚未来得及修改。再者,在对这些例字进行建检索、分析过程中,笔者发现4.0码表和5.0码表在处理捺笔画字元上存在一定差异,有修改、调整现象的迹象,可见在编码过程中存在左右为难的取舍情形。不论如何,还是建议全面统一捺笔画字元编码,以提升输入法的科学性、严谨性与易用性。

    总而言之,统一捺笔画字元的编码对输入法在应用层面而言是刚性需求,如果没有其他专业且合理的重要考量,笔者认为不应细分捺笔为三种编码方案,在【丶】和【捺】中人选一个,前者为最佳。

    以上拙见或不合时宜,若此,请一笑置之。

    评分

    参与人数 2威望 +60 金钱 +120 经验 +60 收起 理由
    花飞飞 + 30 + 60 + 30 创意十足,赞一个!
    杨帆 + 30 + 60 + 30 匠心独运,细节精致入微!

    查看全部评分

  • TA的每日心情
    奋斗
    2026-1-24 00:10
  • 签到天数: 435 天

    [LV.9]以坛为家II

    333

    主题

    3122

    回帖

    1万

    积分

    版主

    Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

    花潮帅哥鼠牛虎兔龙蛇马羊猴鸡狗猪多彩人生鹰傲苍穹飞龙在天王者至尊大将风范花潮版主

    发表于 2026-1-24 15:46 | 显示全部楼层
    我对两分输入法并不了解,但认为马老师对其码表捺笔编码问题的分析非常到位,提出的解决方案也十分中肯且富有可操作性与建设性~马老师您辛苦了
    ★青春是一个人的精神生命,奋斗是一个人最大的体面,学习是一个人最美的姿态。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2025-8-5 16:33
  • 签到天数: 44 天

    [LV.5]常住居民I

    74

    主题

    1万

    回帖

    3万

    积分

    贵宾

    Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

    花潮美女流光溢彩优雅神秘花潮贵宾

    发表于 2026-1-24 18:39 | 显示全部楼层
    笔者认为不应细分捺笔为三种编码方案,在【丶】和【捺】中人选一个,前者为最佳。。
    为啥要选点呀。。。
    我感觉从节省敲键盘次数来说,选捺最合适。。
    也最接近本色,它本身就叫na呗。。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2025-8-5 16:33
  • 签到天数: 44 天

    [LV.5]常住居民I

    74

    主题

    1万

    回帖

    3万

    积分

    贵宾

    Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

    花潮美女流光溢彩优雅神秘花潮贵宾

    发表于 2026-1-24 18:41 | 显示全部楼层
    研究非常细致,还做了汇总,把几种情况罗列出来还举例,让人看得明白。。
    辣么大个编码库里挑这些,工作量老大了。。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2026-1-24 08:19
  • 签到天数: 1710 天

    [LV.Master]伴坛终老

    3084

    主题

    13万

    回帖

    28万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

    花潮帅哥鼠牛虎兔龙蛇马羊猴鸡狗猪多彩人生星月交辉奔放热烈海样胸怀春风拂面火热情怀优雅迷人神秘浪漫相遇之美鹰傲苍穹花好月圆紫色情节飞龙在天王者至尊大将风范音画大师天籁妙音共看流星风雨同行我心永远幸福快乐喜乐安康侠骨柔肠心想事成开朗大方花潮管理

     楼主| 发表于 2026-1-24 19:34 | 显示全部楼层
    花飞飞 发表于 2026-1-24 18:41
    研究非常细致,还做了汇总,把几种情况罗列出来还举例,让人看得明白。。
    辣么大个编码库里挑这些,工作量 ...

    检索有检索的方法。当然,再怎么着,工作量也不是一般的低
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2026-1-24 08:19
  • 签到天数: 1710 天

    [LV.Master]伴坛终老

    3084

    主题

    13万

    回帖

    28万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

    花潮帅哥鼠牛虎兔龙蛇马羊猴鸡狗猪多彩人生星月交辉奔放热烈海样胸怀春风拂面火热情怀优雅迷人神秘浪漫相遇之美鹰傲苍穹花好月圆紫色情节飞龙在天王者至尊大将风范音画大师天籁妙音共看流星风雨同行我心永远幸福快乐喜乐安康侠骨柔肠心想事成开朗大方花潮管理

     楼主| 发表于 2026-1-24 19:39 | 显示全部楼层
    花飞飞 发表于 2026-1-24 18:39
    笔者认为不应细分捺笔为三种编码方案,在【丶】和【捺】中人选一个,前者为最佳。。
    为啥要选点呀。。。
    ...

    选捺是可以的,很多需要处理笔画的输入法保留有捺笔画。但从专业角度,笔画在计算机输入中归类为“横竖撇折点”五种笔画分类法,将来的专业中文笔画输入键盘会采用这个规范。点捺同类同编码是极致的编码规范。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2026-1-24 08:19
  • 签到天数: 1710 天

    [LV.Master]伴坛终老

    3084

    主题

    13万

    回帖

    28万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

    花潮帅哥鼠牛虎兔龙蛇马羊猴鸡狗猪多彩人生星月交辉奔放热烈海样胸怀春风拂面火热情怀优雅迷人神秘浪漫相遇之美鹰傲苍穹花好月圆紫色情节飞龙在天王者至尊大将风范音画大师天籁妙音共看流星风雨同行我心永远幸福快乐喜乐安康侠骨柔肠心想事成开朗大方花潮管理

     楼主| 发表于 2026-1-24 19:40 | 显示全部楼层
    杨帆 发表于 2026-1-24 15:46
    我对两分输入法并不了解,但认为马老师对其码表捺笔编码问题的分析非常到位,提出的解决方案也十分中肯且富 ...

    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    小黑屋|手机版|Archiver|服务支持:DZ动力|huachaowang.com Inc. ( 蜀ICP备17032287号-1 )

    GMT+8, 2026-1-24 20:32 , Processed in 0.064016 second(s), 25 queries .

    Powered by Discuz! X3.4

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表