马黑黑 发表于 2026-1-11 21:47

走之底和两分编码

<style>
        .artBox { font-size: 20px; margin: 30px auto; max-width: 1200px; font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Helvetica, Arial, sans-serif; color: #333; }
        .artBox h2 { color: #1a73e8; border-bottom: 2px solid #eee; padding-bottom: 8px; margin-bottom: 20px; }
        .artBox > p { margin: 15px 0; line-height: 1.8; text-align: justify; }
        .artBox blockquote { background: #fff; border-left: 4px solid #1a73e8; padding: 15px 20px; margin: 20px 0; color: #000; }
        .artBox code { background: #eee; padding: 2px 6px; border-radius: 3px; font-family: 'Consolas', 'Monaco', monospace; font-size: 0.95em; }
        .artBox .mid { text-align: center; }
        .flex { display: flex; gap: 20px; }
        .grow2 { flex-grow: 2; }
        .size60 { font-size: 60px; border: 1px solid #aaa; }
</style>

<div class="artBox">
        <p>民间将部首【辶】称为走之底、走之旁或走字底不无道理,这些俗称均突出“走”字,暗合字源信息:【辶】来源于【辵】,是【辵】部首的异写、简写之一。 【辵】是会意字,行走之意,简化部首【辶】继承并延伸其本意,例字如【迁】、【过】、【逝】等都能容易看出与【走】的密切关联。顺便提一下,【辶】的读音完全继承【辵】的读音,<code>chuò,ㄨㄛˋ</code>,但字海输入法给【辶】的编码是<code>zou</code>,取其俗读音,更便于记忆和使用。</p>
        <p><strong>&#127902;️【辶】字源变迁</strong></p>
        <blockquote>
                <img src="https://638183.freep.cn/638183/web/hanzi/2026/chuo.webp" alt="" />
        </blockquote>
        <p>虽然【辶】源于【辵】,后者并未消失,例字如其本字表示“走走停停”,【&#165052;<code>gèn</code>】意同“退”,【蟽<code>dá</code>】意同“达”等等。所以【辶】既源自【辵】又是其衍生、派生的简化部件。</p>
        <p>Unicode意欲给全球每一个存在的字符设计唯一的码点,其将【辵】作为独立部首而存在,因为如上已述汉字中存在很多以【辵】为部首的字,同时将一些含有【辶】部件的字归入此部,例如【&#190434;】等字,可能强调和突出的是字源信息,很多字词典(例如汉典等)亦采用此种分类规范,或许是Unicode给汉字编码时参照了它们的做法。</p>
        <p><strong>&#128530; 两分输入法码表的失误</strong></p>
        <p>【&#190434;】、【&#200368;】、【&#200374;】之类的字虽然在部首归类上划入【辵】部首,但其书写形态在现代汉字规范看来,部首已经演变为【辶】,输入法码表编码应将关切点放眼到部首【辶】而非部首【辵】,更不应是其他的部首。令人困惑的是,字海两分输入法对此类含有、并已定型部首为【辶】的字并非归类到【辶】部,也非规划到【辵】部,而是【廴】部,音<code>yǐn,yìn</code>,编码定为【之】的读音<code>zhi</code>,例如键入<code>zhiling</code>会打出【&#190346;】字。这类字在输入法码表5.0中有近150个,罗列如下:</p>
        <blockquote class="size60">&#190337; &#190338; &#190339; &#190340; &#190341; &#190342; &#190343; &#190344; &#190345; &#190346; &#190347; &#190349; &#190350; &#190351; &#190352; &#190353; &#190354; &#190355; &#190356; &#190357; &#190359; &#190360; &#190361; &#190362; &#190363; &#190364; &#190365; &#190366; &#190367; &#190368; &#190369; &#190370; &#190371; &#190372; &#190373; &#190374; &#190375; &#190376; &#190377; &#190378; &#190379; &#190380; &#190381; &#190382; &#190383; &#190384; &#190385; &#190386; &#190387; &#190388; &#190389; &#190390; &#190391; &#190392; &#190393; &#190394; &#190395; &#190396; &#190397; &#190398; &#190399; &#190400; &#190401; &#190402; &#190403; &#190405; &#190406; &#190407; &#190408; &#190410; &#190411; &#190412; &#190413; &#190414; &#190415; &#190416; &#190417; &#190418; &#190419; &#190420; &#190421; &#190422; &#190423; &#190424; &#190425; &#190426; &#190427; &#190428; &#190429; &#190430; &#190432; &#190433; &#190434; &#190435; &#190436; &#190437; &#190438; &#190440; &#190441; &#200367; &#200368; &#200369; &#200370; &#200371; &#200372; &#200374; &#200375; &#200376; &#200377; &#200378; &#200379; &#200381; &#200382; &#200383; &#200384; &#200385; &#200386; &#200387; &#200388; &#200389; &#200390; &#200391; &#200393; &#200394; &#200395; &#200396; &#200397; &#200398; &#200399; &#200400; &#200401; &#200402; &#200404; &#200405; &#200407; &#200408; &#200410; &#200411; &#200412; &#200413; &#200414; &#201595;</blockquote>
        <p>仔细观察可以发现,这些字的部首基本都是【辶】,仅个别字的部首在写法上有所差异但整体形貌仍是【辶】部首。这些字,从业已定型的字形字貌看,它们和【这】字所使用的部首其实并无本质区别,但和建字底【廴】有肉眼可见的明显不同。从前述我们已经知道【走】来源于【辵】,上面列举出来的字如果像【这】字一样取部首【辶】的俗读音<code>zou(走)</code>作为编码并无不妥,若坚守保持字源信息取【辵】<code>chuo</code>音也可以理解为遵从Unicode分类规范但极易造成编码逻辑的混乱,而现有码表中视此类字的部首为【廴】实在令人费解,即便从此类字的历史渊源上找到什么依据也必然过于牵强。最佳的编码选择应当是取走之底【辶】的俗读音<code>zou</code>,无需区别对待【&#190346;】和【这】两字的部首——它们俩从观感上看区别仅是两个方面:笔画的粗细、书写中末笔画的捺的收笔不同,整体形态可以归为同类,而因“形似”的不同字元采取相同编码的做法在两分输入法中被大量使用,这两个外观上大同小异的部首也就没有必要去纠结它们之间的差异。</p>
        <p>如果从隶定字等历史渊源这类因素去考察,我们能否看出字海对上述文字如此编码的依据所在呢?例如,以【&#200391;】字为例,隶定字的部首写法为【⻍】,多一个点<code>丶</code>。写法不同,其根本却不变:【⻍】是【辶】的旧写,二者来源相同、音义无异,当是同类,【⻍】与【廴】并非因此而可以画上等号。左思右想,还是找不到字海对这些字的部首使用<code>zhi</code>编码的合理理由。理解为编码错误倒是能找到依据:在字海网查询【&#200391;】字,两分字元定为<code>辶 复</code>,【这】字两分字元是<code>辶 文</code>,两字的第一字元完全一致;查询其他类似字情况亦是如此。可以斗胆猜测:字海最终制定编码规则时是将上述罗列的字的部首归类为【辶】部,而给这些字实现编码的时间可能早于最终规则的定型,而后又未能发现错误的存在。当然这仅是猜测,事实未必如此,但查询页面的字元拆分和码表编码的矛盾现实存在,理应厘清。</p>
        <p>字海网收录单字已达14.6万个之众,释义的有也有近14万,工作量不可谓不庞大不可谓不繁杂,而编码工作略为滞后于文字的收录,目前编码工作仍在持续进行中。面对如此庞大的单字进行编码实属不易,出现一些问题在所难免,可以理解。祝愿两分输入法码表的编码工作越做越顺畅。</p>
</div>

红影 发表于 2026-1-11 22:23

出现一些问题在所难免,但会给学习和使用的人带来困扰呢。

马黑黑 发表于 2026-1-11 22:30

红影 发表于 2026-1-11 22:23
出现一些问题在所难免,但会给学习和使用的人带来困扰呢。

那是那是

霜染枫丹 发表于 2026-1-11 23:02

本帖最后由 霜染枫丹 于 2026-1-11 23:19 编辑

马老师晚上好!
这些东西早点正确辅导孩子,小时候学的最牢固能记住,我由几个字一直是写错,脚踏实地的踏字都是下面多一横,没有发觉,直到辅导儿子学习才知道错了这么多年,但是我用笔写字不注意还是写错时候多。类似还有几个字。

好帖!谢谢马老师分享,我抱走了!{:4_199:}{:4_204:}{:4_190:}
https://www.yueyijyw.com/forum.php?mod=viewthread&tid=1235&page=1&extra=#pid4557

马黑黑 发表于 2026-1-11 23:49

霜染枫丹 发表于 2026-1-11 23:02
马老师晚上好!
这些东西早点正确辅导孩子,小时候学的最牢固能记住,我由几个字一直是写错,脚踏实地的踏 ...

{:4_180:}

红影 发表于 2026-1-12 10:36

马黑黑 发表于 2026-1-11 22:30
那是那是

能发现这个问题并分析得这么详尽,黑黑还是非常厉害{:4_187:}

马黑黑 发表于 2026-1-12 13:39

红影 发表于 2026-1-12 10:36
能发现这个问题并分析得这么详尽,黑黑还是非常厉害

哪里哪里?谬赞了

红影 发表于 2026-1-12 18:39

马黑黑 发表于 2026-1-12 13:39
哪里哪里?谬赞了

你的本事是我们无法企及的,能跟在你后面学习十分荣幸{:4_187:}

马黑黑 发表于 2026-1-12 19:53

红影 发表于 2026-1-12 18:39
你的本事是我们无法企及的,能跟在你后面学习十分荣幸

言重了。俺外行的
页: [1]
查看完整版本: 走之底和两分编码