猪吃屎
本帖最后由 马黑黑 于 2021-8-26 07:46 编辑我要对字海的两分法码表进行双拼转换,所使用的工具是EmEditor。事先觉得凭借正则表达式和EmEditor对宏的支持,应该容易搞定,不曾想问题还是出了。
仔细分析,发现是拼音组合的神奇性导致的。比如:
①luan 可能是 lu an,linga 可能是 lin ga 也可能是 ling a……
再比如:
②zh、ch、sh 对应的双拼分别是 v、i、u,此部分替换后可能跟后续的内容出现类似这样的拼音音节,ve、ia、ua,这些构成会导致后续替换中被视为类似于这样的合理拼音音节,lve、lia、hua,从而被替换到不正确的结果。
思来想去,对①类问题无招,决定忍着,事后再修正;对②类问题我还真脑洞大开:zh、ch、sh分别替换为猪、吃、屎,整体替换音节执行完后再还原为对应的双拼音节。果然好使!{:4_189:}
经这么个折腾,字海两分的近10万行码表成功替换,问题编码仅2000行不到,半手动处理花不了多长时间。
原来标题是这么来的,哈哈,看完笑喷{:4_189:} zh、ch、sh,明明是后面加i的读音,第一个应该是枝的音,你咋给组成了猪的音{:4_173:} 自己动手,来防止出现拼音误组,这也是本事。黑黑采用的方式是可以借鉴的。很赞{:4_199:} 红影 发表于 2021-8-26 09:08
自己动手,来防止出现拼音误组,这也是本事。黑黑采用的方式是可以借鉴的。很赞
主要是好玩吧 红影 发表于 2021-8-26 09:01
原来标题是这么来的,哈哈,看完笑喷
灌水嘛 红影 发表于 2021-8-26 09:02
zh、ch、sh,明明是后面加i的读音,第一个应该是枝的音,你咋给组成了猪的音
猪吃屎容易记住也更有意思,反正就用字的声母特征 马黑黑 发表于 2021-8-26 12:52
主要是好玩吧
能否想到去修改它,变成自己的输入规则,这点就很厉害啊{:4_204:} 马黑黑 发表于 2021-8-26 12:55
灌水嘛
看到这样的标题,谁会想到是输入法方面的技术帖{:4_189:} 这标题以为是和猪有关, {:4_189:} 老黑真逗继续学习,{:4_190:} 马黑黑 发表于 2021-8-26 12:56
猪吃屎容易记住也更有意思,反正就用字的声母特征
真痴诗,也是zh、ch、sh 声母{:4_173:} 老黑厉害!佩服佩服,这么一下又转性了。{:4_199:} 加林森 发表于 2021-8-26 17:26
老黑厉害!佩服佩服,这么一下又转性了。
{:5_106:} 红影 发表于 2021-8-26 13:17
真痴诗,也是zh、ch、sh 声母
你这个有诗意,可我不是诗人 红影 发表于 2021-8-26 13:14
看到这样的标题,谁会想到是输入法方面的技术帖
灌水不论题材 红影 发表于 2021-8-26 13:14
能否想到去修改它,变成自己的输入规则,这点就很厉害啊
大概是吧。需要录入不认得的字的人不少,但他们不用双拼。我觉得全拼麻烦,得弄一个双拼的。 马黑黑 发表于 2021-8-26 19:10
笑什么笑,龇牙咧嘴。 马黑黑 发表于 2021-8-26 19:14
你这个有诗意,可我不是诗人
我是说有很多可能,你设置了最怪的一种{:4_173:} 马黑黑 发表于 2021-8-26 19:15
灌水不论题材
嗯嗯,赞同,虽然这个不算完全灌水,而是有技术含量的。 马黑黑 发表于 2021-8-26 19:16
大概是吧。需要录入不认得的字的人不少,但他们不用双拼。我觉得全拼麻烦,得弄一个双拼的。
而且是属于自己的有重新设定的双拼{:4_177:}