朋友定制了一份单字码表
本帖最后由 马黑黑 于 2021-8-5 19:35 编辑朋友有一份微软拼音的单字码表,格式如下:
a 阿 啊 呵 嗄 锕 吖 腌
ai 爱 埃 艾 哎 癌 挨 唉 矮 哀 碍 隘 嗳 捱 霭 蔼 暧 瑷 皑 嫒 嗌 砹 锿
现要变成每一个字一行并附有拼音,拼音放在字的后面,字和拼音之间用制表符隔开。大致格式如下:
阿 a
啊 a
…………
爱 ai
埃 ai
实现思路:很多,通过编程实现没问题,这里不谈;通过深蓝之类的输入法码表转换,更快,这里也不谈;单说没有什么技术含量的笨方法:EmEditor + Excel ,意在彰显一下 EmEditor 和 Excel 的功能之强大。
一:基于 EmEditor 的操作
①拆离代码和汉字
先将代码与文字分开,代码单独占一行,文字作为一个整体单位存在、前面加一个制表符后,单独各占一行。
EmEditor支持正则表达式,所以构建一个如下的表达式:
(^\w*\w)\s
这个表达式可以连成一体,之所以分成两部分,意在方便替换时引用。两个部分组成:括号里是一部分,意思是找出是单词的东东,其中,^ 指行首,即每一行的开始处,两个 \w 表示单词开头和结尾(拼音就是一个单词的结构),* 表示一切字符(严谨的话应该用限制,这里没必要);\s 是单独的一部分,是第二部分,表示一个空格(拼音之后是一个空格,然后才是文字。这个空格要去掉,否则将对码表产生影响)。
按 Ctrl+H,呼出替换窗口,查找框输入上述正则式子,替换框输入:
\1\n\t
这个正则式子解释一下:\1 表示向后引用第一个表达式(括号里的那个),\n 表示换行,\t 表示加个制表符(就是文本框中按 Tab键 得出的长空格,一般是四个空格,但又不是四个空格可以替代的)。然后点全部替换,结果如下:
a
阿 啊 呵 嗄 锕 吖 腌
ai
爱 埃 艾 哎 癌 挨 唉 矮 哀 碍 隘 嗳 捱 霭 蔼 暧 瑷 皑 嫒 嗌 砹 锿
②汉字按单字拆离
每行汉字之间,俩俩之中有一个空格,利用此规律,继续用 EmEditor 的正则替换实现按单字拆离的目的。查找栏输入真实的空格(按空格键),替换栏输入:
\n\t
即,换行(\n)+制表符(\t)。效果:
a
阿
啊
…………
ai
爱
埃
…………
二:基于 Excel 的操作
复制 EmEditor 上述操作结果的全部内容到 Excel 里来,样式如下表所示:
a
阿
啊
ai
爱
埃
全选拼音所在的列,按 Ctr + G 调出定位操作窗口,选择“空值”,单击定位按钮后退出该窗口,此时 a 下面的所有空值的单格全部被选中,不要去破坏被选中的状态,直接输入英文输入状态下的等号(=),然后鼠标单击 “a” 所在的单元格(A1),再按 Ctrl+Enter ,效果示意如下:
a
a阿
a啊
ai
ai爱
ai埃
注意看单字列,有空值呢,这个要删除,删除之前,得先处理一下拼音列,不能有公式存在:复制该列,再在该列选择性粘贴→数值。接着,删除文字列中的空值所在行的操作来了:选中单字所在列,按 Ctrl + G 调出定位窗口,选取空值,单击定位按钮再关闭该窗口,此时汉字所在列的空值单元格全部被选中,不要破坏选中状态,在任意一个选中的单元格处右键单击→删除→删除整行。
还要调换一下拼音列和单字列的位置:选中任意一列,按 Shift键不放,鼠标指针移到选中列的边缘处,当指针变成四个指向的图标时,按下左键,拖曳至指定位置,松手。效果:
阿a
啊a
爱ai
埃ai
OK,一顿酒的钱钱到手(友情价)!
PS:最后一步骤没说——
在 Excel 里全选→复制,在 EmEditor 里新建一个文档,粘贴,保存为 utf-8 有签名 的文档
这才真正大功告成 又来涨知识了{:4_204:}老黑晚上好 {:4_190:} 虽然你说是没有技术含量的笨办法,可我看着很有技术含量啊。第一步的拆离代码和汉字我都不会,跟别提后面的了{:4_173:} 对很多数据来说,这法子一定很便捷。我碰到的都是少量的东西,我情愿一个个输入{:4_173:} 老黑厉害啊,看得我头有点晕了!{:5_153:} 加林森 发表于 2021-8-5 21:21
老黑厉害啊,看得我头有点晕了!
头晕是正常的吧{:5_106:} 大猫咪 发表于 2021-8-5 21:02
又来涨知识了老黑晚上好
晚上好 红影 发表于 2021-8-5 21:16
虽然你说是没有技术含量的笨办法,可我看着很有技术含量啊。第一步的拆离代码和汉字我都不会,跟别提后面的 ...
正则表达式是一个令人头疼的东东,包括程序员都可能会怕它。多数人都不是百分之百掌握的,构建表达式时查查资料,编写好后测试,能解决问题就成。 红影 发表于 2021-8-5 21:16
对很多数据来说,这法子一定很便捷。我碰到的都是少量的东西,我情愿一个个输入
少量数据的确手动录入就行。大量数字,也手动输入的话,就很耗时了。 马黑黑 发表于 2021-8-5 23:06
头晕是正常的吧
当然,老了就容易看晕的。 不是一般的看不懂~~那是实在看不懂~~ 杨柳青 发表于 2021-8-5 23:32
不是一般的看不懂~~那是实在看不懂~~
谢顶。如没必要,可以不看{:5_106:} 加林森 发表于 2021-8-5 23:30
当然,老了就容易看晕的。
血压不高吧 这个我真不懂 好像我也是平时不需要用的{:4_173:} 马黑黑 发表于 2021-8-5 23:09
正则表达式是一个令人头疼的东东,包括程序员都可能会怕它。多数人都不是百分之百掌握的,构建表达式时查 ...
黑黑懂得真多{:4_204:} 马黑黑 发表于 2021-8-5 23:14
少量数据的确手动录入就行。大量数字,也手动输入的话,就很耗时了。
是的,很多功能对大量数据来说,的确是神器,可以解决很多麻烦。 红影 发表于 2021-8-6 16:04
是的,很多功能对大量数据来说,的确是神器,可以解决很多麻烦。
处理问题的方法选择往往取决于工作对象吧 红影 发表于 2021-8-6 16:03
黑黑懂得真多
多乎哉不多也