小辣椒 发表于 2021-9-26 21:58
我也是搞不明白
搞不明白也正常
加林森 发表于 2021-9-26 20:39
我就不行,没有时间去研究这些的。
时间就像那个啥,挤挤就有
红影 发表于 2021-9-26 20:38
“GBK汉字里,从 “一” 到 “龥” 是连在一起的,共20902个单字”
原来是这样。龥是最后一个字,现在 ...
是相连部分的最后一个。还有少量在另外的区,忽略不计了。
马黑黑 发表于 2021-9-26 22:03
时间就像那个啥,挤挤就有
好像有点道理
加林森 发表于 2021-9-26 22:11
好像有点道理
没道理俺不吹
马黑黑 发表于 2021-9-26 22:04
是相连部分的最后一个。还有少量在另外的区,忽略不计了。
嗯嗯,一头一尾涵盖了所有。
红影 发表于 2021-9-26 23:26
嗯嗯,一头一尾涵盖了所有。
,,[你我他她它牠],等等,都是字符集的建立方式
马黑黑 发表于 2021-9-27 06:57
,,[你我他她它牠],等等,都是字符集的建立方式
,这个有意思,连大小写都涵盖了。
红影 发表于 2021-9-27 10:26
,这个有意思,连大小写都涵盖了。
就是不认识汉字集{:5_106:}
马黑黑 发表于 2021-9-27 19:20
就是不认识汉字集
我之前不知道汉字的一头一尾事什么啊{:4_173:}
红影 发表于 2021-9-27 20:46
我之前不知道汉字的一头一尾事什么啊
在字符集里,一般都连续放大部分,少量后来补充的
马黑黑 发表于 2021-9-27 22:07
在字符集里,一般都连续放大部分,少量后来补充的
嗯嗯,字符集里的孩子排列是有序的。
红影 发表于 2021-9-27 22:50
嗯嗯,字符集里的孩子排列是有序的。
通常是有序的。但由于种种因素,不是所有的汉字都连续存放
马黑黑 发表于 2021-9-27 22:58
通常是有序的。但由于种种因素,不是所有的汉字都连续存放
不管是不是有序,只要一头一尾是明确的,就涵盖全部了吧?
红影 发表于 2021-9-27 23:08
不管是不是有序,只要一头一尾是明确的,就涵盖全部了吧?
未必。因为这样会包含不是汉字范畴里的内容,达不到预期
马黑黑 发表于 2021-9-27 23:18
未必。因为这样会包含不是汉字范畴里的内容,达不到预期
哦,那还需要有其他的约束条件才行了。
红影 发表于 2021-9-28 10:57
哦,那还需要有其他的约束条件才行了。
是的。所以一个严谨的、检索所有汉字的式子会更复杂,但结构也简单,用分支原理就行
马黑黑 发表于 2021-9-28 12:04
是的。所以一个严谨的、检索所有汉字的式子会更复杂,但结构也简单,用分支原理就行
那么,这个正则是调用那个复杂的式子的吧,式子本身并不是这么简单的。
红影 发表于 2021-9-28 13:13
那么,这个正则是调用那个复杂的式子的吧,式子本身并不是这么简单的。
正则式子可以无限复杂,复杂到连编写式子的人过一阵子再看也看不懂
马黑黑 发表于 2021-9-28 19:22
正则式子可以无限复杂,复杂到连编写式子的人过一阵子再看也看不懂
达到的效果却神妙无比。