马黑黑 发表于 2021-9-26 21:59

小辣椒 发表于 2021-9-26 21:58
我也是搞不明白

搞不明白也正常

马黑黑 发表于 2021-9-26 22:03

加林森 发表于 2021-9-26 20:39
我就不行,没有时间去研究这些的。

时间就像那个啥,挤挤就有

马黑黑 发表于 2021-9-26 22:04

红影 发表于 2021-9-26 20:38
“GBK汉字里,从 “一” 到 “龥” 是连在一起的,共20902个单字”

原来是这样。龥是最后一个字,现在 ...

是相连部分的最后一个。还有少量在另外的区,忽略不计了。

加林森 发表于 2021-9-26 22:11

马黑黑 发表于 2021-9-26 22:03
时间就像那个啥,挤挤就有

好像有点道理

马黑黑 发表于 2021-9-26 22:12

加林森 发表于 2021-9-26 22:11
好像有点道理

没道理俺不吹

红影 发表于 2021-9-26 23:26

马黑黑 发表于 2021-9-26 22:04
是相连部分的最后一个。还有少量在另外的区,忽略不计了。

嗯嗯,一头一尾涵盖了所有。

马黑黑 发表于 2021-9-27 06:57

红影 发表于 2021-9-26 23:26
嗯嗯,一头一尾涵盖了所有。

,,[你我他她它牠],等等,都是字符集的建立方式

红影 发表于 2021-9-27 10:26

马黑黑 发表于 2021-9-27 06:57
,,[你我他她它牠],等等,都是字符集的建立方式

,这个有意思,连大小写都涵盖了。

马黑黑 发表于 2021-9-27 19:20

红影 发表于 2021-9-27 10:26
,这个有意思,连大小写都涵盖了。

就是不认识汉字集{:5_106:}

红影 发表于 2021-9-27 20:46

马黑黑 发表于 2021-9-27 19:20
就是不认识汉字集

我之前不知道汉字的一头一尾事什么啊{:4_173:}

马黑黑 发表于 2021-9-27 22:07

红影 发表于 2021-9-27 20:46
我之前不知道汉字的一头一尾事什么啊

在字符集里,一般都连续放大部分,少量后来补充的

红影 发表于 2021-9-27 22:50

马黑黑 发表于 2021-9-27 22:07
在字符集里,一般都连续放大部分,少量后来补充的

嗯嗯,字符集里的孩子排列是有序的。

马黑黑 发表于 2021-9-27 22:58

红影 发表于 2021-9-27 22:50
嗯嗯,字符集里的孩子排列是有序的。

通常是有序的。但由于种种因素,不是所有的汉字都连续存放

红影 发表于 2021-9-27 23:08

马黑黑 发表于 2021-9-27 22:58
通常是有序的。但由于种种因素,不是所有的汉字都连续存放

不管是不是有序,只要一头一尾是明确的,就涵盖全部了吧?

马黑黑 发表于 2021-9-27 23:18

红影 发表于 2021-9-27 23:08
不管是不是有序,只要一头一尾是明确的,就涵盖全部了吧?

未必。因为这样会包含不是汉字范畴里的内容,达不到预期

红影 发表于 2021-9-28 10:57

马黑黑 发表于 2021-9-27 23:18
未必。因为这样会包含不是汉字范畴里的内容,达不到预期

哦,那还需要有其他的约束条件才行了。

马黑黑 发表于 2021-9-28 12:04

红影 发表于 2021-9-28 10:57
哦,那还需要有其他的约束条件才行了。

是的。所以一个严谨的、检索所有汉字的式子会更复杂,但结构也简单,用分支原理就行

红影 发表于 2021-9-28 13:13

马黑黑 发表于 2021-9-28 12:04
是的。所以一个严谨的、检索所有汉字的式子会更复杂,但结构也简单,用分支原理就行

那么,这个正则是调用那个复杂的式子的吧,式子本身并不是这么简单的。

马黑黑 发表于 2021-9-28 19:22

红影 发表于 2021-9-28 13:13
那么,这个正则是调用那个复杂的式子的吧,式子本身并不是这么简单的。

正则式子可以无限复杂,复杂到连编写式子的人过一阵子再看也看不懂

红影 发表于 2021-9-28 20:47

马黑黑 发表于 2021-9-28 19:22
正则式子可以无限复杂,复杂到连编写式子的人过一阵子再看也看不懂

达到的效果却神妙无比。
页: 1 [2] 3 4 5 6
查看完整版本: 正则表达式:匹配叠词