可以利用cnbook和excel相互配合,来处理码表。
excel可以分列、排序、做特殊标记、运算等。
cnbook可以存贮数据,正则表达式,自定义替换表可以进行数据相减操作,做特殊标记等。
cnbook自定义替换表,分为2种。一种是正则替换,功能强,速度慢;另一种是转义符替换,速度快。
有些文本编辑器功能强大,包含cnbook和excel部分功能,其处理速度可能不如cnbook。
利用cnbook和excel,处理码表的步骤如下,可能不很简洁。
1、假设码表无容错码。即全码只有一个,简码是其前面的部分。
2、假设码表已按先编码后字频排序。如果未排序,可以从网上找综合字频,做成自定义替换表。给每个汉字配上一个字频列,然后在excel中,按照先编码后字频排序即可。
自定义替换表综合字频_21003:
格式如下:
的=的 1
一=一 2
是=是 3
在excel中:主键字编码列,次主键字频列,升序
excel可以分列、排序、做特殊标记、运算等。
cnbook可以存贮数据,正则表达式,自定义替换表可以进行数据相减操作,做特殊标记等。
cnbook自定义替换表,分为2种。一种是正则替换,功能强,速度慢;另一种是转义符替换,速度快。
有些文本编辑器功能强大,包含cnbook和excel部分功能,其处理速度可能不如cnbook。
利用cnbook和excel,处理码表的步骤如下,可能不很简洁。
1、假设码表无容错码。即全码只有一个,简码是其前面的部分。
2、假设码表已按先编码后字频排序。如果未排序,可以从网上找综合字频,做成自定义替换表。给每个汉字配上一个字频列,然后在excel中,按照先编码后字频排序即可。
自定义替换表综合字频_21003:
格式如下:
的=的 1
一=一 2
是=是 3
在excel中:主键字编码列,次主键字频列,升序