我不在双拼吧发言,所以就回复在本吧了。
这位同学的统计资料一看就是有问题的,统计出一个数字,但不去查看差异到底是怎么产生的,这个统计就没有意义。
差异主要是2简字,也就是同音字的部分。差异原因分析了一下,如下:
1.只以字频为依据而不考虑音频
如“参”字,快手两个音都入选can、cen,小鹤的cen岑,自然不能入选;这样的字很多,大da dai、车che ju、给gei ji、着zhao zhuo zhe 、房pang、色she shai。。。
这样低频的音都能入选,可见统计太粗糙。而这样的编码被放到二简,不知道是快手作者编码的问题还是此统计表的问题。
建议同音字频参考一下拼音输入法,我通常看搜狗输入法。
2.字频表可能也比较老了
比如“杀”字在拼音输入法中通常都排在“啥”字后面,但这个字频表“杀”在400多,“啥”在2000多
3.还有小鹤有二简让词的情况,比如 jt今天(决) vy这样(准)
如果这份统计快手编码确实是这样取的二简,那应该是最差的一个二简设计。
这位同学的统计资料一看就是有问题的,统计出一个数字,但不去查看差异到底是怎么产生的,这个统计就没有意义。
差异主要是2简字,也就是同音字的部分。差异原因分析了一下,如下:
1.只以字频为依据而不考虑音频
如“参”字,快手两个音都入选can、cen,小鹤的cen岑,自然不能入选;这样的字很多,大da dai、车che ju、给gei ji、着zhao zhuo zhe 、房pang、色she shai。。。
这样低频的音都能入选,可见统计太粗糙。而这样的编码被放到二简,不知道是快手作者编码的问题还是此统计表的问题。
建议同音字频参考一下拼音输入法,我通常看搜狗输入法。
2.字频表可能也比较老了
比如“杀”字在拼音输入法中通常都排在“啥”字后面,但这个字频表“杀”在400多,“啥”在2000多
3.还有小鹤有二简让词的情况,比如 jt今天(决) vy这样(准)
如果这份统计快手编码确实是这样取的二简,那应该是最差的一个二简设计。