这不再是一个简单的词库。决不是将10万词条拼在一起就是词库的做法。这个词库精心考虑并且解决了很多问题,可谓举世无双,世间仅有,不可多得,我对它的敬佩,简直如滔滔江水,延绵不绝!
1:经过复杂而精心考虑的词频分配,配合点讯的词库压制分为2500个频段的特点,词频越高,频段越细。比起上一版本明显提高输出速度,特别是3字词的速度。同时避免调整词频产生的词频混乱问题。
2:分离2,3,4以及以上的字数词条,实现2字词条比3字词条优先,3字又比4字优先等,避免输入两个字的词语的时候点讯会按声母匹配出来一堆长长的词条的麻烦。如果需要简拼,请用隔音符。
3:2字词分离第二字读音为zi,ci,si的词条,实现zi,ci,si的词条比zh,ch,sh的词条优先,避免了要输入“燕子”而优先输出的是“研制”等按Zh优先匹配的做法。
这是拇指键盘和梅花按词频和声母双重优先匹配的特有问题,只有通过此办法解决。所以此词库特别适合拇指键盘使用。输出优先法则为:
字数词条:
2字>3字>4字以上
第二个字读音:
ai,bi,ci>chx,
pi,qi,ri,si>shx,
xi,yi,zi>zhx,
a>bx,
e>dx,
i>gx,
o>mx,
u>tx.
4:去掉废词若干,改掉错音词若干。
技术公开。但是主要是耗费大量人力物力,相信没人会为这事自己重复做一遍。
---------------以上规则点讯已经实现,所以不再做这方面努力了--------------
输入请注意:
1,绝大部分聊天用语都已包含,比如:有空聊,下次聊,很久不见了,想死你了,烦死了,吃了吗,下次见……等等,大可以放心随意输入即可,充分利用,速度大大的提高了,不需要自己造词。成语包含10000条以上,请不要两个字分开输入,以免造成使用不便。请充分利用使用点讯“‘”隔音符号,输入长词条时候尤其有效。
词条部分组成如下:
2字:5万
3字:3万
4字:1.5万
5字以上:1万
2,另外出一个医学版,包含部分医学词汇,仅少量基础词汇和常见药物,仅足够日常生活使用,打论文还是必须得在电脑上完成。大部分长词条可以通过基础词汇组合得到。所以这个词库更适合医学专业的朋友使用,输入的时候也不需要单个字输入,尽可以打词组。
本词库的特点是:精〔精挑细选〕,准〔准确校正〕,全〔力求包含最多专业基础词汇〕,快〔速度不会明显延迟〕,偏〔偏重于聊天口语〕
20081115更新一个,增加自造词3333个总词汇量为11万5百,多数包括在2、3字部分,输入的时候请充分利用。兼容点讯6,6.1内核版本。
20081106更新一个。不等点讯了。调整了部分很常用的词频,首选会更合理。加入小量自造词,删除小量错词,精简小量废词,太过繁琐,所以没有记录。词汇量10.7万。
20081027最后一个大幅度校正版本将会随着点讯新内核的推出而推出。精简,排错,整编查对。点讯新版将可以支持至少20万词库而不会有明显的延迟,精确匹配将减少重码60%,找词不再困难。所以,不分医学版本了。之后,前路茫茫,不知该去何方..............
20080926发现:〔因是手机上传,我的手机上网不包月,流量要费用,所以只传医学版,此个版本只比普通版多出1300医学基础词条,普通人使用完全不受影响,暂时不打算上传普通版。〕
——已经修正——
乍暖还寒——错音,huan
上窜下跳——错词〔正确:上蹿下跳〕
像模像样——错音,mu
综合症——错词〔正确:综合征〕
另外加上一些常用短语,如〔这类词组不需要全部打完,只要在点讯上打出前四五个字就会自动上屏〕:
哑巴吃黄连有苦说不出;
落花有意流水无情;
麻雀虽小五脏俱全;
明枪易挡暗箭难防;
嫁鸡随鸡嫁狗随狗;
医学词条举例〔包括名词和药物〕:
整联蛋白zheng'lian'dan'bai
[ 本帖最后由 wulishui 于 2008-12-2 19:57 编辑 ]
附件: 您所在的用户组无法下载或查看附件