手机浏览器扫描二维码访问
杜克进入一种入魔一样的研究状态,他现在的时间非常宝贵,完全没有多少可以浪费的空间,所以在吃完后就迅速回到自己那个小小的家里。
wWw.QВ5.CoM坐在24小时不间断下载的电脑面前,他疯狂搜索下载各种语音片段资料,交给克里进行语音语义分析及基础知识库的建设。
自从搬到出租屋后杜克已经疯狂在网上下载了数千各种环境和语境下的语音片段,从电视电台新闻片段到影视剧对白、动物世界或是国家地理频道的科教解说片段,以及各种偷拍、自拍、伪自拍生活现场片段,感谢酷溜土豆、youtube,还有Bt和电驴,让杜克知道原来世界还有如此丰富多彩声音。
杜克收集的如此众多声音索材对于克里处理能力来说却仿佛是沧海一粟,往往刚刚输入进去,克里就运算解析出来该片段的语音语义特征,从而为语音识别的语音语义特征库增加一份新的标本元素,越是不同的语音片段越有价值。
这就像一个人生活过的地方越多,就越能听出不同地方口音是一个道理,每个声音都是有一些特殊特征和普遍特征构成的,现在的语音识别软件对于标准发音的识别率其实已经很不错了。
如iBm在很多年前就推出语音识别输入系统viavoice,在安静环境和标准发音情况下软件识别率可以达到实用级别。
可惜实际运用环境不会那么理想,而是就像杜克寝室中4个人一样千差万别,虽然大家说的都是中国话,但是四个来自不同地方的人的口音却大相径庭,刚刚住在一起的时候四个人沟通经常有些问题,但是大家很快就适应下来。
人脑强悍的学习能力绝对不是当今电脑所能够比拟的。
而现有的语音识别软件却没有这么强悍的学习适应能力,也就是说它没有用来识别这种语音特征差异的知识库,当然就无法将一些未知类型的发音很好的识别出来。
不同口音的识别和环境噪音的排除是语音识别俩个难题,要解决这些问题需要大量的第一手语音资料片段来建立一个海量的语音特征知识库,或者是开发出像克里这般高度智能的超级电脑。
克里根据杜克下载的理论资料,结合各种语音片段分析,不断对语音识别基础算法进行了更新,并且生成不同的语音识别模拟器——这是主要考虑到地球现在主流电脑的运算水平比起克里来说实在太低级。
以模拟iphone4s的50%运算能力为最低基准,克里模拟出不同性能情况下该语音识别算法的准确率和反应时间,原始版本从最初基准性能下5秒内能够达到90%的识别准确率——当然这个成绩已经远超现在地球上所有语音识别软件水准。
要知道这个90%准确率是用数千段不同语境的不同口音中英文语音信息进行模拟识别检验,也就是说基本上考虑了各种口音及噪音的过滤处理。
这个成绩已经比现在只会听英文的苹果siri要强多了,毕竟siri现在能够识别的也是比较标准的英文发音。
不信你拿印度口音和新加坡口音的英语录音片段试试看siri能够识别出多少来。
如果是在一台模拟性能接近双核2g以上主频电脑上,这个指标的识别水平将会提升到2秒以内达到97%以上准确率,反应时间同识别准确率其实有些冲突,因为要识别更加准确必须要原始版本的语音语料库基础资料来源更加丰富。
声音采样越广泛识别准确率越高,而语音样本库越庞大,用于搜索匹配的时间就会越久导致反应时间的延长,因此语音样本的抽样压缩和语音搜索匹配算法一直是克里优化的俩个重点。
克里一直在不停地模拟改进提取语音语义特征值的算法,通过不断压缩冗余值,在保持不失真的情况下持续不断缩小语音样本语料库大小,另外一方面也不断改进对语音语料库智能搜索匹配算法。
优化算法杜克帮不了什么忙,但是收集尽可能多的语音样本杜克却没有问题,所以杜克的每一天都过着一种非常充实的生活,日复一日地搜索下载不同类型的语音样本供克里分析提炼,同时不断去学习理解克里所创造的这些全新的处理算法,要敲开麻省理工的大门。
杜克必须要有一篇体现自己能力的世界领先水准的语音识别基础理论创新性论文,可是在克里的知识库中并没有现成的语音识别知识,这些对于克里来说太老旧了,老旧到比莱姆都没有为克里增加这些知识。
而克里现在做的就是在地球上现有语音识别理论和算法基础上,利用他强悍到无边的模拟能力,不断地模拟各种不同的语音处理算法。
通过模拟来找到一种更加有效的——这种方法虽然有些笨拙,但是有了克里超强的运算能力,毕竟每秒钟成千上万种可能算法都可以模拟,使得这种笨拙的方法也有相当的效果,找出了好几种可能的优化算法,将识别率和反应时间提升到了一个新的高度。
可是要将这些成果用地球人能够理解的语言和理论写出来,还要让人能够看懂,不管是对克里还是杜克来说都是一个新挑战,因为克里不是以01为核心的机械二进制思维模式,而是生物多态思维模式。
尽管克里现在已经能够瞬间同时模拟出地球上常见十多种不同性能pc机虚拟机——为了让克里能够准确了解地球上电脑的运算能力,杜克买了四台不同接口的主机和接近二十块市面主流pc机cpu提供给克里分析和测试性能基准,然后克里根据这些配置的性能来进行虚拟对应的模拟器。
可是这些特殊的虚拟机由于不需要让人理解,所以克里完全可以按照自己的运算方式来创造,因此性能虽然相当,但是实现模式却大相径庭,比起地球上risc和cisc俩种不同架构的cpu来说,复杂程度都不是一个数量级的。
因此在克里完成了按照他自己模式实现的算法后,还要按照地球上01规则来重新实现,这个对于克里来说确实是一种巨大的挑战了,更别说论文还要在此基础上再次抽象,不光要有软件实现算法,还要建立起以地球数学基础能够证明的数学模型。
因此克里几乎二十四小时不间断地不断运转着,最终模拟算法能够在最低基准上面实现1秒内达到97%识别率,而在双核2g主频电脑上实现1秒内99%以上识别率之后,足足又用了俩个周的时间。
在杜克看完十几本数学专著,下载研究了好几个开源语音识别软件的基础上,克里才完成了语音识别新算法的论文和协助杜克开发完成一个在地球电脑上运行的语音识别软件。
quot惨遭男朋友卖掉的唐小姐转身落入了陌生男人的手中,结果被啃得连渣都不剩看在他长那么帅的份上,她忍了!六年后,她带着一对高智商的可爱萌宝回国,再次落入了这个男人的手中只是,他竟然不认识自己?太好了,她要跑,结果没想到自家儿子早已找上了他,爸比,我是你儿子哟!唐小姐傻眼了,男人上前一把擒住她的腰,六年前就跑了,这次还想跑吗?带我一起吧,车归你房归你钱归你孩子归你我也归你!quot...
新书位面无限重生书号1004160702生化危机,死亡一百五十六次。新铁血战士,死亡七十八次。魔兽世界,死亡七十五次。每一次的死亡都是新的开始。一个拥有死亡回放能力的青年在无限世界中的奇幻历险,又称叶思云的一千万种死法。经历世界生化危机蜘蛛侠火影忍者假面骑士空我X战警猛鬼街星河战队环太平洋黑衣人恶灵骑士暗黑破坏神变形金刚异形大战铁血战士进击的巨人超人高校...
我突然从墓中苏醒,却发现自己睡了几百年,此时的我即不算活人,也不是死人...
她就是想报个恩而已,所以和战王殿下成亲,贴身照顾也没毛病吧?只是,说好的战王殿下伤了脚和不可言说的地方,不能人道呢?可怜她每天哼哼唧唧求饶还不放过她是什么鬼?深受摧残的慕染柒受不了跑路了。王爷不好了,王妃她跑了。派人去请回来,就说本王在房里等她。可是王妃说她肚子里揣了两个,吐得厉害,死活不肯回来男人闻言霍然起身,颀长的身影很快消失在房里。这丫头还长脾气了,等抓到她看我不打她小屁屁。...
主播,撼天宗的师妹好大的凶器,你敢去搭个讪,我打赏!看想凶器?鱼丸走一波,异界海天盛宴现场直播!主播,皇极宗少主好器张啊,给我教训他,我打赏!好!来几个会喊666的咸鱼,看我一剑秒了他!主播,求和琳琅圣女啪啪啪不要关直播!那不行,哥这牛逼的身材不被你看去了?张东成一觉醒来穿越到异界真武大陆,成了人尽可欺的废物少年不过咱有异界直播系统,于是诞生了史上最牛视频直播…玄幻世界大冒险!从此万千粉丝相随,一世张狂不折腰!美人泡尽,万道主宰我为王!...
外事问拳头,内事问度娘!无敌功法,天材地宝,强力丹药,通通给我搜!我搜,我搜,我搜搜搜!...