登陆注册
1358600000033

第33章 博士生涯:1988年最重要的科学发明

就在我暑期忙着教书,秋天投身奥赛罗时,瑞迪教授从美国国防部得到了300万美元的经费做不特定语者、大词库、连续性的语音识别。也就是说,他希望机器能听懂任何人的声音,而且可以懂上千个词汇,懂人们自然连续说出的每一句话。这三个问题都是当时无解的问题,而瑞迪教授大胆地拿下项目,希望同时解决这三个问题。他在全美招聘了30多位教授、研究员、语音学家、学生、程序员,以启动这个有史以来最大的语音项目。而他也期望我在专家系统方面继续努力,得到突破,在这30多人的队伍里面发挥作用。

但是,他怎么也没想到,我正想着如何脱离这个30多人的队伍,脱离专家系统的研究。奥赛罗的人机博弈,让我对统计概念有了充分的理解,我开始相信,建立大型的数据库,然后对大的语音数据库进行分类,就有可能解决专家系统不能解决的问题。

怎样向他提这件事?我一直在犹豫,他已经向国防部立项,经费已经到位,专家系统的方向是势在必行的,我是他一手调教出来的大弟子,如果我这么不配合他的方向,他会怎么处理呢?会试着说服我继续做专家系统?会大发雷霆?还是会好言相劝?

再三思考后,我告诉自己,我必须向他坦承我的看法,因为我想起当时海博曼院长对我说的:“读博士,就是挑选一个狭窄并重要的领域作研究,毕业的时候交出一篇世界一流的毕业论文,成为这个领域里世界首屈一指的专家。任何人提到这个领域的时候,都会想起你的名字。”如果我做专家系统,我就愧对了海博曼院长的期许,也浪费了我大学三年苦读,更对不起我自己。

于是,我决定鼓足勇气,向瑞迪教授直接表达我的想法。我对瑞迪说:“我希望转投统计学,用统计学来解决这个‘不特定语者、大词汇、连续性语音识别’。”

瑞迪一点都没有生气,他轻轻地问:“那统计方法如何解决这三大问题呢?”这正是我思考很久的三个问题。然后,我就长篇大论地说了十分钟,瑞迪教授耐心地听完我激情的回答后,用他那永远温和的声音告诉我:“开复,你对专家系统和统计的观点,我是不同意的,但是我可以支持你用统计的方法去做,因为我相信科学没有绝对的对错,我们都是平等的。而且,我更相信一个有激情的人是可能找到更好的解决方案的。”

那一刻,我的感动无与伦比。因为对一个教授来说,学生要用自己的方法作出一个与他唱反调的研究。教授不但没有动怒,还给予经费上的支持,这在很多地方是不可想象的。

但是,统计学需要大数据库,我们如何才能建立起大的数据库呢?瑞迪教授看到我愁眉不展的样子,再一次给了我支持。他说,“开复,虽然说我还是对你的研究方法有所保留,但是,在科学的领域里,其实也无所谓老师和学生的区别,我们都是面临这一个难题的攻克者,所以,如果你真的需要数据库,那么,让我去说服国防部去帮你建立一个大的数据库吧!”

统计学的方法也需要非常快的机器,瑞迪教授帮我购买了最新的Sun4机器。每次有新的机器,他都会说:“先问问开复要不要。”做论文的两年多,我至少花了他几十万美元的经费。

瑞迪教授的宽容再次让我感觉到一种伟大的力量,这是一种自由和信任的力量。伏尔泰曾说:“我可以不同意你的观点,但是我誓死扞卫你说话的权利!”瑞迪教授这样说:“我不同意你,但是我支持你。”这是一种真正的科学家的精神。他这种“科学面前,人人平等”的信念,深深地影响了我。这种无言的伟大,让我受益终生,也让我以这种信念对待他人的不同意见。

24年后,当我的员工郭去疾离职的时候,他是这么描述我的:“8年来,作为我的师长,开复很多次支持了我的理想,改变了我的命运,也宽容了我的缺点。当你离一个人很近,从他身上学到太多,你可能反而不知道该怎样总结你的收获。但我知道,现在当我遇到一个难以处理的困难,我常常会去想,如果是开复,他会怎么做。假如只能选一条收获来分享,那么开复让我铭记终身的教益是:‘You can sincerely disagree and full heartedly support at the same time(你可以同时真诚地反对和全力地支持)。’以前读到开复的文章里提及他的博士生导师怀疑却又支持他的研究方向的时候,我以为那只是一种雅量。而当开复身体力行地一次次怀疑却又支持我的时候,我才慢慢明白这是一种珍贵的领导力。”

这种领导力只能归功和感谢我的导师——瑞迪教授。

在导师的这种力量的支持下,我开始了疯狂的科研工作。我每天上午8~9点起床,到学校完成自己必须做的课业、助教等工作,中午回家,从中午1点工作到凌晨2~3点,一星期有6天都是如此,只有星期天是承诺妻子的“休息日”。就算星期天,我也会多次上机去看看我的实验是否在跑。一天18个小时,一周100多个小时,我坚持了三年半。

从1984年底到1987年初,我带着另一位学生一起用统计的方法做语音识别。同时,其他30多人用专家系统做同样的问题。从方法上来说,我们在竞争,但是在瑞迪教授的领导下,我们分享一切,我们用同样的样本训练和测试。在瑞迪教授的支持下,我也慢慢得到了其他教授的认可。

在1986年底,我的统计系统和他们的专家系统达到了大约一样的水平,40%的辨认率。这虽然还是完全不能用的系统,但毕竟是学术界第一次尝试这么难的问题,大家还是比较欣喜和乐观的。

1987年5月,我们大幅度地提升了训练的数据库,我又想出了一种新的方法(triphones)来建模,不但能够用统计学的方法学习每一个音,而且可以用统计学的方法学习每两个音之间的转折。针对有些音的样本不够,我又想出了一种方法(generalized triphones)来合并其他的音。这三项工作居然把机器的语音识别率从原来的40%提高到了80%!

统计学的方法用于语音识别初步被验证是正确的方向,我的内心充满了喜悦。瑞迪也同样为我感到欣喜万分,他决定把我的成果带到国际学术会议上去演讲,让世界知道统计学的方法初获成功。而我鼓起勇气对瑞迪教授说,“这是我自己做出的成果,您可不可以让我自己去讲。”瑞迪教授马上回答,“好啊。那很好,我马上给你订机票。”

就这样,我带着自己准备4年的成果,跟着我的恩师出发了。有趣的是,那一天,我开着有15年车龄的“老爷车”去接瑞迪教授,没有想到,刚刚走到一半,整个车子都开始冒出滚滚黑烟,我和瑞迪教授只好狼狈不堪地跑下了车。“不好意思,汽缸爆了。”我掀开车盖里看到一幅狼藉的景象。“没事,我们还是赶紧换坐出租车吧,否则要赶不上飞机了。”瑞迪教授安慰我说。就这样,我们好不容易拦下了一辆出租车赶往机场。后来,瑞迪教授的秘书偷偷地告诉我,瑞迪教授其实被吓坏了,他害怕地说,“再也不坐开复的车了。”

送瑞迪教授的路上报废的汽车

在这个国防部赞助的语音学术会议上,老师让我演示了自己的研究成果,受到了各高校的瞩目。当时,IBM公司和斯坦福研究院的教授都非常重视这个结果,来找我问了很多细节。

虽然识别率实现了跨越式的前进,但是我一直在问自己,80%的语音识别率有没有可能再提高一步?从学术会议上回来,我回到了自己租住的小屋里,继续做着各种试验和统计,希望有一天语音识别率能够“更上一层楼”。每一天,我几乎都是困到无法撑开眼皮才睡。

奇迹在某一天早上发生了,当我睡眼蒙眬地开始敲程序的时候,忽然发现语音识别率一下子提高到了96%。“天啊!我是不是还在做梦?”我揉了揉眼睛,不敢相信。我赶紧把程序重新敲了一遍,发现语音识别率果然提高到了96%,一股巨大的幸福的眩晕感觉涌了上来。在昨天晚上的一个程序中,我只改写了一些细节,没有想到,正是对这些细节的修改,让我的研究成果取得了突破性的进展。

1988年4月,我受邀到纽约参加一年一度的世界语音学术会议,发表学术论文。赴会的一个月前,我的导师瑞迪教授又给我上了一课,但是不是学术方面,而是市场方面的。

他对我说:“学术演讲的30分钟,你只要讲25分钟就行了,最后5分钟你拿一个话筒传给观众,让他们自己试试,这个系统是不是真的。”

我说:“但是,会场噪音很大,一定会打折扣,达不到96%,而且那么多日本学者,他们的口音我的系统可没听过。”

老师说:“实际上你的识别率是90%还是96%,没有什么差别。我们这么做的目的,不是要监测你的识别率,而是要造成一个效果,让每个学者终生都会记得,第一次接触不指定语者系统就是在纽约,在李开复的演讲上。”

我说:“好吧,照你说的做。但是,识别的速度不够快,让大家等太久不好吧。”

“没关系,我让系里面最厉害的黑客来帮你修改程序,帮你做得更快。”瑞迪教授说。

他又说:“你该给你的系统取个名字了,这样他们才知道如何称呼你的系统。你的奥赛罗系统都有名字。”

《纽约时报》对我的博士论文的报道

于是,我给系统取了名字,叫做Sphinx(斯芬克斯,希腊的人面狮身)。希腊的人面狮身有人的脸孔、狮子的身体、鸟的翅膀,我取这个名字是希望狮子的身体代表宏伟的统计模型,人的脸孔代表人的语音知识,鸟的翅膀代表系统的速度。

在这个会议上,我把96%的语音识别率发表了,也演示了Sphinx系统。结果就像瑞迪教授所预期的,学术结果和演示效果相映之下,我的成果撼动了整个学术领域。这是计算机领域里最顶尖的科学成果了。语音识别率大幅度提高,让全世界语音研究领域闪烁出一道希望的光芒,从此,所有以专家系统研究语音识别的人全部转向了统计方法。

会后,《纽约时报》听说了这个成果,派记者约翰·马可奥夫(John Markoff)来到匹兹堡对我作了采访,文章发表于1988年7月6日,占了科技版首页的整个半版。在这篇文章里,马可奥夫大力报道了我的论文的突破。当时,我只觉得在和一个和蔼可亲的记者聊天,事后,我才知道这是一名才华横溢的着名记者,三次提名普利策奖,并在斯坦福兼教。

后来,《商业周刊》把我的发明选为1988年最重要的科学发明。年仅26岁初出茅庐的我,第一次亮相就获得这样的成功,让我感到很幸运,也让我有了继续向科技高峰攀爬的动力。

同类推荐
  • 狄仁杰评传

    狄仁杰评传

    对于历史人物传记来说,仅仅做到事迹真实还不够,还应该从更多的方面丰富人物的形象,给读者一个鲜活的立体的印象。为此本书还从思想、信仰、品格、心理、君臣关系、同僚关系等方面,对狄仁杰进行研究和评价。此外,人总是生活在社会之中的。由于历代都有以狄仁杰为题材的文学艺术作品出出,为了反映不同时代对他形象的描写,使读者便于对历史上真实的狄仁杰和文学艺术作品中的狄仁杰有一个全面的了解,本书在附录中对这些作品进行了介绍,并加了简略的评论。
  • 爱国主义教育丛书:章太炎

    爱国主义教育丛书:章太炎

    杭州西湖风光秀丽的南屏山麓荔枝峰下,翠竹苍柏间有座高耸的墓碑,上面有“章太炎之墓”5个苍劲古朴的大字。这里就是一代伟人,中国近代史上著名的资产阶级民主革命家、思想家和学者章太炎长眠之所。章太炎,初名学乘,后名炳麟。因羡慕明末清初爱国主义思想家顾炎武的文章道学及为人,故改名号。因顾炎武本名为绛,就改名为绛,自号太炎,字枚叔,又做梅叔。
  • 沈从文和他身边的人们

    沈从文和他身边的人们

    本书以沈从文的一生为经,以与之交往的人为纬,由此编织了一幅五彩缤纷、二十世纪中国文人的历史画卷。
  • 德约科维奇:一发制胜

    德约科维奇:一发制胜

    本书由德约科维奇(昵称小德)亲笔撰写而成。书中描述了他是如何在塞尔维亚的战火纷飞中走上网球之路的,此外,还包括小德回顾历届大赛中的精彩瞬间和夺冠时的心路历程,并提供了可供读者实际操作的身心调节方法以及健身、减重、饮食秘诀。
  • 光耀世界的科技名家(下)

    光耀世界的科技名家(下)

    中国是一个拥有五千年灿烂文明史、又充满着生机与活力的泱泱大国。中华民族早就屹立于世界的东方,前仆后继,绵延百代。著名科学史家贝尔纳曾说:“中国在许多世纪以来,一直是人类文明和科学的巨大中心之一。”在中华民族的历史长河中,曾创造了无数的文明奇迹。
热门推荐
  • 我过去真的是个兽系修士吗

    我过去真的是个兽系修士吗

    又名《别苟了,去修仙》,真?沙雕文。矿二代佛系憨批??乖乖仔面瘫弟控妖艳贱货前女友??突然失忆前男友误入冥府打工妹??四肢健全伪残疾在大陆统一,飞升率飙升的大时代下,过去炒鸡努力的兽系修士竺姜突然看破红尘,在凌云门开始了愉快的啃老生活。懒得社交,懒得修炼,懒得找情缘……懒也没用,该来的终归会来。竺姜:“话本看多了,就总有变成女主角的那天。”╭(°A°`)╮舒夷:“我只当狐狸精是亲妹……才怪。”柳去尘:“这个追了我一年多的女人竟莫名有些带感。”许长夏:“如此能干的小丫鬟,还是永远呆在阴间吧。”竺姜:(?????)往者不可谏,来者犹可追。管你过去咋样,未来永远是有无限可能的未来。
  • 从练习生到影帝

    从练习生到影帝

    粉丝眼里他是偶像,公司眼里他是偶尔闹别扭的员工,前辈眼里他是努力的后辈妈妈眼里他是改变的孩子,市场眼里他是幸运的宠儿。从偶像练习生开始一步步走上演绎的道路。
  • 小农场日进斗金指南

    小农场日进斗金指南

    现今社会中,人们对健康农鲜产品的需求不可小觑,抓住商机掌握诀窍,一块2英亩的小农场的收益能力,未必会比大农场差。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 仙府之路

    仙府之路

    炼药弟子偶得仙法,奈何资质平凡仙路无望,是奋力前行,还是就此退却?
  • 痴情皇子追逃妃

    痴情皇子追逃妃

    她是晋国最受宠的瑞玉公主,有着绝美的容颜、聪明的头脑。为了抗婚,她逃离皇宫,藏匿民间,不料惨遭暗算,坠崖受伤!令她遗恨终生的是,她这一去,居然山河变色,家国破碎!亡国公主将如何面对失去家国与亲人的生活,在这敌众我寡的逆境中,她将如何忍辱偷生、力挽狂澜?他是俊美多情的皇子,甘愿为心中纯美的爱情执著守候,无怨无悔。为了爱,他不惜追随她的脚步,苦苦寻觅,历尽艰辛,为了爱,他不惜蒙骗天下人,精心策划一出求婚计谋。一切,只为逼她现身!两个倾心相爱的人,在时光交错中追寻、躲藏,挣扎、重逢……
  • 旧时皇榭

    旧时皇榭

    血雨腥风,黑云压城;江山易手,帝王更迭。少年皇子,陡然间,从高高在上的锦衣玉食到孑然一身,背负国仇家恨,忍辱负重;锦衣公主,一转眼,从含金揣玉的帝王之家到孤苦伶仃,身负血海深仇……刀光剑影,血雨仇杀。爱恨情仇,是非对错,转眼间,一切都成为云烟……生命如此绚烂,究是一场漫天烟火,还是那攻城硝烟?恨终究无可寻,而爱该何所托?
  • 神仙红包群

    神仙红包群

    初二的黄冉,重返母校,探望小学班主任李老师。谁知,这次行动,让他进入了一个神秘的红包群。这还是神仙吗?全都是吃货!几份甜食贿赂了玉皇大帝,轻松拿到了令其他神仙都眼红的管理员的宝座,小屌丝摇身一变成为万仙之上的大仙。我叫黄冉!爱好是吊打各种不服!丧尸病毒爆发,被感染的他努力保持着人性,却失去了一个重要的人。我要变强!我要保护我身边的人!我不能再失去了!修行两年,王者归来!拯救三界!登上世界巅峰!QQ书友群:589719611,希望大家踊跃加入。另外介绍一本朋友的书《修仙红包群》。
  • 大贤者的种植园

    大贤者的种植园

    樱花飘落的速度为五秒,生命凋零的速度想必也不过如此,如果你的生命只剩下一年,你会怎么办……原本死去的少年意外被神选中,荣幸成为园丁管理神的花园,从此穿梭各个二次元世界,一边提升实力一边种植神秘奇幻的植株,对他来说,时间就是生命,当体会过穿梭带来的乐趣,就一发不可收拾……既定世界:天降之物、漆黑的子弹、恶魔高校、约会大作战……第一次写二次元,望多多包涵!喜欢的多多支持,不喜勿喷。
  • 顽劣凤后:相君来接驾!

    顽劣凤后:相君来接驾!

    前世她只剩具枯骸,今生幻化为人她成了西瑾国众星捧月的皇子殿下!她炼丹炼药全靠一口锅,你没听错,她苏九卿背着口锅战遍天下炼丹师!打遍天下无敌手!她没灵宠打架?对不起她的灵宠不需要打架,她的灵宠早就化成美男跟着她吃香喝辣她还直接开上后宫养兽成仆!她需要女扮男装,简直美死她了好嘛,撩遍妹子掰弯男人的路还很长呢!可是本以为她苏九卿逍遥日子长久,没想到半路竟然还杀出个男人,他霸道将她拥入怀抱:“你是我看着长大的,羊肥了就要喂狼了!”世人都知道他睚眦必报、毒舌腹黑霸道不饶人甚至小气至极、不分黑白,却不知他的温柔、宠溺、宽容、大方、纵容、都给了一人。他能转眼跟别人说他一毛不拔,转头就为她挥洒一座金银宫阙!