李凯:把数据变成知识是重要趋势 创新欲速则不达

做企业,他是教授创业成功的代表。做科研,他是计算机领域优秀的科学家。2001年与合伙人创办的科技公司Data Domain,创造了可删除重复数据的存储器产品线,两年后替代了50%以上的数据中心的磁带库产品,在同类产品中一直保持60%以上的市场占有率。

        做科研,他是计算机领域优秀的科学家。1986年在博士论文中提出了分布式共享内存思想,开创了计算机科学的新领域,对后来的分布式计算、并行计算甚至今天的云计算影响深远。2012年当选为美国国家工程院院士,这是美国工程领域专家的最高专业荣誉头衔。

  做企业,他是教授创业成功的代表。2001年与合伙人创办的科技公司Data Domain,创造了可删除重复数据的存储器产品线,两年后替代了50%以上的数据中心的磁带库产品,在同类产品中一直保持60%以上的市场占有率,78%以上的毛利率。2007年Data Domain在纳斯达克上市,2009年被最大的数据存储公司EMC以24亿美金收购。

李凯:把数据变成知识是重要趋势 创新欲速则不达

  他就是普林斯顿大学计算机科学系教授李凯。尽管在学商两界都取得了很多人难以企及的成功,但也和同时代的人一样经历过淬炼人生的坎坷,本应美好的青年时代在文革的动荡中渡过,16岁分配到长春第二有色金属冶炼厂当工人,依靠自学争取到上大学的机会,后考入中科院就读研究生,成为文革后第一批赴美自费留学生,32岁时,获得耶鲁大学博士学位,之后于普林斯顿大学任教。

  创业成功之后,李凯又重新回到实验室,投入多个前沿科技项目。他与李飞飞教授(现斯坦福大学人工智能中心主任)发起的ImageNet项目,建立起了比以前大三个数量级的可共享视觉数据库,为全球的科研者提供了迄今最大的机器学习及视觉识别的知识库,颠覆了传统的视觉识别算法,推动了卷积神经网络(深度学习)的发展,成为当前最有效的机器学习的方法。ImageNet团队每年的大规模视觉识别挑战赛现被学术界和工业界最有价值的竞赛。

  在网易未来科技峰会前夕,李凯接受了网易科技独家专访。有着在美国从事科研30多年的经验,又对中国的科技进展有着敏锐的观察,李凯从一个全新的视角分享了如何才能使科研成果取得商业成功、以及如何才能做出真正有价值的科研成果。

  “最重要的是市场机会”

  按照惯常的逻辑,Data Domain的成功应该是一个先有核心技术,然后将其技术商业化的故事,但李凯告诉网易科技,事实并非如此。

  “最重要的是市场机会。”在2001年学术假期的夏天,他看到录音带和录像带都在被基于磁盘的产品所代替,数据中心用于数据备份的磁带库也应该被基于磁盘的产品代替,这其中蕴育着巨大的市场机会。洞察到这一变化,李凯决意停薪留职,开始了创业之路。“我是在了解到应该创造的产品后,才开始开发需要的核心技术。”李凯认为,这跟国内科技公司创业的普遍路径并不相同。

  Data Domain是在“911”事件一个月后启动的,但是对于创业者来说抓住时机非常重要。当时股市大跌,投资机构压力很大,Data Domain为了得到投资机构的支持,牺牲了大量股权,但没错过市场机会,最终成为了行业的独角兽。

  有了市场机会之后,最重要的成功因素还是人,李凯总结,Data Domain之所以成功最关键的是——“聚集了最有才能的一批人,”包括合伙人、工程师、管理人员以及风险投资公司。

  成功的第二个关键因素是对市场上的客户有很好的了解。根据市场需求设计出好的产品线,每季度,每年都要不断地推出新功能或产品,最终才能够成为市场的领先者。

  第三则是核心技术要充分利用工业界的主流技术趋势,才有持久性的竞争。Data Domain就利用了计算机主机芯片多核的趋势不断地改进产品性能,利用云存储的趋势提供远地防灾数据备份服务。数据增长的趋势大约每5年增长10倍,而互联网带宽的增长趋势远小于少于数据增长率,只有大约每10年增长10倍。为了解决大数据传输带宽的问题,远地数据备份需要新的数据压缩算法从10—30倍提升到50-100倍。

  第四个关键因素是要建立新的细分市场,成为市场的领导者。Data Domain在2007年建立了重复数据消除存储市场,一直保持60%以上的市场占有率。

  “把数据变成知识是最重要的趋势”

  Data Domain创办之后,李凯2004年左右回到了普林斯顿大学。虽然在公司做创新工作很有意义,但李凯发现自己还是对培养学生更感兴趣。他认为“学校创造的主要产品是学生,科研是培养学生的过程。”他愿意培养有科研能力的学生,“跟学生一起做科研项目,产生一些科研成果,推动科学和技术发展。”

  李凯认为,未来在计算机领域,目前能看得到的有三大趋势:

  第一,很多服务都挪到云端。其中包括计算能力、数据共享、企业管理、商业服务、银行、社交等。

  第二,把数据变成知识。对于大数据的挑战在于,如何加速科学知识的发现和发展。数据增长速度很快,每15年增长1000倍,如何能让科学知识的发现和发展也15年增长1000倍是最大的挑战。现在很多科研工实践比如机器学习,创造知识库、支持深度学习的硬件等,都是为了这个挑战。

  第三,大量的软件和硬件设计开源。由于源代码可以共享,推动了整个工业界发展。比如Linux和安卓都是开源的软件,是很多做系统和做手机及平板电脑的公司很快做出高质量的产品。

  李凯教授目前的科研项目主要是和把数据变成知识的趋势有关:

  第一,是关于创造知识库。也就是前述ImageNet的项目。在有ImageNet之前,计算机图像识别领域,更多人是投入到对算法的研究当中,知识库的构建是个短板。李凯打了个比方,就像只有小学一年级的课本,学习方法再好,学出来也还是小学一年级的毕业生。“算法需要有比较大的数据知识库才能起作用。深度学习的算法上世纪80年代就提出了,直到2012年才开始闪光,就是因为以前知识库太小,有效的算法发挥不出来。”李凯告诉网易科技,知识库大了之后,反而发现很多算法效率低。ImageNet这个项目,对计算机图像识别的研究起到了颠覆性的推动作用。

  第二,是关于脑神经科学的项目。这个项目是和普林斯顿大学脑神经科学的科学家合作,研究大脑工作的原理,搞清楚大脑的不同部位之间是如何通讯的。研究的结果可以用来训练人集中注意力,或者帮助诊断脑震荡等,价值巨大。未来,对大脑工作原理的理解、对人工智能的发展至关重要。

  第三,帮助医院做数据分析,用大数据帮助精准医疗,从而对疾病做出预测。李凯举了个例子,比如癌症患者,能否在被感染的初期就通过血液的化验等识别出来,对类似的患者,从机器学习的办法推断出来,从而及时加以干预,将对医疗有巨大的帮助。

  “科技创新欲速则不达”

  对中国的科技创新,李凯一直非常关注。接受网易科技专访时,李凯认为,中国高科技领域在很长一段时间在做的是“填补空白”工作,比如没有原子弹,就做原子弹,没有超级计算机,就做超级计算机。现在很多科技方面已超越了“填补空白”,进入了跟随世界前沿科技发展的阶段。他举例说:“比如说现在国际上有无人驾驶车的公司,中国马上就有很多公司开始做这个事。”

  “但是,用原创来领导整个工业界,领导整个科学界,在中国的计算机科学界这种项目很少,甚至基本上没有。”他指出,“下一个阶段最大的挑战,就是中国是不是能出现一批人,能够作为世界上(科技领域)的领导者。”

  就此问题,他曾专门撰文论述。2014年,为了纪念《中国计算机学会通讯》出版100期,作为中国计算机学会的海外理事,李凯系统梳理了“中国的高科技领域应当如何创新”这个思考多年的问题,应邀写了一篇长文《促进中国高科技科研创新的想法》。这篇文章的阅读人数超过了30万,这大大出乎李凯的意料。之后,《中国青年报》又对他做了专访,专访文章的阅读数更高。

  在《促进中国高科技科研创新的想法》这篇文章中,李凯着重谈了两个问题:缺少高端人才以及对技术研发与创新的不合理管理和支持,他认为这是导致中国高科技发展缓慢的两个最为关键的问题。

  李凯向网易科技指出,中国必须能够培养出能够做原创科研的人。“你最开始可以找引进的人,但是你不能永远找引进的人。因为世界上就那么多人,全球的高校都在竞争。”

  “在高校里怎样培养出最好的人才呢?就是你得给青年一代创造环境,让他们的创造力能够发挥出来,敢于做那些能够经过时间考验的科研项目。”李凯强调:“有些项目有可能失败,但是你必须开始做这种项目,不能做那种只是跟在别人后面的项目。”

  他进一步指出,如果想要培养一批好的人,学校必须意识到教育最主要的产品是学生,而不是科研成果。科研成果是培养学生的一个过程,而不能是目标。要能够给学生或者年轻的教授做原创科研项目的机会。同时,必须给他们足够的支持,只是口头支持是不够的。

  同时,李凯认为,中国在对技术研发与创新的管理与支持上也需要改进。在李凯看来,对原创科研项目的计划实际上是一种阻碍。“比如说你要做五年计划,但你怎么能在五年前就能够想象出五年后哪一个科研项目最重要呢?这是很难估计出来的,而且如果非专业的人来定的话那就更难了。”他认为在资金支持方面,李凯建议政府应当与风投联手来投资科研项目,因为科技创新本身风险大,一般风险投资公司会选1%的项目来投资,在这1%当中,只有10%能成功,总体成功率是千分之一。“怎么可能每一个项目都成功呢?这是不可能的。”他说,“我们得面向现实,按照自然规律来办事情,太着急了是做不成的。”

  酝酿“中国诺贝尔奖”

  具体到做科研工作,李凯认为,要想做出真正有价值的研究成果,科研和创新分开非常重要。他表示:“科研的目标应该集中在发现新的知识,而不是发现新的市场上。这些知识有可能多少年以后用在新的产品上,不一定现在必须用在新产品上。”他说,“可是,你要创新做产品,把知识转换成产品、转换成钱,就必须对市场了解清楚,必须有市场上的机会,然后你需要的知识有一些是需要你发明的,有一些则是别人已经发明的。所以这个过程不一样。”

  他进一步指出:“如果不分开的话,你在做科研的时候,只是想找这种有可能做产品的方向来做,就有了很大的局限性,很难真正去领导这个领域。因为领导领域里面的这些科研项目,大多数都不是现在能应用在产品上的。只要是有价值的问题,就要投入精力去研究。”

  他目前参与的“未来科学大奖”的评选就是对这一理念的实践。“未来科学大奖”由公益组织“未来论坛”发起,李凯是其科学家委员会的成员之一。这个奖想要颠覆中国以往所有科技奖励的传统模式,奖励真正的原创科研工作。

  未来论坛成立于2015年,由中国一些杰出的科学家、企业家及投资人共同发起。

  李凯告诉网易科技,“未来科学大奖”目前已经设置了两个奖项,一个是生命科学奖,另外一个是物质科学奖。生命科学奖包括了医学、生物学等领域,物质科学奖则涵盖了物理、化学、数学、计算机科学。这个奖和以往中国的其他科技奖非常不同。

  第一,这个奖不是奖给个人,而是奖给某一个科研工作。

  第二,这个奖不是奖给成功的项目,而是奖给最原创的科研工作。李凯解释:“成功的项目并不都是最原创的工作。这个奖是想奖给原创工作,也就是说它能够鼓励新一代的科学家来做原创的工作。”

  第三,这个奖候选人不是由个人申请,而是采取提名邀约制,由海内外的知名华裔科学家提名。

  第四,颁奖的主体机构是公益组织未来论坛,奖金由热心于支持科学研究的企业家和投资家捐献,而非政府出资。

  李凯告诉网易科技,未来科学大奖评选的基本方法,是先由一大批各个领域的专家来提名哪一个科研项目值得得奖。然后由科学家委员会在其中进行筛选、审定,选择出最有影响力的、可以得奖的项目。同时,科学家委员会在全球邀请获奖领域的相关专家,来撰写获奖词,而整个评奖过程则由监管委员会全程监管。

  李凯说,这套评比办法实际上是借鉴了诺贝尔奖的评选方法,因为诺贝尔奖已经历时一百多年,其评选过程及公正性已经经过了历史检验。“希望能够为中国的发奖系统做出一个样板,鼓励年轻科学人员多做原创性的、在整个领域里有影响力的工作。这才是中国科学发展的未来。”

责任编辑:吕膨江
加入收藏
新浪微博腾讯微博
齐鲁财富网
齐鲁财富网移动客户端

IOS android  
微信 手机客户端 手机浏览器

二维码

科技大咖