选自Medium 作者:Ben Blume 机器之心编译 参与:李泽南
上周五,谷歌 DeepMind 发布了基于 TensorFlow 的高级框架 Sonnet,一个帮助开发者在 TensorFlow 中快速构建神经网络的开源模块。这是一个具有重要意义的举措,它意味着来自 DeepMind 二百五十余名顶级工程师的内部技术从此可以被世人所用。从此,所有开发者在面对机器学习问题时将变得更加从容。 事实上,在过去几年里,全世界最大的几家科技公司(包括谷歌、Facebook、微软、IBM、百度、亚马逊、腾讯和阿里巴巴等)和众多大学实验室已经开源了至少 250 万行机器学习平台的代码,这相当于超过 650 名开发者一年的工作量,或 8000 万美元的开发成本。 目前,所有人都可以免费使用这些工具,而其中的很多如 TensorFlow 和 Paddle 都拥有大量的学习资料和范例。因此,它们可以被视为任何想要投身机器学习领域公司令人难以置信的稳固基础。 最受欢迎的几种机器学习框架,以代码行数排序。 开源的大潮还在继续,具有学术背景的研究者和工程师正在推动他们在科技公司雇主不断为开源社区做出贡献。这种现象引出了一个有关如何安置人才的有趣问题——人工智能的生态系统需要的是所有人才集中在有限几个机构中开展核心问题研究,并不断开源其重要研究成果;还是让所有人才分散到大量小团队中去解决应用方向的问题? 很多早期初创公司都在寻找机器学习人才的时候发现他们难以和谷歌、Facebook 这样的公司竞争,后者通常拥有大量资源,为人工智能研究提供了绝佳环境。但如果大公司拒绝公开自己的研究成果,仅仅为利润考虑,这种「囤积」人才的做法可能会打击整个行业的创新。 幸运的是,目前大多数公司都没有做出这样的选择。通过开源自己的研究,这些公司正在通过向开发者提供构建机器学习业务的基础工具加速自身以及行业的创新步伐。现在看来效果是显著的,在领英网(LinkedIn)上,已有超过 7000 个职位在要求中提到了上述机构推出的框架。 来自 FirstMark 的 Matt Turck 在最近一篇文章《Firing on All Cylinders: The 2017 Big Data Landscape》中写道:
我们正站在新变革的临界点上:「大数据+人工智能」堆栈强大到几乎可以解决现实世界的任何问题。 即使是目前层出不穷的初级应用看起来也有很大潜力。DeepMind 通过机器学习技术已将谷歌数据中心的冷却系统能耗降低了 40%,显示了强大的能力。除此之外,医疗、农业、物流和公司业务流程等领域都已被机器学习渗透:
经济学中的正常收益率曲线 如果我们认为人工智能的影响遵从正常收益率曲线,那么「成熟度(Maturity)」就是发展人工智能应用的投入,「收益(Yield)」是基于目前技术水平的改进潜力。令人兴奋的是,目前我们在很多问题上都处于起步阶段,投入获得的回报是丰厚的。在未来十年里,现有机器学习技术的收益曲线将会变得平缓,但目前来看大部分技术都是值得推进的。 虽然机器学习具有光明的前景,需要明确的是,目前构建人工智能和机器学习驱动的公司并不是一件容易的事。所有初创企业都会面临招聘人才、获取训练数据和进行商业验证这三个挑战。但随着开源社区的繁荣以及更多需求的发掘,其中两个问题都正被解决。良好的创业环境正为企业家、研究者和工程师铺平道路。 |
|