波士顿风投家谈大数据

波士顿风投家谈大数据

来源 : 正和岛

“大数据”、“工业互联网”、“人工智能”等已成为热词,作为概念不绝于耳,但是只有在行业应用中才能充分理解其内涵和特征。

波士顿早期风险投资基金ProcyonVentures专注在北美高技术壁垒的大数据、人工智能、物联网、精准医疗等领域的投资。从他们所投的美国创业项目来看大数据与工业互联网等词语会感觉更真切。Procyon Ventures管理合伙人Millie Liu分享了在此领域的投资经验和感受。


4V概念与行业内的真正应用

正和岛:你们重点投资大数据、工业互联网、人工智能等领域,而且特别关注算法方面,这与你个人的经历和背景有什么关系吗?

Millie Liu:的确,因为我本科在多伦多大学学的是数学,后来在麻省理工读的金融硕士,用了三年半的时间修完本科和硕士课程的学分,所以上学时就有很多时间创业和工作,而且都是软件大数据方面的。因为特别喜欢数学、技术,毕业后多年的工作和创业还是没离开大数据、工业互联网领域,这些年做投资更加偏爱大数据分析算法类的项目。同时觉得技术不应该只是“好玩儿的”,应该解决实际的问题,所以比较关注企业产生实际价值的问题,这也成为我们的投资理念。

正和岛:“大数据”已成为热词,大家都很喜欢用“大数据”来说事。你认为应该怎样理解?能否结合你们的投资描述下“大数据”?

Millie Liu:大数据被广泛应用,这个词也多少有些被滥用,一些兜售银行、保险、房产、医院客户个人信息的骗子都要冠以“大数据”。其实,行业里有一个概念叫Big data 4v(Volume, Variety, Velocity, Veracity)更能准确反映“大数据”的特征。

01 Volume 主要指的是数量大

比如现在各种设备都会产生海量的数据:一个采矿场的机械一天平均产生1PB的数据,一个自动化生产车间一天平均产生24TB,一个大型的冶炼工厂,一天产生1TB的数据。Procyon Ventures投过一家叫Seven Bridge Genomics(跟Google,Tesla,Amazon一起被评为全球前50最具创新的公司之一)的生物信息分析公司。一个人的全组基因原始数据可以在100GB-1TB之间,一般一个实验有几百个人的数据比较正常,SBG的客户包括英国人类基因组计划,要处理英国十万人的基因数据,想象一下这里的数据量!

02 Variety主要指的是多样性

大数据种类繁多,数据格式、应用特征、数据来源等等都不是相同结构的数据。比如Procyon Ventures投了一家公司是从万维网之父Tim Berners Lee教授在MIT的实验室出来的,这家公司擅长处理的是非结构性数据,把零售数据、图片、视频、社交媒体信息、网络使用习惯等数据全都放在一起进行精准的匹配。包括京东等大电商都急需通过技术解决商业痛点,但是发现技术壁垒很高,其中就有对非结构性数据处理匹配这个问题。

03 Velocity 主要指的是速度

对数据实时处理有着极高的要求,在大量数据实时产生的同时进行迅速或者接近实时的处理。比如工厂里需要对机械生产数据做实时的分析反馈处理,否则等到发现事故发生已经过了一段时间,造成很大的损失了。还有我们平常看到的广告都是实时计算、竞价、推送的(至少在谷歌、脸书上)。你打开网页的一瞬间,广告竞价商会帮助他们的客户(比如阿迪达斯vs耐克)实时计算你所有的社交网络信息,你喜欢什么、点赞了什么、跟谁是朋友、关注了哪些歌手、点开了哪些朋友推送的文章等等,然后决定为了让你在右边的广告位里看到他们的广告愿意支付多少钱。大家可以想象广告交易平台要用到的服务器对数据实时处理的要求跟纽约证券交易所是相似的。

04 Veracity 指的是准确性

行业里的一句话是“垃圾进,垃圾出。”只有干净的数据才能产生价值,也就是只有处理过的数据才是有价值的。有些数据是散乱存在的,但整合起来就价值倍增了。比如Procyon Ventures投了一家公司叫Smarking,他们把天气,航班,公共设施,大型活动等等信息整合在一起,预测交通和停车情况,然后卖给停车场管理公司,做动态停车定价,最大化他们的收入节约成本。

与工业4.0相辅相成 AR面向消费者过早

正和岛:你用4V巧妙的概括了“大数据”的特征。那么你认为大数据和工业互联网是怎样的关系?

Millie Liu:其实,大数据应用的非常广泛,绝对不只是BAT才用得上,最大的应用是在工业互联网方面。工业互联网应用主要在三个层面:

一是机器之间的联动:通过先进传感器感知,物联网联动,计算机模型控制机器与机器之间的配合。比如大部分工厂里机器A已经坏了停下来了,可是机器B还不知道,还在生产输送给A的零件,这就会产生问题。这种就属于最简单的,把机器都连起来,互相可以感知。

二是机器与算法的结合,基于物理层的数据收集结合垂直应用中对生产流程的深度理解,利用海量数据进行机器学习,建立精准预测模型,指导生产流程。比如冶金,比如配电,都是有非常多输入值,环境又有很复杂的可变量,所有这些对最后的产品都会产生影响,比如废料率,纯度等等。机器与算法的结合就很适合这种变量极多的复杂的工业生产流程。

三是机器服务于人的互动, 连接进行生产工作的人与物,提供实时的智能以支持人的流程决策和操作,提高效率和产能。

我们投资的APX Labs研发的企业级智能可穿戴设备(被达沃斯评为2016世界先锋技术)就是最直接的例子:他们的客户包括航空航天,如波音,通用电气; 石油比如美孚; 电信比如荷兰皇家电信;整车比如特斯拉…应用的场景涵盖了复杂组装、大型器械维护检修、野外操作、零部件存取等等。AR目前面向消费者还是太早了,工业和医用倒是有很大的需求。

国内市场有待成熟 人才储备不足

正和岛:你们在美国投了那么多大数据、工业互联网的项目,你感觉中美两国在大数据应用方面有哪些不同?

Millie Liu:比较大数据在美国和中国的应用还是有很大的不同。国内相对应用于B2C较多,个人消费市场O2O非常火热。而美国很多的是应用于B2B,特别是在工业生产、金融商业、生物医疗等领域。

同时,在专业分工上国内与美国也存在很大的差异。一般企业内部都可以做一些数据挖掘的工作,视具体的应用场景,利用一些小工具,内部有好的工程师也是可以自己做的,但真正专业的采集、分析、处理还是要专业的大数据公司来做。

在国内,一方面数据分析公司比较少,人才储备不够,市场有待成熟。另一方面,企业也很敏感,哪怕知道自己可能坐在大数据金矿上但什么都做不了,也不敢把自己的数据给第三方。而美国的企业级市场非常成熟。

比如我之前工作的APT,作为第三方拥有全北美50%以上的零售数据(包括CPG、银行、保险、餐饮、租赁等所有面向个人消费者的都算在零售的范围内),这些所有的数据都是客户开放给我们的,再经我们分析处理后为客户提供优化决策服务。我觉得这还是有个商业环境和信任的问题,随着市场逐渐成熟,这些问题都会解决。

作为专注深科技的投资人,我觉得这是一个非常让人兴奋的时代。尤其在美国,在波士顿,在硅谷,每天都能看到新的技术,以及技术带来新的可能性,解决现有的痛点。而这些先进技术在国内有非常大的需求,对中国企业转型升级,对工业制造4.0等广泛的领域都将加油助力。同时,也欣喜地看到国内许多企业把目光投向美国,以资金优势布局美国,从早期创业投资到成熟项目并购。从接待过的众多中国企业家身上,总能感受到果敢和远见,相信中国的科技发展会与美国共同前行。、

更多数据科学资讯,关注datahoe


datahoe(gh_27068c29df3e)

查看原文(微信公众号)
文章为作者独立观点,不代表微文榜立场
分享到QQ 分享到微信 分享到微博
datahoe的最新文章
如何零成本用大数据获悉市场行情?

如何零成本用大数据获悉市场行情?

datahoe datahoe

当我们想要创业却对市场行情不甚了解,该如何迅速了解市场行情,以便我们能更好的切入市场?本文作者介绍了一种零成本用大数据获悉市场行情的方法,对你想要了解市场行情非常有帮助。

大数据“下田”|| 新浪潮

大数据“下田”|| 新浪潮

datahoe datahoe

大数据的深入、下潜,不再停留在城市、企业,大数据的应用再次提升了一个层次—应用到最基本的生产、曾经最原始的生产当中

人工智能的革命 || 新浪潮

人工智能的革命 || 新浪潮

datahoe datahoe

最新一期的《经济学人》杂志的封面报道,将人工智能的发展对未来世界的影响和 19 世纪工业革命联系起来,机器的大规模应用是否会让工人大规模失业。而随着人工智能技术的发展,这个问题又被人提了出来。认真地读下去,人工智能的发展将会影响一切。