中原富国科技网

价值380亿美元!“数据”超级独角兽如何赢得资本的青睐?

中原富国科技网 1

价值380亿美元!“数据”超级独角兽如何赢得资本的青睐?

数据管理的重要性可以从初创企业的融资金额中看出,本月初,型数据分析工具供应商databricks宣布,其已获得了16亿美国的第h轮融资,价值超高达380亿美国,距离上一轮融资10亿美国仅几个月。自2013年以来,该公司共进行了八轮融资,此次获得了亚马逊、微软和谷歌的联合投资。事实上,这不仅仅是databricks。提供统一、处理和分析存储在不同来源和体系结构中的数据的服务的公司通常在市场上赢得了高度赞誉。例如,去年市值900亿美元的规模IPO snowflake,以及去年上市的企业人工智能公司Ai c3,以及截至目前已筹资3.416亿美元的公司pingcap,crunchbase数据显示,自snowflake去年上市以来,风险投资在数据分析和管理方面花费了近170亿美元,仅在过去8个月内就投资了150多亿美元,为什么投资者喜欢databricks这样的公司?因为越来越多的公司希望利用机器学来降低运营成本,改善产品和用户体验,而数据库是解决机器学普及的支柱▍ 数据问题有多困难目前,许多公司正试图改进数据操作并启动机器学项目,但突然发现难以控制公司的数据基础架构。得益于可扩展的云服务,这些企业可以收集量数据,而无需对IT基础设施和人才进行早期投资。然而,在型云服务提供商和严重寡头垄断并存的背景下,将这些数据投入使用说起来容易做起来难,小企业客户的数据通常分散在不同的系统中,并按照不同的标准存储,因此,不同的数据存储可能会使用不同的约定来注册类似的信息,使它们彼此不兼容。此外,一些数据库可能包含敏感信息,这对不同的数据科学和商业智能团队使用极为不便。所有这些都使得整合数据和准备使用机器学模型和商业智能工具非常困难。事实上,不同的调查表明,应用机器学程序的主要障碍与数据工程任务和人才有关,因此,databricks等公司应运而生。databricks的创始人包括Apache spark、delta lake和mlflow的人员。这三个开源项目已经成为机器学项目的关键组成分,这些项目运行在非常和不同的数据源上,apache spark是一个可以处理各种格式的量数据的分析引擎;Delta lake是一个存储层,它将数据湖和数据仓库集成在一个体系结构中,可以像经典数据库一样进行查询;Mlflow是一种管理机器学管道和不同版本模型的工具,它是databricks的主要云服务Lakehouse,使用所有这些项目收集不同的数据源,以便数据科学家和分析师可以从一个平台运行任务。公司的统一平台使商业智能和机器学团队能够轻松协作和共享工作空间。它通过提供对不同数据源的统一访问,减轻了数据工程的负担。在该平台下,它可以处理诸如模式不兼容、匿名化以及流媒体和批处理数据之间的切换等问题。与其他类似服务一样,databricks平台支持Microsoft azure、Amazon AWS和Google cloud,这是多数企业用来存储数据的云基础设施。这使databricks能够利用主要云供应商的稳定和可扩展的基础架构,消除了客户迁移数据的需要▍ 客户和小客户各取所需,可以看出,对于那些拥有量未数据的企业来说,databricks的服务是非常有价值的。例如,阿斯利康利用databricks平台统一了数百个内和公共数据源,从而实现了更快、更流畅的查询、更好的团队协作,以及更快的操作。这对于一个花费数十亿美元和多年研究寻找有希望的假设和运行实验的行业来说至关重要,汇丰银行(HSBC)使用该平台改进其欺诈检测系统和推荐引擎。该银行能够将14个数据库集成到一个三角洲湖中,并将其提供给其数据科学和机器学团队。Delta lake的建立是为了满足一些法律和监管要求,例如在将客户数据发送到机器学模型之前对其进行匿名处理。改进后的数据管道将操作速度提高了几个数量级,并帮助机器学团队加快模型的、培训和调整。总体结果是改善客户体验。例如,该银行移动应用程序payme的用户参与度增加了4.5倍,databricks的竞争对手也在这样做。ai的客户包括石油和天然气巨头、机构、型制造商和医疗保健公司。雪花为超市和连锁餐、包装食品和饮料公司以及医疗机构提供服务不难发现,不仅是那些无法建立自己的数据管道或处于机器学项目初始阶段的公司,但同时,中型科技公司对企业数据管理和人工智能服务有着强烈的需求毕竟,市场上仍有少数企业可以根据自己的需求定制数据基础架构,并优化开源和云服务的使用▍ 潜在竞争极其激烈,在最近一轮融资中,databricks宣布其年度经常性收入(ARR)为6亿美元,较2020年的4.25亿美元有所增长。正是这种令人兴奋的增长吸引了投资者向公司注入更多资本。然而,databricks及其同行必须克服一些挑战。首先,市场竞争非常激烈,正如databricks首席执行官Ali ghodsi所说,“数据湖(房屋)是一条新的轨道。我们认为这条数据轨道上会有许多供应商,因此这是一个快速占领领土的过程。”

databricks首席执行官阿里·戈德西(AliGhodsi)在某些市场,该公司利用网络效应或优质数据锁定客户,以保持其相对于竞争对手的优势。但在数据处理行业,市场动态有所不同。尽管databricks提供了一种非常有用的技术,但这并不是其他公司无法复制的。此外,由于该公司的技术基于主要云提供商,因此客户转向竞争对手几乎没有障碍。这意味着业务成功在很程度上取决于市场参与者的客户获取策略以及他们通过持续创新留住客户的能力,增长也将在很程度上取决于该公司将获得何种客户。databricks在其最新一轮融资中宣布,该公司拥有5000名客户。由于该公司尚未申请首次公开募股,我们不知道其财务状况的详细信息。然而,根据同行的水平,一些非常的客户将占其收入的很一分。例如,到2020年,c3,人工智能36%的收入将来自贝克休斯和恩吉。根据snowflake的s-1文件,在2020年上半年,其3000个客户中有153个贡献了近30%的收入。这表明,只要这些公司能够获得愿意花费量资金的新客户,他们就会增长。但一旦市场饱和,增长将趋于稳定。然后,他们将不得不向现有客户销售新服务,这是非常困难的,或者通过提供更具竞争力的价格来相互窃取客户,这将减少他们的收入。显然,每个主要客户的流失都将对这些公司的财务状况产生巨影响,更可怕的是,尽管亚马逊、微软和谷歌这一轮都投资了databricks,但这三家云计算提供商都有以databricks为基准的潜在产品。例如,谷歌有bigquery,微软有azure synapse,亚马逊有redshift,一旦市场成熟,预计云计算巨头将出售以侵蚀市场份额,鉴于其强的财务实力,这巨头要么收购较小的数据管理公司,要么以更具竞争力的价格窃取其客户▍ 结论:像databricks这样的公司上市令人兴奋,但如此高的估值是合理的还是市场投机的副产品,还有待观察。考虑到这些公司的结构和商业模式,尚不清楚它们将如何继续保持投资者预期的增长,也不知道他们是否能够承受长期和不可避免的

windows的虚拟机怎么启动

android studio有快捷方式吗

linux怎么设置内核文件

邮政快递代签收规定是什么

韵达快递为什么上门取件

在水边钓鱼有什么感觉

蛙泳控制不住下沉了怎么办

免责声明:文中图片均来源于网络,如有版权问题请联系我们进行删除!

标签: