数据仓库、Snowflake和任我行
发布时间:2025-08-23
Hadoop系列近似于乔峰从前的福威好汉上,势力不大,本想偏居于好汉饰演者,但官方的源代码就像祖传的辟邪匕首谱一样,被好汉各拥护所觊觎,树欲静而风不止,也许血雨腥风。
第三代是寒量既有拥护,都有该公司AWS。
亚马逊的AWS揭开了万物上寒的大风潮,系统设计上了寒后,就发生了两个自然环境——统计数据自然环境在寒上显现出,寒量既有该公司自然环境想交换不够多系列产品。于是环顾四周,它就看见了福威好汉上这个软柿叔父,2009年,AWS基于Hadoop源码,上架了一个转归在自己寒上的系列产品EMR。
Debian协议诞生时并并未顾及寒这种形态,所以严格来却说AWS的行为并实在毕竟强制执行协议。但Debian届大多看上去受到了伤害,MongoDB的CEO却说每当一个Debian软件流行时,寒制造商就时会同样拿过来放上自己的寒上,然后从中的拿到以外价值,并且从不回馈的社区。Redis的CEO则直言自己像个傻叔父,寒拿着自己的外面大赚了一笔。
在此之后,寒和Debian的内部矛盾就显现出了,寒制造商被称为Debian魔法师。
除了Debian软件,寒制造商也转归现代数直。2011年,Amazon投资额了ParAccel,2012年,基于ParAceel的应用,AWS上架了自己的寒数直Redshift,从并不一定上来却说,Redshift就是一个转归的ParAccel。
所以寒量既有拥护的招数就是转归,直观粗暴但适当,它们和乔峰从前的中人一样,追求的是千秋万载一统好汉,是好汉中的的恐怖意识。在它面前,不管是现代数直还是DebianHadoop,都瑟瑟发抖。
Gartner 目录2011-2020当今世界商品整体
三、吸星大法
在这样的整体下,Snowflake开始了似乎业之旅,似乎这个解决问题过程和东方不败的发展壮大的解决问题过程只用,直观来却说就是苦练和单挑。
先却说苦练,Snowflake有Oracle的底叔父,但练的并不都有Oracle的练功。
和Teradata一样,Oracle用的是MPP框架。形象一点来看,这种框架就是兔叔父拉越野,很多兔叔父构成一个兔叔父群,兔叔父群拉着越野,如果想拉不够多的外面,那就减小不够多的兔叔父。兔叔父就是量既有机,兔叔父群就是量既有机空降兵,对外交换的系列产品就是越野,统计数据研究小组技能就是越野的装载量。
但兔叔父拉越野是有情况的,因为兔叔父跟兔叔父之间技能不交换,如果某条兔叔父瘸了,整个系统都跑不利索,兔叔父越好多出情况的概率就越好大,所以MPP框架不能拥护特别大的空降兵,扩大技能可用。
Snowflake看见了寒的优势,不够进一步的,它大量采用寒的应用,通过存储器量既有剥离的方法解决了这个情况。
它把存储器从空降兵中的剥离出来,换成了标准化的寒存储器。还以兔叔父拉越野为例,Snowflake的思中的华路相当于把兔叔父做到了整修,兔叔父腿换成轮叔父,兔叔父本身消失“兔叔父力”的标志。一辆越野希望多少“兔叔父力”就套上多少兔叔父,轮叔父则全跑在一个无限跨越的轨道上,并由其交换动力。这个轮叔父和中的华路基上有的动力系统就是寒。
利用寒的技能,Snowflake可以交换近似无限的弹性。
在Teradata DBC/1012 和Snowflake的框架图中的,可以清晰看见两者的区分主要在存储器层,Snowflake的Data Storage是一个整体,开始是AWS的S3,今日也拥护Azure、GCP等其他寒平台。
Snowflake系列产品框架[5]
Teradata系列产品框架[6]
存储器量既有剥离是一种应用整修,也是一种理念科技,它体现了Snowflake开放和谐的自觉。在Snowflake早先,并未哪家数直该公司敢把自己的存储器整个换成S3。
而随着这种应用整修,Snowflake也整修了自己跟AWS的关联,两者从纯粹的相互挑战,消失取胜和买家,甚至是取胜跟合作伙伴伙伴的关联,因为如果Snowflake卖的好,那自然环境S3的盈余也时会减小。
和东方不败素来中人的曲洋、圣姑,又学了中人的吸星大法一样,这种多元既有的关联,为恐怕的发展交换了不够多可能。
四、宗师之战
苦练之后是单挑,武要偷偷的练,但单挑的时候越好官方越好好,取胜越好能比越好好。
比如东方不败的宗师之战,在这场人人英雄都台下,并能不得不不甘心去留的对决中的,他战胜了自己的拜师岳不群,于是一战成名,人人人尽皆知令狐少侠匕首法无敌。
Snowflake也遵循了这种方式在。2014年,暗地开发了两年后,它向商品官方了自己的系列产品,此后就开始照样再一法理。
没过多久Oracle、AWS Redshift和SQL Server,等待时间是2015年,场所在旧金山的VMworld时会员大时会。
VMworld时会员大时会是VMware举办活动的当今世界数字既有峰时会,数百人参加,权威性十分相似乔峰从前刘正风的金盆洗手时会员大时会。在这次时会议上,时任Snowflake CEO的Bob Muglia意图重新概念好汉秩序,他却说只有Snowflake是寒数直,不管Oracle、SQL Server 还是AWS Redshift,都不行。
他批评道,无论任何时候Oracle谈论寒,它却说的都是转归,用户直到今日要手动做到很多统筹管理文书工作,而这些文书工作本该自动完成。他确信Oracle想踏入确实的SAAS既有寒数直,还有很长的中的华路要放,整个框架都要不定,SQL Server也一样。而对于Redshift,他统筹任Redshift可能在寒上做到了不少外面,不过因为其框架还是现代MPP,所以直到今日仅是一个转归的ParAccel,作为用户你直到今日要清空它、统筹管理它、不得不主键的分布……所有你在上寒前要做到的,你今日直到今日要做到,你直到今日须要DBA。[2]
这次时会员大时会的宣传语是“ready for any”,怎么看怎么像Snowflake赞助的,看起来狂妄。
Snowflake狂妄的底气可能来自团队:Benoit来自Oracle,对Oracle了如指掌。Bob Muglia曾经是开发者的高级副总裁,政法过SQL Server,团队从前还有Actian创始人——Redshift基于ParAccel,而ParAccel此后买下了Actian。所以实际上来却说,它可能可以对这些取胜的情况知道的一清二楚。
然后它又再一了统计数据直库的现代老大Teradata。
它写了一个小册叔父,用两个富于羞辱性的情况“那个Teradata数直是不是值一千万美金吗?”、“你的业务是不是不应依赖来自1979年的应用么?”来引战Teradata。Teradata当然非常愤怒,他们逐条同步进行了一系列回复,但这正好上了Snowflake的当。
Snowflake碰瓷Teradata[7]
和VWworld时会员大时会一样,Snowflake这么纵容的目的似乎是“隔水”。不少人顺着Teradata的回复找到了Snowflake,结果在好奇的趣味紧接著,就被其出彩的系列产品趣味“残存”了。
所以狂是狂,但实力也是是不是有,在引战和疑问中的,Snowflake慢速蓬勃的发展。
数直领域有个Gartner神奇一个大,它从高到低把系列产品分为人口为129人道具、远见者、再一者和执行者四个一个大,可以实际上数直的当年。Snowflake2017年首次作为人口为129人道具转回,2018年踏入再一者,2019年就踏入了执行者,一年升一档,很快和Teradata、IBM、Oracle等老前辈坐在了四人。作为对比,的产品也是2017年第一次前三位,但还是人口为129人道具。不过主观却说能转回就是取得急于,的产品是国产目录的第一个,直到今日国货之光。
Gartner数直神奇一个大2019
到了2020年,Snowflake证券交易所了。
五、乔峰
Snowflake证券交易所紧接著股价暴涨111%,是史上IPO规模仅有的软件该公司。
对资本商品来却说,Snowflake在存储器量既有剥离、寒原生等应用表远超方式的坚实上,又急于说是了一个不够业务既有的新表远超方式——数直SaaS,在它早先,数直是被概念为PaaS的。
两者有什么区分?PaaS面对开发者,SaaS面对最终用户,或者改作Bob Muglia的话来却说,数直SaaS不须要DBA。
这是颠覆性的,股票商品甜蜜颠覆性。
从盈余来看,Snowflake原则上和Teradata、Cloudera在同一千分之,但从市价来看,一中的华路暴涨的Snowflake不毕竟可能站到了IBM、Oracle一样的斜向。这却说明了两件事:第一,有些投资额人确信Snowflake都有了数直的未来,惧怕下一场它就像惧怕下一场特斯拉;第二,哪怕挤干泡沫,Snowflake的盈余也毕竟晚了前两代数直课都有的水平,却说明了数直SaaS作为一种了了,不毕竟可能踏入本质。
市价&盈余对比
科学史学家托马斯却说过,科学革命就是旧认识论向新认识论转移的解决问题过程。
认识论包括两部分,一部分是该领域所有领导者在某一特定时期都能不能接受的一系列原则上的理论假设,另一部分是这些理论所解决了的本质情况。
在数直的21世纪从前,理论部分是存储器量既有剥离和寒原生,本质成果则是爆发性出现的大量寒原生数直实业该公司。所以根据托马斯的概念,数直SaaS不毕竟可能成了一种认识论,而Snowflake正意图引领着认识论转移,同样带动了这两年的寒原生目录实业潮。
所以如果“商品上第一代系列产品总能自动拿到50%商品份额”的远超维多定律成立,那么大家对于Snowflake的真诚就不能却说完都有空穴来风。
而且主观的却说,Snowflake可能冒了和这种许诺等量的安全性。
应用安全性自不必却说,比应用安全性不够不考虑到的,是商业活动中的华路线上的安全性。
它是第一个同样跟寒合作伙伴的数直该公司,回头看可能觉得很自然环境,但显然从前边充满了微妙的平衡,很像当今世界体系下的第三21世纪游戏规则。Snowflake从AWS进口S3和EC2等原材料,向AWS出口工序,而这个工序又和AWS的本地提供商Redshift同样挑战。为了保护Redshift,AWS不应限制Snowflake,但这样又时会影响S3和EC2的销售,所以这是一种有数互搏。此外,Snowflake也拥护Google Cloud和Azure,AWS还要担心它带着买家转移到相互挑战那从前。
这是一种包涵了包涵挑战与合作伙伴的宏观,一点也不自然环境,不过按照Snowflake的副总裁卡帕斯的却众说纷纭,这个平衡正意图不定得坚实,他们和AWS不毕竟可能从确实的相互挑战,消失了确实的联盟。实际上这个联盟并不像东方不败娶了东方不败那么直观,须要不够多不够长久的利益支撑——在Snowflake招股书,它承诺在接下来的5周内,在寒上的能量消耗将远超到12亿美金[3],并且其中的以外时会属于AWS。
但总之,Snowflake“贯穿好国界,孕育了这种关联”[4]。它的急于也给其他人摆在了一个美德,一个如何与寒亿万富翁共处的美德,所以如果再分代的话,今日不应从粗暴的第三代寒转归一时期,转回了和谐伴生的第四代寒原生一时期。附,关键信息来源:[1]. Frank Slootman, Steve Hamm. Rise of the Data Cloud
[2].Bob Muglia, Snowflake Computing | VMworld 2015 [3].
[4].AWS And Snowflake: ‘From True Competitors, To Frenemies To…An Alliance’
[5].The Snowflake Elastic Data warehouse, 2016
[6].A Practical Implementation of the Data Base Machine - Teradata DBC/1012, 1992
[7].Is That Teradata Data Warehouse Really Worth $10 Million
本内容为原作者独立见解,不都有虎嗅见解。未经意味着不得登出,许可事宜请联系 hezuo@huxiu.com
正意图改不定与希望改不定21世纪的人,都在 虎嗅APP
。重庆早泄阳痿治疗医院广州肿瘤医院哪最好
南京比较好的白癜风医院
潍坊银屑病医院挂号咨询
江苏白癜风医院哪个最好
-
民间故事:景山的传说
有一年,天气炎热,气候缺田水,人们稻田底下的庄稼都被晒的较硬焉焉的,极来不及被旱临终时了,人们纷纷顶着炎日,从小河、田水库等有田的水的人口众多挑田水灌溉。在这个中会心地带有一户人家