• 数据分析:找合适的瓶,酿新的酒

    为什么有这些需求,是因为以前这些类型的数据都因为技术和成本的原因,用户没有收集处理。现在有了性价比合理的手段可以让你收集处理这些数据,怎么 可能说不要?还是以酿酒做比喻,以前酿两斤酒糟要浪费18斤的粮食,...
    文章 2017-04-03 1159浏览量
  • 海量存储系列十五

    那么,假定有五个节点,任意两个挂掉,哪怕挂掉的里面有主节点,这时候也只需要从新从余下的三个里面选出那个id号最大的节点作为主节点,数据就一定是最新的。当然,leader election是paxos协议的核心,对这块感兴趣...
    文章 2017-05-02 1236浏览量
  • 数据存储的进化史-从 RAID 到 Hdfs

    速度和容量的重要性毋庸置疑,如果容量不够大,或者读取的速度不够快,那么海量数据存储也就无从谈起了。而磁盘又是计算机中很容易损坏的零件,当磁盘损坏的时候怎么办?放任数据的丢失吗,那可不行,这就有了容错性...
    文章 2018-12-18 1033浏览量
  • 徐葳:生物医学影像处理、分布式系统与数据共享平台

    这种数据的共享只是共享了数据,但是并没有共享数据处理的算法,比如说我可以下载一个APP,让这个APP能够提供数据处理的功能。不论哪个学科,他可以根据需要将不同算法组织起来,通过调整参数的方法解决数据处理的...
    文章 2017-05-02 1102浏览量
  • 海量存储之十四

    最简单的问题,就是,如果这台机器的硬盘挂掉,那应该怎么办呢?于是,有些人就想到,那我们用多块硬盘来备份不就好了?于是,RAID技术就应运而生了。Raid技术的核心,就是利用磁盘阵列的手段,提升数据的写入效率和...
    文章 2017-05-02 1158浏览量
  • Redis 是什么?

    3.物理内存+虚拟内存不足,这个时候dump一直死着,时间久了机器挂掉。这个情况就是灾难!4.当Redis物理内存使用超过内存总容量的3/5时就会开始比较危险了,就开始做swap,内存碎片大 5.当达到最大内存时,会清空带有...
    文章 2016-03-11 2654浏览量
  • 五分钟学后端技术:一篇文章告诉你什么是云计算!

    数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。...
    文章 2020-04-02 2629浏览量
  • 干货|Apache Flink 入门技术分享 PPT(多图预警)1

    能够保证在整个分布式系统运行失败或者挂掉的情况下做到Exactly-once&xff0c;这是状态的另外一个价值。流式计算分为无状态和有状态两种情况。无状态的计算观察每个独立事件&xff0c;并根据最后一个事件输出结果。例如&...
    文章 2022-06-14 53浏览量
  • 【阿里飞天】阿里飞天平台总架构师唐洪:飞天开放平台

    第二个事情我想讲冗余恢复,当你丢失一个节点一块磁盘的时候,我们需要对丢失的数据进行恢复,用径向恢复比较低效,我们一个硬盘挂掉,会找另外一个新的点,我们点对点进行拷贝,控制一个流控,10个小时会复制1G的...
    文章 2016-09-11 14546浏览量
  • Go在百万亿级搜索引擎中的应用

    刚开始我们已经说过在readHDFS是是用JAVA写的,Goroutine太多,底层挂掉。两个Searcher到HDFS的时候,一个分词对应上百个Docid,可能对应着上百个文件,因为每一个Docid不一定在一个文件里面。在Searcher里面的时候...
    文章 2017-09-15 1720浏览量
  • Go在百万亿级搜索引擎中的应用

    刚开始我们已经说过在readHDFS是是用JAVA写的,Goroutine太多,底层挂掉。两个Searcher到HDFS的时候,一个分词对应上百个Docid,可能对应着上百个文件,因为每一个Docid不一定在一个文件里面。在Searcher里面的时候...
    文章 2017-11-02 1590浏览量
  • 缓存问题、数据一致性、redis配置文件汉化版)

    某一个时间段内,缓存大量失效或者缓存服务器挂掉(重启)时,导致大量请求直接去访问数据库,导致数据库崩溃。雪崩时,每一片雪花都在想着勇闯天涯!看,未来这就像下班高峰期一样,高速路、大马路、小马路通通堵上...
    文章 2022-06-30 16浏览量
  • 基于HBase和Spark构建企业级数据处理平台

    摘要:在中国HBase技术社区第十届Meetup杭州站上,阿里云数据库技术专家李伟为大家分享了如何基于当下流行的HBase和Spark体系构建企业级数据处理平台,并且针对于一些具体落地场景进行了介绍。演讲嘉宾简介:李伟...
    文章 2019-04-01 6826浏览量
  • 数据的起源和错失大数据市场的鼻祖Google

    Google之所有能够让这个广告系统有效,重要的就是对用户的数据做了分析,并且从分析以后的海量数据里面变成了真金白银。雪花花的银子摆在大家面前,所谓财帛动人心。因为有钱赚,别人才会在乎它家的技术。任何的技术...
    文章 2017-07-05 1803浏览量
  • 分布式系统,你真的了解吗?

    因为只有一个进程,所以所有的数据处理,其顺序都是固定的,不可能出现多线程中,两个函数的语句交错执行的情况,因此也不需要各种“锁”。从这个角度看,异步非阻塞的技术,是大大简化了开发的过程。由于只有一个...
    文章 2017-08-01 1171浏览量
  • 老司机的微服务架构实现,照亮你的人生|朱攀

    最坏的情况是配置中?的所有节点都挂掉,也不影响各个依赖它的服务现有节点的正常?作。因为每个服务都会缓存依赖的配置数据,所以对配置中?的性能要求不是太?,我们? AWSRDS 解决配置数据存储的?可?问题,AWS ...
    文章 2016-10-24 6465浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    一个可靠安全的系统,肯定要考虑数据的可靠性,尤其对于内存为主的 Redis,就要考虑一旦服务器挂掉,启动之后,如何恢复数据的问题,也就是说数据如何持久化的问题。AOF 就是备份操作记录。AOF 由于是备份操作命令,...
    文章 2020-12-30 285浏览量
  • 专访腾讯徐汉彬:架构、优化环环相扣,日请求8亿只是...

    实现流量控制的过载保护,防止第三方的接口因为过载而直接挂掉,进而导致接口全面超时和不可用。我们认为:虽然流量限制模式会主动拒绝一些用户请求,但与整个服务不可用相比仍然是相对比较好的一个体验。InfoQ:...
    文章 2017-11-27 774浏览量
  • 峰哥帮读者精准押题,211程序媛字节、阿里大数据面经...

    35min1、海量数据处理成结构化数据 技术难点2、mapreduce 的热点问题3、flume 介绍4、kafka 介绍5、flume&43;kafka 为什么是经典组合6、窗口函数 有哪些 有什么功能7、reduce 任务过长 shuffle过长 如何解决8、storm...
    文章 2022-02-11 23浏览量
  • 20 万网络节点背后的数据创新应用

    也就是说,我们对一个业务的支持,之前需要专业的开发大数据开发同学一周时间完成开发,现在减少到产品开发同学半小时完成业务监控的数据处理配置。这里有几个比较有特色的点:一个是消息队列,我们之前用Kafka,...
    文章 2018-08-02 1187浏览量
  • 基于JindoFS+OSS构建高效数据

    存储模式(Block)适用于高性能数据处理场景,元数据存储在 NamespaceService(支持高可用部署)上,性能和体验上对标 HDFS;StorageService 将一份数据块存储在 OSS 上,本地数据块可以随着节点资源可以进行快速的...
    文章 2020-09-14 24737浏览量
  • 车联网上云最佳实践(二)

    MaxCompute能够为我们提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效帮助我们公司降低成本,并保障数据安全。Dataworks则提供了一站式的数据同步,数据开发,数据...
    文章 2018-08-31 3812浏览量
  • Redis和编程语言的纠缠

    于是我们就可以搭配缓存来处理海量数据。于是现在我们是这样的: 上图只是简述了缓存的作用,当数据继续增大我们需要利用主从复制技术来达到读写分离 数据库层直接与缓存进行交互,如果缓存中有数据直接返回客户端,...
    文章 2018-11-11 1096浏览量
  • 企业级数据可视化应用有哪些机遇与挑战?

    对于这个问题,在我看来最主要是两方面的原因,第一方面是因为企业级数据的特征,在当下,我们的身边,IoT 设备,云上无时无刻不在高速的产生着海量数据,不仅是数字、文本还有各种各样的图片、音视频,这些数据内...
    文章 2020-11-04 2653浏览量
  • 如何正确使用缓存?

    4.1 数据不一致的原因 由于引入缓存,数据就会分散在两处不同数据源,当数据更新时,实时上很难做到数据一致,除非采用强一致性方案,这里不在进行讨论。在找出合适的解决方案前,需要分析下存在数据不一致的主要...
    文章 2019-11-25 2217浏览量
  • Redis真的那么好用吗?

    于是我们就可以搭配缓存来处理海量数据。于是现在我们是这样的: 上图只是简述了缓存的作用,当数据继续增大我们需要利用主从复制技术来达到读写分离 数据库层直接与缓存进行交互,如果缓存中有数据直接返回客户端,...
    文章 2018-10-30 2338浏览量
  • 多核心Linux内核路径优化的不二法门之-多核心平台TCP...

    用户态处理和内核态处理,这种纵向的竞争在单CPU上几乎不会发生,而用户态的xlock根本就是为了解决用户进程之间的竞争,内核通过一个 backlog在面对这种竞争时转移了数据处理职责,事实上在xlock上并不存在竞争,...
    文章 2017-11-12 822浏览量
  • 车联网上云最佳实践(三)

    可以使用阿里云提供的API/SDK接口或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。数据存储到阿里云OSS以后,推荐选择标准类型(Standard)的阿里云OSS服务作为移动应用、大型网站、图片分享或热点音视频的...
    文章 2018-08-23 3629浏览量
  • 创造了中国自己的数据库OceanBase

    陈萌萌对于“单机”的视角有一个形象的比喻:就像今天使用PC服务器,要担心如果突然某台PC服务器挂掉了、甚至机房本身遭遇地震、火灾等极端情况,如何保障数据访问的稳定性。由于是完全基于PC服务器架构,OceanBase...
    文章 2018-03-26 8090浏览量
  • (课程)基于HBase做Storm 实时计算指标存储

    大家可以想象一下,如果我计算一个五分钟的指标,到第三分钟挂掉了,此时累计值是 1000,接着拓扑重启了,五分钟还没完,剩下的两分钟它会接着累计,此时是 500。如果是覆盖写,就会得到不正确的结果,实际上整个...
    文章 2016-09-07 2653浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com