刷新
流批一体的四块拼图

博主头像 流批一体是数据领域的热门话题,随着实时数据处理需求的不断涌现和Flink等新兴流计算技术的持续发展,流批一体正从技术愿景向具体的、适配不同行业特点的解决方案过渡。 个人认为,流批一体解决方案的重点分为四个方面,数据集成、存储引擎、计算引擎、元数据管理。 数据集成 传统的批量数据集成方式是每日一次的批 ...

读数据工程之道:设计和构建健壮的数据系统04数据工程生命周期(下)

博主头像 1. 获取 1.1. 在了解数据源、所用源系统的特征以及数据的存储方式之后,你需要收集数据 1.2. 数据工程生命周期的下一阶段是从源系统中获取数据 1.2.1. 源系统和获取代表了数据工程生命周期中最重要的瓶颈 1.2.2. 源系统通常不在你的直接控制范围内,可能会随机变得无响应或提供质量差的数据 ...

Apache DolphinScheduler社区9月进展记录

博主头像 各位热爱 Apache DolphinScheduler 的小伙伴们,社区 9 月月报更新啦!这里将记录 Apache DolphinScheduler 社区每月的重要更新,欢迎关注! 月度 Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 做的精彩贡献( ...

Apache SeaTunnel 9月份社区发展记录

博主头像 各位热爱 SeaTunnel 的小伙伴们,9月份社区月报来啦!这里将定期更新SeaTunnel社区每个月的重大进展,欢迎关注! 月度Merge Stars 感谢以下小伙伴上个月为 Apache SeaTunnel 做的精彩贡献(排名不分先后): @ZhangWeike2000,@wuchunfu,@ ...

第二十八讲:如何判断一个数据库是不是出问题了?

今天,hr见到你简历上写过“搭建过mysql主从,有使用的经验” 突然兴致来了一句“你在搭建的时候,如何判断要主备库切换,说一下你的理解” 我重生了,回到了面试的前一分钟,上一世,我没能回答这个问题,这一世,我将。。。。(编不下去了) 哎,你可以说用select 1 判断,但他成功返回并不能说明主库... ...

MySQL之B+树分析

博主头像 概览 索引是一种数据结构,用于帮助我们在大量数据中快速定位到我们想要查找的数据。 索引好比一本好书的目录页,需要查询某个章节直接在目录页查找,然后打开响应页数。 但索引也不是就快,如果章节少,那就直接翻开书找即可很快找到,只有章节非常多时,我们就可以利用索引快速找到。 所以,如果想让索引发挥出其真正 ...

读数据工程之道:设计和构建健壮的数据系统03数据工程生命周期(上)

博主头像 1. 数据工程生命周期 1.1. 数据领域正在经历新数据技术和实践的爆炸式增长,抽象程度和易用性不断提高 1.2. 由于技术抽象程度的增加,数据工程师将越来越多地成为数据生命周期工程师,根据数据生命周期管理的原则来进行思考和操作 1.3. 数据工程生命周期包括将原始数据成分转化为有用的最终产品的阶段 ...

MySQL的基本语法(增,删,改,查)

MySQL的基本语法(增,删,改,查) MySQL中的(增)操作 创建数据库 CREATE DATABASE 库名; 例如: CREATE DATABASE db; 创建一个名为db的数据库。 创建列表 use 数据库名; CREATE TABLE 表名( 字段名1 数据类型1, 字段名2 数据类型 ...

SeaTunnel如何创建Socket数据同步作业?

博主头像 本文为Apache SeaTunnel Socket Connector的使用文档,旨在帮助用户快速理解和有效利用Socket Connector,助力用户的应用程序实现高效、稳定的网络通信。 Socket是应用层与TCP/IP协议族之间进行通信的中间软件抽象层,它是网络编程的基础,通过Socket ...

从SQL Server过渡到PostgreSQL:理解模式的差异

博主头像 从SQL Server过渡到PostgreSQL:理解模式的差异 前言 随着越来越多的企业转向开源技术,商业数据库管理员和开发者也逐渐面临向PostgreSQL迁移的需求。 虽然SQL Server和PostgreSQL共享许多数据库管理系统(RDBMS)的基本概念,但它们在处理某些结构上的差异可能 ...

读数据工程之道:设计和构建健壮的数据系统02数据工程师

博主头像 1. 背景和技能 1.1. 数据工程是一个快速发展的领域,关于如何成为一名数据工程师仍然存在很多问题 1.2. 进入数据工程领域的人在教育、职业和技能方面有着不同的背景 1.2.1. 每个进入该领域的人都应该投入大量的时间进行自学 1.3. 从一个邻近的领域转到数据工程是最容易的 1.3.1. 软件 ...

读数据工程之道:设计和构建健壮的数据系统01数据工程概述

博主头像 1. 数据工程 1.1. 自从公司开始使用数据做事,数据工程就以某种形式存在了 1.1.1. 预测性分析、描述性分析和报告 1.2. 数据工程师获取数据、存储数据,并准备数据供数据科学家、分析师和其他人使用 1.3. 数据工程是系统和流程的开发、实施和维护,这些系统和流程接收原始数据并生成支持下游用 ...

MySQL单表存多大的数据量比较合适

博主头像 前言 经常使用MySQL数据库的小伙伴都知道,当单表数据量达到一定的规模以后,查询性能就会显著降低。因此,当单表数据量过大时,我们往往要考虑进行分库分表。那么如何计算单表存储多大的数据量合适?当单表数据达到多大的规模时,我们才要进行分库分表呢? MySQL存储方式 首先我们要先了解一下MySQL存储 ...

搭建Redis“主-从-从”模式集群并使用 RedisTemplate 实现读写分离

博主头像 一、理论相关 我们知道,Redis具有高可靠性,其含义包括: 数据尽量少丢失 - AOF 和 RDB 服务尽量少中断 - 增加副本冗余量,将一份数据同时保存在多个实例上,即主从库模式 Redis主从库模式 - 保证数据副本的一致(读写分离): 读操作:主库、从库都可以接收 写操作:首先到主库执行,然 ...

读数据湖仓08数据架构的演化

博主头像 1. 数据目录 1.1. 需要将分析基础设施放置在数据目录(Data Catalogue)的结构中 1.1.1. 元数据 1.1.2. 数据模型 1.1.3. 本体 1.1.4. 分类标准 1.2. 数据目录类似于图书馆的图书检索目录 1.2.1. 先通过图书馆的图书检索目录进行查找,以便快速找到所 ...

读数据湖仓07描述性数据

博主头像 1. 描述性数据 1.1. 基础数据中包含不同类型的数据,而不同类型数据的描述性数据也存在显著的差异 1.2. 尽管这些描述性数据存在根本性的差异,但通过描述性数据,我们可以全面了解基础数据中的数据 1.3. 通过分析基础设施中提供的描述性数据可以获得更详细的数据 1.3.1. 分析基础设施是通往详 ...