文本内容:
第章数据的导入与导出3⑴什么是(变化数据捕获)?CDC变化数据捕获(Change DataCapture,缩写CDC)是指识别和捕获对数据库中的数据所做的更改(包括数据或数据表的插入、更新、删除等),然后将这些更改按发生的顺序完整记录下来,并实时通过消息中间件传送到下游流程或系统的过程通过这种方式,CDC能够向数据仓库提供高效、低延迟的数据传输,以便信息被及时转换并交付给专供分析的应用程序⑵在工作中,我们常常面临着处理各种类型文件的场景,请列举几个经常处ETL理的文件类型TXT、CSV、Excel XML、JSON等⑶简述基于源数据的操作的优缺点CDC优点:数据抽取的性能高,ETL加载规则简单,速度快,不需要修改业务系统表结构,可以实现数据的递增加载缺点:要求业务表建立触发器,对业务系统有一定的影响,容易对源数据库构成威胁⑷简述基于日志的操作的优缺点CDC基于查询的CDC:优点是实现简单,是通过批处理实现的,需要依赖离线调度,不能保证数据强一致性和实时性⑸简述基于触发器的操作的优缺点CDC略。