/ˈdeɪ.tə ˈpaɪp.laɪn/
数据管道,指一套自动化的流程或系统,用于将数据从一个来源提取、转换并传输到目标存储或应用中。它是数据工程和数据分析中的核心概念,确保数据能够高效、可靠地流动和处理。
We built a data pipeline to collect user behavior logs every hour.
我们搭建了一个数据管道,每小时收集一次用户行为日志。
The company's data pipeline integrates information from multiple sources, transforms it into a unified format, and loads it into the data warehouse for analysis.
该公司的数据管道从多个来源整合信息,将其转换为统一格式,然后加载到数据仓库中供分析使用。
data 源自拉丁语 datum,意为"被给予的东西",后来演变为"事实、信息"的意思。pipeline 由 pipe(管道)和 line(线路)组合而成,最初指输送石油或天然气的管道系统。20世纪后期,随着计算机科学的发展,pipeline 被引申为"按阶段依次处理的流程"。data pipeline 这一术语在大数据和数据工程领域兴起后被广泛使用,形象地将数据的流动比作液体在管道中的传输。